In quanto leader nel settore dei dati, sai che il valore di questi ultimi è legato alla necessità di fornire i dati giusti al momento giusto, indipendentemente da dove risiedono. Questa capacità dipende dalla presenza di un'architettura dei dati moderna come parte della tua strategia sui dati.
Un'architettura dei dati fatta su misura traduce le esigenze aziendali in requisiti di dati e sistemi e gestisce la protezione e il flusso dei dati attraverso un'organizzazione. Tieni presente che non si tratta di una formula unica per tutti. Il framework deve essere guidato dai requisiti aziendali e supportare gli obiettivi a breve e lungo termine. "Sono finiti i tempi di un'unica architettura strutturata di dati a riposo", afferma Paul Christensen, data elite architect, IBM Expert Labs. "Le aziende di oggi sono guidate da dati in movimento e a riposo, dati in molte forme e con diversi gradi di qualità e fiducia."
Con i dati distribuiti più che mai sia on-premise che nel cloud, le soluzioni di architettura dei dati sono essenziali per soddisfare le esigenze specializzate del business, applicare l'analytics dei dati e utilizzare i dati e l'AI su larga scala. Per la maggior parte delle organizzazioni attuali, un'architettura dei dati moderna non è solo un'opzione, ma una necessità urgente.
Come si fa a trovare e determinare queste esigenze specialistiche per selezionare la giusta tecnologia? Una topologia dei dati aiuta a classificare e gestire gli scenari del mondo reale per costruire un'architettura dei dati moderna che tenga conto degli utenti, dell'uso, dei vincoli e del flusso dei dati e che sia altamente resiliente alle esigenze future.
Scopri watsonx
Iscriviti per ricevere gli aggiornamenti sull'IA
L'ascesa della modernizzazione del cloud non ridurrà necessariamente la complessità o i costi né eliminerà i silos di dati o gestirà la governance e la conformità. Uno studio al riguardo, infatti, mostra che il 68% dei dati rimane inutilizzato.¹
Ed ecco data fabric, un approccio architettonico per semplificare l'accesso ai dati e facilitare il consumo di dati self-service per migliorare il processo decisionale. Un data fabric include i controlli appropriati per supportare i flussi di dati, i processi e i consumatori di tali dati all'interno di un'organizzazione. Questa moderna architettura dei dati facilita l'integrazione end-to-end di varie pipeline di dati e ambienti cloud grazie a funzionalità intelligenti e automatizzate.
La base di un data fabric è costituita da metadati attivi federati, spesso definiti come i dati che descrivono i dati. Inoltre, anche i database o le fonti e i target di dati sono componenti chiave. Queste fonti devono essere selezionate in base alle loro capacità di supportare qualsiasi workload richiesto, sia esso transazionale, operativo o ibrido tra elaborazione transazionale e analitica, e che coinvolga l'AI, la business intelligence, il reporting o l'analytics avanzata.
"I clienti possono avere fino a nove tipi di database diversi e molte istanze di ciascuno di essi. Un data fabric mette ordine nei silos di dati e nella frammentazione dei dati che i clienti cercano di gestire", afferma Edward Calvesbert, product leader del portafoglio di database di IBM.
Attraverso un livello di virtualizzazione, un data fabric raccoglie dati in tempo reale da più fonti, tra cui sistemi esistenti, database, data lake, data warehouse, repository edge e in-memory. Queste fonti possono eseguire workload operazionali, transazionali o analitici e memorizzare tipi di dati strutturati e non strutturati. Tale orchestrazione fornisce una portata centralizzata su tutti i punti del panorama di dati.
Grazie a queste funzionalità end-to-end, un data fabric aiuta a garantire che i dati provenienti da varie fonti possano essere combinati, accessibili e governati con successo, in modo che gli utenti business, i data scientist, i data engineer e gli analisti dei dati possano metterli al lavoro. Consente, inoltre, di innovare su larga scala in aree quali l'AI, fornendo set di dati governati per alimentare le applicazioni AI.
Fin qui, abbiamo parlato del data fabric. Ma che dire del data mesh, un altro approccio che ottimizza l'uso dei dati a livello aziendale in un'architettura data-driven?
Sia il data fabric che il data mesh sono concetti legati all'architettura dei dati. Ognuno di essi segue una progettazione orientata al caso d'uso e cerca di risolvere le sfide della dispersione dei dati, della governance dei dati e della disponibilità dei dati. Gli approcci di data fabric e data mesh si basano entrambi sulla data discovery e su cataloghi di conoscenza dei dati self-service. La buona notizia è che questi concetti di architettura dei dati sono complementari.
Le differenze? Le architetture di data mesh sono specifiche per il dominio e indipendenti dalla tecnologia, progettate per i casi d'uso analitici. Le architetture di data fabric, invece, sono progettate per casi d'uso sia operativi che analitici. Mentre il data fabric fornisce una visione unificata di tutti gli asset di dati, l'archiviazione effettiva dei dati può essere decentralizzata, centralizzata o una combinazione di entrambe le cose. Allo stesso modo, le architetture di data fabric supportano diverse strutture organizzative, da quelle federate a quelle distribuite. Infine, le architetture di data fabric utilizzano l'intelligenza artificiale e le tecnologie di machine learning per automatizzare la data discovery, la classificazione dei dati e l'applicazione delle policy.
Ora che hai visto il potenziale di un'architettura data fabric, esplora questi casi d'uso per restringere l'area di interesse migliore e soddisfare, così, gli obiettivi della tua organizzazione.
1 Rethink Data: Put More of Your Business Data to Work – From Edge to Cloud (PDF, il link risiede al di fuori di ibm.com), Seagate Technology, luglio 2020.
2 "Data Integrity Trends: Chief Data Officer Perspectives in 2021 (il link risiede al di fuori di ibm.com). Corinium, 18 giugno 2021.