L'ascesa della modernizzazione del cloud non ridurrà necessariamente la complessità o i costi né eliminerà i silos di dati o gestirà la governance e la conformità. Uno studio al riguardo, infatti, mostra che il 68% dei dati rimane inutilizzato.¹
Ed ecco data fabric, un approccio architettonico per semplificare l'accesso ai dati e facilitare il consumo di dati self-service per migliorare il processo decisionale. Un data fabric include i controlli appropriati per supportare i flussi di dati, i processi e i consumatori di tali dati all'interno di un'organizzazione. Questa moderna architettura dei dati facilita l'integrazione end-to-end di varie pipeline di dati e ambienti cloud grazie a funzionalità intelligenti e automatizzate.
La base di un data fabric è costituita da metadati attivi federati, spesso definiti come i dati che descrivono i dati. Inoltre, anche i database o le fonti e i target di dati sono componenti chiave. Queste fonti devono essere selezionate in base alle loro capacità di supportare qualsiasi workload richiesto, sia esso transazionale, operativo o ibrido tra elaborazione transazionale e analitica, e che coinvolga l'AI, la business intelligence, il reporting o l'analytics avanzata.
"I clienti possono avere fino a nove tipi di database diversi e molte istanze di ciascuno di essi. Un data fabric mette ordine nei silos di dati e nella frammentazione dei dati che i clienti cercano di gestire", afferma Edward Calvesbert, product leader del portafoglio di database di IBM.
Attraverso un livello di virtualizzazione, un data fabric raccoglie dati in tempo reale da più fonti, tra cui sistemi esistenti, database, data lake, data warehouse, repository edge e in-memory. Queste fonti possono eseguire workload operazionali, transazionali o analitici e memorizzare tipi di dati strutturati e non strutturati. Tale orchestrazione fornisce una portata centralizzata su tutti i punti del panorama di dati.
Grazie a queste funzionalità end-to-end, un data fabric aiuta a garantire che i dati provenienti da varie fonti possano essere combinati, accessibili e governati con successo, in modo che gli utenti business, i data scientist, i data engineer e gli analisti dei dati possano metterli al lavoro. Consente, inoltre, di innovare su larga scala in aree quali l'AI, fornendo set di dati governati per alimentare le applicazioni AI.