Cos'è un data fabric?

Scopri in che modo i data fabric orchestrano i dati in modo intelligente in un ambiente distribuito, rendendoli visibili agli utenti che utilizzano i dati

Vista angolare dall'alto di un programmatore che lavora seduto alla scrivania

Cos'è un data fabric?

Un Data Fabric rappresenta un'architettura che facilita l'integrazione end-to-end di diverse pipeline di dati e di vari ambienti cloud mediante l'utilizzo di sistemi intelligenti e automatizzati. Nel corso dell'ultimo decennio, gli sviluppi in ambito di cloud ibrido, intelligenza artificiale, Internet of Things (IoT) ed edge computing hanno comportato una crescita esponenziale dei big data, creando per le aziende una complessità ancora maggiore da gestire. Ciò ha reso l'unificazione e la governance degli ambienti di dati una priorità crescente poiché tale aumento ha creato notevoli sfide, come i silos di dati, i rischi di sicurezza e dei colli di bottiglia generali per il processo decisionale. I team di gestione dei dati affrontano queste sfide senza alcuna esitazione grazie alle soluzioni di data fabric. I team utilizzano efficacemente le soluzioni per unificare i loro sistemi di dati eterogenei e per integrare la governance, consolidare le misure di sicurezza e privacy e fornire ai dipendenti una maggiore accessibilità ai dati, in particolare agli utenti aziendali.

Questo impegno nell'eseguire l'integrazione dei dati tramite i data fabric consente un processo decisionale più olistico e incentrato sui dati. Da sempre, un'azienda può avvalersi di diverse piattaforme di dati allineate a specifiche linee di business. Ad esempio, si può disporre di una piattaforma di dati per le risorse umane, una piattaforma di dati per la supply chain e una piattaforma di dati per i clienti che ospitano i dati in ambienti differenti e separati nonostante le potenziali sovrapposizioni. Tuttavia, un data fabric può consentire ai responsabili del processo decisionale di visualizzare questi dati in un modo più coeso per comprendere meglio il ciclo di vita dei clienti, creando connessioni tra i dati che prima non esistevano. Colmando queste lacune per quanto riguarda la comprensione di clienti, prodotti e processi, i data fabric stanno accelerando le iniziative di automazione e trasformazione digitale nelle aziende.

Confronto tra data fabric e virtualizzazione dei dati

La virtualizzazione dei dati è una delle tecnologie che consente un approccio ai data fabric. Piuttosto che spostare fisicamente i dati da diverse origini on-premise e cloud mediante l'utilizzo di processi ETL (extract, transform, load) standard, lo strumento di virtualizzazione dei dati si connette alle diverse origini, integrando solo i metadati richiesti e creando un livello di dati virtuale. Ciò consente agli utenti di utilizzare efficacemente l'origine dati in tempo reale.


Architettura data fabric

Utilizzando efficacemente i servizi di dati e le API, i data fabric raccolgono i dati da sistemi legacy, data lake, data warehouse, database sql e app, fornendo una visione olistica delle prestazioni aziendali. A differenza di questi singoli sistemi di storage di dati, punta a creare una maggiore fluidità tra gli ambienti di dati provando a contrastare il problema della complessità dei dati, ovvero il concetto che risulti più difficoltoso spostare i dati man mano che aumentano le dimensioni. Un data fabric elimina le complessità tecnologiche interessate dalle operazioni di spostamento, trasformazione e integrazione dei dati, rendendo tutti i dati disponibili per tutta l'azienda.

Le architetture data fabric ruotano intorno all'idea di associare liberamente i dati nelle piattaforme con le applicazioni che ne hanno bisogno. Un esempio di architettura data fabric in un ambiente multicloud può essere simile a quello presentato di seguito, in cui un cloud come AWS gestisce l'inserimento dei dati mentre un'altra piattaforma come Azure supervisiona la trasformazione e l'utilizzo dei dati. Pertanto, potresti aver bisogno di un terzo vendor, come IBM® Cloud Pak for Data, che fornisce servizi analitici. L'architettura data fabric raggruppa questi ambienti per creare una vista unificata dei dati.

Ciò nonostante, questo è solo un esempio. Non esiste una singola architettura di dati per un data fabric poiché aziende diverse hanno esigenze diverse. Il diverso numero di provider cloud e di implementazioni dell'infrastruttura dati garantisce una variazione tra le diverse aziende. Tuttavia, le aziende che utilizzano questo tipo di framework di dati presentano degli elementi in comune nelle loro architetture che sono peculiari di un data fabric. In particolare, si avvalgono di sei componenti fondamentali, che Forrester (link esterno a ibm.com) descrive nel report "Enterprise Data Fabric Enables DataOps". Questi sei livelli includono:

  1. Livello di gestione dei dati: questo livello è responsabile della governance dei dati e della sicurezza dei dati.
  2. Livello di inserimento dei dati: in questo livello si iniziano a raccogliere i dati del cloud, individuando le connessioni tra i dati strutturati e i dati non strutturati.
  3. Elaborazione dei dati: il livello di elaborazione dei dati ottimizza i dati per garantire che siano visibili solo i dati pertinenti per l'estrazione dei dati.
  4. Orchestrazione dei dati: questo livello critico svolge alcune dei lavori più importanti per il data fabric, tra cui la trasformazione, l'integrazione e la pulizia dei dati, mettendoli a disposizione dei team di tutta l'azienda.
  5. Rilevamento dei dati: questo livello offre nuove opportunità per integrare le origini dati eterogenee. Ad esempio, questo livello può individuare soluzioni per collegare i dati in un data mart della supply chain di un sistema di dati per la gestione delle relazioni con i clienti (CRM, Customer Relationship Management), fornendo nuove opportunità di prodotti da offrire ai clienti o soluzioni per aumentare il loro livello di soddisfazione.
  6. Accesso ai dati: questo livello consente l'utilizzo dei dati e garantisce le giuste autorizzazioni a determinati team in modo da soddisfare le normative governative. Inoltre, questo livello aiuta a far emergere i dati pertinenti tramite l'utilizzo di dashboard e altri strumenti di visualizzazione dei dati. 

Vantaggi delle architetture data fabric

Poiché le aziende più importanti presenti sul mercato scelgono i provider di data fabric, Gartner (link esterno a ibm.com) ha osservato miglioramenti specifici in termini di efficienza, sostenendo che è possibile ridurre il "tempo per la progettazione dell'integrazione del 30%, l'implementazione del 30% e la manutenzione del 70%." Sebbene sia chiaro che i data fabric possono migliorare la produttività complessiva, i seguenti vantaggi hanno anche dimostrato un valore aziendale per coloro che li hanno scelti:

  • Integrazione intelligente: I data fabric utilizzano i grafi di conoscenza (knowledge graph) semantici, la gestione dei metadati e il machine learning per unificare i dati tra vari tipi di dati ed endpoint. Ciò aiuta i team di gestione dei dati a raggruppare dataset correlati e a integrare nuove origini dati nette nell'ecosistema di dati di un'azienda. Questa funzionalità non solo automatizza gli aspetti della gestione del carico di lavoro dei dati, con il conseguente miglioramento in termini di efficienza sopraindicato, ma aiuta anche a eliminare i silos nei sistemi di dati, centralizzare le pratiche di governance dei dati e migliorare la qualità complessiva dei dati.
  • Democratizzazione dei dati: Le architetture data fabric semplificano le applicazioni self-service ampliando l'accesso ai dati oltre le risorse più tecniche, come gli ingegneri dei dati, gli sviluppatori e i team di analytics dei dati. La riduzione dei colli di bottiglia dei dati favorisce quindi una maggiore produttività, consentendo agli utenti aziendali di prendere decisioni di business più rapide e agli utenti tecnici di assegnare le priorità alle attività che sfruttano al meglio le loro competenze.
  • Migliore protezione dei dati: L'ampliamento dell'accesso ai dati non vuol dire compromettere anche le misure di privacy e sicurezza dei dati. In realtà, ciò significa che vengono introdotte ulteriori misure di sicurezza della governance dei dati sui controlli di accesso garantendo che i dati specifici siano disponibili solo per determinati ruoli. Inoltre, le architetture data fabric consentono ai team tecnici e di sicurezza di implementare il mascheramento e la crittografia dei dati su dati sensibili e proprietari, riducendo i rischi legati alla condivisione dei dati e alle violazioni del sistema. 

Casi d'utilizzo dei data fabric

In termini di adozione, i data fabric sono ancora agli albori, ma le relative funzionalità di integrazione dei dati aiutano le aziende nell'attività di rilevamento dei dati, consentendo loro di affrontare un'ampia serie di casi d'utilizzo. Se da un lato i casi d'utilizzo che un data fabric può gestire potrebbero non essere estremamente diversi rispetto ad altri prodotti di dati, dall'altro si differenzia per l'ambito e le proporzioni che è in grado di gestire, in quanto elimina i silos di dati. Eseguendo l'integrazione su diverse origini dati, le aziende insieme ai loro data scientist possono creare una visione olistica dei propri clienti, un aspetto che si è rivelato particolarmente utile con i clienti del settore bancario. I data fabric sono stati utilizzati in modo più specifico per:

  • Profili dei clienti,
  • Rilevamento delle frodi,
  • Analisi della manutenzione preventiva,
  • Modelli di rischio per il ritorno al lavoro e molto altro.

Soluzioni correlate

IBM Cloud Pak for Data

IBM Cloud Pak for Data è una piattaforma dati aperta ed estensibile che fornisce un data fabric per mettere a disposizione tutti i dati per l'AI e l'analisi, su qualsiasi cloud.


IBM Watson® Studio

Crea, esegui e gestisci modelli di AI. Prepara i dati e crea modelli su qualsiasi cloud utilizzando codice open source o modellazione visiva. Prevedi e ottimizza i tuoi risultati.


IBM® Db2® on Cloud

Scopri Db2 on Cloud, un database cloud SQL completamente gestito, configurato e ottimizzato per offrire prestazioni elevate.



Risorse


Fasi successive

Data fabric e IBM Cloud Pak for Data

IBM Cloud Pak® for Data utilizza in modo efficace i microservizi e le relative funzioni di dati e AI ai vertici del settore per consentire un'integrazione intelligente dei dati nei sistemi distribuiti, fornendo alle aziende una visione olistica delle prestazioni aziendali. Ciò facilita una raccolta, un'organizzazione e un'analisi più rapide dei dati aziendali e consente alle aziende di prendere decisioni su vasta scala. Inoltre, i team di gestione dei dati possono contare sul fatto che i loro dati siano al sicuro grazie ai competitivi framework di sicurezza di IBM, garantendo il rispetto delle politiche normative e riducendo qualsiasi rischio di conformità.