Un data fabric è una moderna architettura di dati progettata per democratizzare l'accesso ai dati in un'organizzazione. Utilizza sistemi intelligenti e automatizzati per abbattere silos, gestire asset e ottimizzare la gestione dei dati su larga scala.
Negli ultimi dieci anni, i progressi in hybrid cloud, intelligenza artificiale, Internet of Things (IoT) ed edge computing hanno determinato la crescita esponenziale dei big data. Questa impennata ha creato ambienti di dati sempre più complessi, con enormi volumi di dati sparsi in unità di business eterogeneo.
Secondo uno studio del 2025 dell'IBM® Institute for Business Value (IBV), il 50% dei CEO sostiene che la tecnologia della propria organizzazione è disconnessa a causa del ritmo frenetico dei recenti investimenti. Di conseguenza, l'unificazione e la governance dei dati sono diventate fondamentali per superare sfide come i silo di dati, i rischi per la sicurezza e i colli di bottiglia nei processi decisionali.
Un data fabric offre una gestione dei dati integrata ed end-to-end supportata da apprendimento automatico (ML), metadati attivi, interfacce di programmazione delle applicazioni (API) e altre tecnologie.
Non si tratta di un software, quanto piuttosto di un approccio progettuale che crea una visione unificata dei dati negli ambienti on-premise e multicloud di un'organizzazione, da data lake, data warehouse a SQL Database e altre fonti. Con questo approccio, le organizzazioni non devono più spostare i dati distribuiti in un'unica sede o in un unico storage dei dati, né devono adottare un approccio completamente decentralizzato.
Queste funzionalità non solo risolvono i silo e i crescenti volumi di dati, ma consentono anche un accesso self-service ai dati per gli utenti business. Il risultato è una rete di dati in tempo reale e dati storici di alta qualità che accelera le iniziative di trasformazione digitale e di business intelligence (BI) in tutte le aziende, mentre la governance automatizzata offre una strategia dei dati sicura e conforme.
Per molte organizzazioni, la crescita esponenziale dei dati (strutturati, semi-strutturati e non strutturati) ha superato gli approcci tradizionali di gestione dei dati. Questa sfida è aggravata dalla proliferazione dei data warehouse, data lake e hybrid cloud
Questi storage sono in genere utilizzati come soluzioni a basso costo per grandi quantità di dati. Tuttavia, spesso mancano di un'adeguata gestione dei metadati, il che rende i dati difficili da individuare, interpretare e utilizzare in modo efficace.
A questa complessità si aggiungono i dati in silo. In passato, un'azienda poteva avere piattaforme di dati separate per le risorse umane, la supply chain e le informazioni sui clienti, ognuna operante in modo isolato nonostante la sovrapposizione di tipi di dati ed esigenze.
Queste sfide hanno portato a enormi accumuli di dark data, cioè informazioni che vengono trascurate, considerate inaffidabili e, alla fine, non utilizzate. Si stima infatti che il 60% dei dati aziendali non venga analizzato.1
Le aziende utilizzano i data fabric per affrontare queste sfide. L'architettura moderna unifica i dati, automatizza la governance e consente l'accesso self-service ai dati su larga scala. Collegando i dati tra sistemi eterogenei, i data fabric consentono ai decisori di stabilire connessioni precedentemente nascoste e di ricavare risultati aziendali più preziosi da dati che, altrimenti, rimarrebbero inutilizzati.
Oltre ai vantaggi in termini di democratizzazione e processo decisionale, le soluzioni di data fabric si stanno rivelando fondamentali anche per i workflow di AI aziendali. Secondo gli studi del 2024 dell'IBM IBV, il 67% dei CFO afferma che i propri vertici aziendali dispongano dei dati necessari per capitalizzare rapidamente le nuove tecnologie. Tuttavia, solo il 29% dei leader tecnologici concorda sul fatto che i propri dati hanno la qualità, l'accessibilità e la sicurezza necessarie per scalare l'AI generativa in modo efficiente.
Con un data fabric, le organizzazioni possono costruire più facilmente un'infrastruttura di dati affidabili per la consegna dei dati ai loro sistemi di AI, con requisiti di governance e privacy applicati automaticamente.
Newsletter di settore
Resta al passo con le tendenze più importanti e interessanti del settore relative ad AI, automazione, dati e oltre con la newsletter Think. Leggi l' Informativa sulla privacy IBM.
L'abbonamento sarà fornito in lingua inglese. Troverai un link per annullare l'iscrizione in tutte le newsletter. Puoi gestire i tuoi abbonamenti o annullarli qui. Per ulteriori informazioni, consulta l'Informativa sulla privacy IBM.
Le architetture di data fabric utilizzano i cataloghi di dati, cioè librerie dettagliate di asset di dati. Questi cataloghi utilizzano metadati attivi (che usano grafici di conoscenza, semantica e AI) per organizzare le risorse di dati in tempo reale in modo che gli utenti possano trovare in modo rapido e semplice i dati giusti per i loro casi d'uso. Questi metadati forniscono anche una comprensione aziendale comune dei diversi dati attraverso tassonomie, informazioni sulla proprietà e sulle attività, asset correlati e altro ancora.
In un data fabric, il processo di integrazione dei dati unifica i dati provenienti da diverse fonti, li trasforma in una struttura coerente e li rende accessibili per l'analytics e il processo decisionale. Questa connessione avviene attraverso vari stili di integrazione, come l'elaborazione in batch, l'integrazione dei dati in tempo reale e change data capture (CDC). I processi di integrazione intelligenti massimizzano le prestazioni riducendo al minimo i costi di storage.
Un data fabric offre un modo unificato per creare e applicare la governance dei dati e le politiche di sicurezza dei dati su scala. Per esempio, i controlli di accesso possono essere collegati in modo facile e automatico ai dati sensibili attraverso i metadati, come i gruppi di utenti o le classificazioni. Grazie a questi dati affidabili e protetti, pronti per il business, i data fabric possono aiutare le organizzazioni a rendere operativa l'AI.
Un data fabric agisce come un marketplace self-service per il consumo di dati. Grazie alle principali funzionalità di governance, come la profilazione dei dati e la gestione dei metadati,consente ai data engineer, ai data scientist e agli utenti business di scoprire, accedere e collaborare rapidamente su dati di alta qualità. Gli utenti possono cercare gli asset di dati, etichettarli e annotarli, e aggiungere commenti. Di conseguenza, la dipendenza dal reparto IT si riduce notevolmente.
I data fabric includono anche la gestione end-to-end dell'intero ciclo di vita del data fabric stesso. Sfruttando le operazioni di machine learning (MLOps) e l'AI, questo approccio offre un'esperienza unificata per la composizione, la creazione, il test, l'implementazione, l'ottimizzazione e il monitoraggio dei vari componenti di un'architettura di data fabric, come le pipeline di dati.
Un data mesh è un'architettura di dati decentralizzata che organizza i dati in base a un dominio aziendale specifico (ad esempio, marketing, vendite o servizio clienti) per dare maggiore controllo ai produttori di un determinato set di dati.
I data fabric coesistono con i data mesh e spesso ne migliorano le funzionalità. Possono automatizzare i componenti chiave di una rete di dati, per esempio creando prodotti di dati e applicando la governance globale.
I data lakehouse sono emersi per risolvere i difetti delle tradizionali piattaforme di gestione dei dati. Combinano le capacità flessibili di data storage dei data lake con l'analisi ad alte prestazioni dei data warehouse.
I data fabric possono essere considerati la fase successiva dell'evoluzione dei data lakehouse e di altre piattaforme di dati. Le organizzazioni li utilizzano per semplificare la gestione dei dati e migliorare l'accesso ai dati dei lakehouse. Aiutano a promuovere la condivisione dei dati, ad automatizzare l'integrazione e la governance dei dati e supportano il consumo di dati self-service, funzionalità che gli storage da soli non possono fornire.
A differenza dei sistemi di data storage singoli, i data fabric possono creare fluidità tra gli ambienti di dati, contrastando il problema della data gravity, cioè l'idea che i dati diventino più difficili da spostare con l'aumento dei volumi in arrivo. Un data fabric elimina le complessità tecnologiche necessarie per lo spostamento, la trasformazione e l'integrazione, rendendo tutti i dati disponibili in tutta l'azienda.
Ma in che modo un data fabric può raggiungere questo obiettivo?
I data fabric utilizzano una serie di servizi dati. Per capire come funziona, è utile esplorare tre componenti fondamentali: virtualizzazione dei dati, metadati attivi federati e machine learning.
La virtualizzazione dei dati rende i dati accessibili senza spostarli fisicamente. Invece di utilizzare i tradizionali processi ETL (estrazione, trasformazione, caricamento), uno strumento di virtualizzazione dei dati si connette direttamente a diverse fonti, integrando solo i metadati richiesti. Quindi crea un livello di dati virtuale che consente agli utenti di cercare e accedere ai dati in tempo reale, come se si trovassero in un repository centralizzato.
I metadati attivi federati rendono i dati più individuabili e utilizzabili. A differenza dei metadati passivi, che sono statici e manualmente curati, quelli attivi federati utilizzano grafici di conoscenza semantici e tecnologie di AI/ML per analizzare continuamente i metadati, rilevare modelli e unificare i dati su diversi sistemi e formati.
Questi sistemi possono etichettare, profilare e classificare automaticamente i dati e attivare avvisi o azioni in base alle modifiche dei metadati, rendendo gli ecosistemi di dati più resilienti e autogestiti.
Il machine learning automatizza i processi critici all'interno di un data fabric, rendendolo un'architettura di dati avanzata e intelligente. L'apprendimento automatico (ML) può essere utilizzato per applicare automaticamente le politiche di governance, generare insight in tempo reale, rilevare vulnerabilità di sicurezza, tracciare data lineage, correggere problemi di qualità dei dati e altro ancora.
Sebbene le architetture del data fabric varino in base alle esigenze aziendali, hanno alcune caratteristiche comuni. Secondo il report Enterprise Data Fabric Enables DataOps di Forrester, un data fabric è in genere costituito da sei componenti fondamentali:2
Oltre a migliorare la gestione dei dati, i data fabric offrono anche i seguenti benefici aziendali:
L'automazione della governance dei dati, l'integrazione e altri servizi di dati su più piattaforme semplificano la gestione dei dati e l'analisi. Riducendo i colli di bottiglia, le aziende possono aumentare la produttività, consentendo agli utenti business di prendere decisioni più rapide e alleggerendo i workload dei team tecnici.
Inoltre, le funzionalità di integrazione intelligenti possono aiutare a ottimizzare le prestazioni riducendo al minimo lo storage e i costi.
Le architetture di data fabric facilitano le app self-service, ampliando l'accesso ai dati oltre ai team tecnici. Offrono agli utenti una visione unificata dei dati organizzativi, creando connessioni ovunque i dati risiedano e indipendentemente da quanto fossero isolati in precedenza.
I dati accessibili e visibili semplificano notevolmente la catalogazione dei dati e l'applicazione della governance. L'ampliamento dell'accesso ai dati spesso si traduce anche in maggiori barriere di governance e approcci alla sicurezza, come il mascheramento dei dati e la crittografia dei dati sensibili.
Le architetture di data fabric sono modulari e costruite per scalare. Possono scalare sia orizzontalmente (per adattarsi a volumi di dati in continua crescita) che verticalmente (per migliorare i processi e le prestazioni).
Crea e gestisci pipeline di dati intelligenti in streaming attraverso un'interfaccia grafica intuitiva, che facilita la perfetta integrazione dei dati in ambienti ibridi e multicloud.
Progetta un'architettura dei dati in grado di accelerarne la preparazione per l'AI generativa e sblocca una produttività senza precedenti per i team di dati.
Sblocca il valore dei dati aziendali con IBM Consulting e crea un'organizzazione basata su insight in grado di generare vantaggi aziendali.
1 “The State of Dark Data,” Splunk, 2019
2 “The Forrester Wave™: Enterprise Data Fabric, Q2 2022: The 15 Providers That Matter Most and How They Stack Up,” Forrester, 2020.