Cos'è la frammentazione dei dati?

Cos'è la frammentazione dei dati

La frammentazione dei dati si verifica quando i dati sono dispersi tra sistemi, applicazioni, cloud, database e documenti diversi.

I dati frammentati sono difficili da accedere, governare e utilizzare e rappresentano una delle tre principali sfide legate ai dati per i vertici aziendali.1 Portano alla creazione di “isole di dati”, metriche incoerenti, più versioni della verità e una dipendenza dai processi manuali di gestione dei dati. Queste sfide si estendono anche alla business planning e al processo decisionale, ostacolando l'efficienza operativa, la produttività e i progetti di innovazione.

La Retrieval-augmented generation (RAG) di livello enterprise, in particolare, richiede grandi set di dati di informazioni proprietarie per fornire risposte contestuali. Tuttavia, quando i team di dati devono gestire dati provenienti da posizioni e repository diversi, queste iniziative perdono rapidamente slancio.

Per molte organizzazioni, evitare la frammentazione dei dati non è facile. Il volume di dati gestiti dalle imprese sta esplodendo, e gran parte di essi è costituito da dati non strutturati. Una ricerca del 2025 ha rilevato che solo il 26% dei Chief Data Officer è sicuro che la propria organizzazione possa utilizzare dati non strutturati in modo da offrire un valore aziendale.2

La costante aggiunta di nuovi strumenti software as a service (SaaS), piattaforme cloud e applicazioni aziendali ai sistemi legacy esistenti aumenta ulteriormente la complessità di un ambiente già di per sé complesso (un fenomeno comunemente definito proliferazione SaaS).

Per ottenere dati unificati, le organizzazioni possono utilizzare diverse strategie, tra cui integrazione dei dati, consolidamento, governance dei dati e architetture di data fabric . Tuttavia, per combattere la frammentazione dei dati è necessario anche un cambiamento di mentalità: adattare la cultura e i modi di lavorare per considerare i dati come asset strategici.

Esistono due tipi di frammentazione dei dati. Questa pagina si concentra sulla proliferazione incontrollata dei dati di un'organizzazione tra sistemi e ambienti. Tuttavia, il termine può anche descrivere un sistema di gestione del database (DBMS) mirato e una strategia di ottimizzazione delle prestazioni del file system.

Quali sono i segnali della frammentazione dei dati?

In uno scenario ideale, l'azienda è ad alta velocità. È efficiente e prende decisioni basate sui dati sulla base di flussi di dati in tempo reale, il tutto assistito da strumenti di intelligenza artificiale (AI) velocissimi. Tuttavia, per molte organizzazioni la realtà è ben diversa: più lenta, più costosa e molto più manuale a causa della frammentazione del loro ecosistema di dati.

Ecco alcuni esempi chiave di frammentazione dei dati in un contesto aziendale:

  • Nessuna singola fonte affidabile
  • Notevole quantità di lavoro manuale
  • Processo decisionale lento o stagnante
  • Aumento dei costi dell'IT
  • Lacune in materia di sicurezza e governance

Nessuna singola fonte affidabile

Quando i dati sono frammentati, è difficile mantenere una visione affidabile e unificata a cui diversi dipartimenti e sistemi possano fare riferimento in modo costante, la cosiddetta singola fonte affidabile (SSOT).

Senza una SSOT, compaiono discrepanze nei dati, i team perdono fiducia nei report centralizzati e finiscono per affidarsi ai propri set di dati e alle proprie analisi. Questo processo decisionale frammentato crea incoerenza e disallineamento in tutta l'azienda.

Notevole quantità di lavoro manuale

Lavorare con dati non collegati tra loro è intrinsecamente inefficiente. I team dati devono cercare, raccogliere e riconciliare i dati, oltre a collegare manualmente le pipeline o duplicare i dati quando i sistemi non sono compatibili.

I dati sono spesso non strutturati, il che richiede una preparazione supplementare dei dati per unificarli e renderli pronti all'uso. Queste attività ripetitive possono richiedere ore per essere completate, creando inefficienze nei workflow che riducono la produttività.

Processo decisionale lento o stagnante

Gli ambienti di dati in silos possono rallentare applicazioni e sistemi richiedendo passaggi aggiuntivi per recuperare i dati rispetto agli ambienti unificati o centralizzati. Questo introduce la latenza, il che significa che quando i dati arrivano finalmente al loro utilizzo a valle, è probabile che siano obsoleti e possano produrre insight non aggiornati.

La latenza crea anche barriere significative al successo dell'AI, limitando i modelli all'analisi retrospettiva piuttosto che al processo decisionale in tempo reale.

Aumento dei costi dell'IT

La frammentazione dei dati può fare aumentare i costi in diversi modi, inclusi i costi di storage associati alla manutenzione di sistemi eterogenei, gli investimenti in software ridondanti e le risorse aggiuntive necessarie per integrare nuovi sistemi. Nel tempo, questi aumenti dei costi operativi aumentano il costo totale di proprietà e rallentano le iniziative di modernizzazione, inclusa l’adozione di nuove tecnologie come l’AI.

Lacune di sicurezza e governance

I dati distribuiti su molteplici sistemi operativi, cloud pubblici e privati , data center on-premise e server sono più difficili da rilevare, governare e proteggere in conformità con i requisiti normativi e le politiche di privacy.

Questa proliferazione dei dati introduce vulnerabilità di sicurezza, ampliando la superficie di attacco per i criminali informatici e creando punti ciechi: il fatto che un team disponga di solidi controlli di accesso ai dati nella propria piattaforma non garantisce che gli stessi dati siano protetti altrove.

Perché la frammentazione dei dati è un ostacolo all'AI aziendale?

L'AI aziendale sta diventando sempre più accessibile, ma la maggior parte degli ambienti dati enterprise è ancora troppo frammentata per supportarla su larga scala. Ad esempio, i dati del 2025 mostrano che quasi tutte le organizzazioni intervistate prevedevano di implementare l'AI avanzata entro il prossimo anno, tuttavia il 58% ha ammesso di non disporre di una base di dati ben definita.3

Senza un ambiente unificato che fornisca accesso sia ai dati strutturati e non strutturati, le organizzazioni faranno fatica a portare i progetti di AI in produzione con la velocità e la scalabilità necessarie per restare competitive.

Ecco perché:

  • Rallenta l'esecuzione: l'AI necessita di grandi volumi di dati provenienti da varie fonti. Quando i dati sono suddivisi in silos, i team dedicano più tempo alla ricerca e alla preparazione dei dati, piuttosto che alla creazione e all'implementazione di modelli.

  • Limita il contesto. I dati frammentati offrono solo una visione parziale dell'azienda. Senza accesso al quadro completo, gli output dei modelli mancheranno della precisione, delle sfumature e dell’utilità desiderate.

  • Aumenta il rischio.La frammentazione rende più difficile fidarsi dei dati. Indica anche che i dati sono governati e protetti in modo incoerente, rischi che aumentano una volta che i dati vengono utilizzati nei sistemi di AI.

In definitiva, l'AI aziendale è efficace e utile solo quanto i dati su cui si basa: il 72% dei CEO arriva a dire che i dati proprietari sono fondamentali per sbloccare il valore dell'AI generativa. 4

In un video che spiega perché l'unificazione dei dati è importante, Edward Calvesbert, Vicepresidente Product Management watsonx.data di IBM, sottolinea ulteriormente la criticità dei dati proprietari per l'AI:

"I dati della tua organizzazione sono la tua miniera d'oro. È ciò che hai tu e che i tuoi concorrenti non hanno. Quindi, mentre le organizzazioni riflettono su come avere un'AI più affidabile e precisa, tutto inizia con la disponibilità di dati AI-ready".

Cosa causa la frammentazione dei dati?

La frammentazione dei dati è spesso un sintomo di una rapida trasformazione digitale: le organizzazioni moderne memorizzano e creano dati in un ambiente IT sempre più disperso e caotico. Le cause specifiche della frammentazione dei dati includono:

  • Ambienti multicloud ibridi
  • Sistemi disconnessi
  • Aumento dei volumi di dati
  • Governance dei dati debole

Ambienti multicloud ibridi

Le organizzazioni moderne tendono a combinare più piattaforme cloud pubbliche con infrastrutture cloud private e sistemi legacy. Sebbene un formato multicloud ibrido offra flessibilità, scalabilità e velocità, può limitare notevolmente la visibilità completa dei dati a livello aziendale.

L'infrastruttura dati decentralizzata (inclusi storage, piattaforme e governance) crea un ambiente frammentato, difficile da unificare e gestire efficacemente.

Sistemi disconnessi

Non è insolito che le singole unità di business utilizzino fogli di calcolo, strumenti, dashboard e piattaforme distinti. Tuttavia, i sistemi isolati non possono comunicare facilmente i propri dati, soprattutto quando esiste un mix di strumenti legacy e moderni.

Ciò che rende questa disconnessione particolarmente problematica è che molti di questi sistemi spesso lavorano con dati correlati o sovrapposti, ognuno gestendoli in isolamento, ignari degli altri. Questa separazione crea profondi silos di dati, portando a un accumulo di dati involontario, così come a incongruenze e ridondanze.

Aumento dei volumi di dati

I dati sono il carburante che mantiene competitive le aziende moderne. Seguendo questa logica, le organizzazioni riservano ogni punto dati generato dalla loro vasta gamma di strumenti e sistemi per un uso futuro, che si tratti di business intelligence (BI) o di machine learning (ML).

Tuttavia, la maggior parte di questi dati è costituita da informazioni non strutturate contenute in PDF, documenti, immagini e video. Sta arrivando a una velocità senza precedenti e in volumi enormi. Le tradizionali funzionalità di gestione dei dati faticano a gestire centralmente questo diluvio di dati, che porta ad approcci frammentati in tutta l'organizzazione.

Governance dei dati debole

La governance dei dati aiuta a garantire la qualità, la sicurezza e la disponibilità dei dati di un'organizzazione. Le funzioni aziendali risentono negativamente quando gli standard di governance, i processi, le politiche e le procedure non sono chiari o vengono applicati in modo inadeguato.

Questa ambiguità porta i team a creare standard e tassonomie di dati unici per i propri sistemi individuali, ostacolando la condivisione futura delle informazioni, la collaborazione e la visibilità end-to-end.

AI Academy

È la gestione dei dati il segreto dell’AI generativa?

Scopri perché i dati di alta qualità sono fondamentali per un uso efficace dell'AI generativa.

Come risolvere la frammentazione dei dati

Nella pratica, unificare i dati aziendali non significa che le organizzazioni debbano aggregare completamente ogni informazione in un unico spazio di storage.

Questo approccio non è realistico a causa delle complessità degli ambienti multicloud ibridi, dei crescenti volumi di dati e della necessità di considerare conformità, sicurezza e governance. L'obiettivo dell'unificazione dovrebbe invece essere quello di connettere i dati giusti al momento giusto alle persone giuste.

Alcune strategie per risolvere la frammentazione dei dati includono:

  • Cambiare mentalità e cultura
  • Rafforzare la governance dei dati
  • Consolidare le piattaforme di dati
  • Integrare dati e sistemi
  • Adottare un'architettura di data fabric
  • Utilizzare strumenti AI/ML
Cambiare mentalità e cultura

La frammentazione dei dati non è solo un problema informatico, ma anche culturale: il 68% dei dirigenti vede le attuali strutture organizzative come un ostacolo alla realizzazione del pieno valore dell'AI.5

Per risolverlo, è necessaria una nuova mentalità che punti alla data stewardship, in cui tutti i dipendenti considerano i dati come un asset strategico. Questo cambiamento implica la promozione di un approccio data-as-as-product , in cui le esperienze con i dati rispecchiano quelle dei prodotti. Sono accessibili, facili da usare e offrono un valore misurabile.

Rafforzare la governance dei dati

Una solida governance dei dati aiuta a ridurre la frammentazione, standardizzando e applicando un framework per il modo in cui i dati vengono creati, memorizzati e sono accessibili lungo tutto il loro ciclo di vita. La strategia di governance può includere la gestione dei metadati, la gestione della qualità dei dati, gli standard dei dati e i controlli degli accessi .

Tuttavia, la governance non esiste in modo isolato; deve essere costruita intorno a obiettivi e roadmap aziendali reali, con ruoli definiti per gli stakeholder e l'infrastruttura tecnologica necessaria per ottenere i risultati desiderati.

Consolida le fonti di dati

La combinazione di fonti di dati eterogenee può aiutare a risolvere la frammentazione dei dati creando un repository di dati centralizzato. Questo approccio viene tipicamente ottenuto spostando i dati in un data warehouse o in un data lake utilizzando pipeline ETL/ELT .

Oltre a ridurre i silos di dati, la consolidazione fornisce un’unica fonte di verità che supporta un accesso, un’analisi e un processo decisionale coerenti.

Integrare dati e sistemi

I processi di integrazione dei dati combinano e trasformano i dati frammentati in modo che siano facilmente accessibili per l'uso aziendale. Gli approcci comuni includono ETL/ELT e data replication.

Soluzioni più recenti, come l'integrazione zero-copy, interrogano i dati direttamente dove risiedono invece di spostarli. L'Integration Platform as a Service (iPaaS) è emersa come soluzione, utilizzando application programming interface (API) per connettere sistemi e dati in ambienti ibridi e multi-cloud.

Adottare un'architettura di data fabric

Un data fabric crea una vista unificata dei dati tra ambienti distribuiti. Questa moderna architettura dati utilizza automazione, metadati attivi, machine learning e API per abbattere i silos, gestire gli asset di dati e semplificare la gestione dei dati su larga scala.

Bilanciando governance e accesso, i data fabric aiutano le aziende a utilizzare meglio i propri dati negli ambienti multicloud, mantenendo al contempo sicurezza e conformità.

Utilizzare strumenti AI/ML

Gli strumenti di AI e ML possono aiutare a risolvere la frammentazione dei dati automatizzando attività come data discovery, integrazione, classificazione, pulizia e recupero dei dati. Queste funzionalità sono sempre più integrate nei sistemi di data storage, integrazione, governance e gestione dei dati principale .

Gli strumenti abilitati all’IA/ML possono inoltre rafforzare la governance aggiungendo automaticamente metadati, tracciando il lineage e applicando le opportune policy di accesso, rendendo i dati distribuiti nell’organizzazione più facili da trovare, utilizzare e proteggere.

Con la giusta strategia di dati e gli strumenti per ridurre la frammentazione dei dati, le organizzazioni possono iniziare a ottenere enormi vantaggi. Innanzitutto, vedranno una distribuzione accelerata dell'AI e processi decisionali migliorati. Poi, nel lungo termine, avranno un ecosistema dei dati democratizzato che supporta e trasforma continuamente l’azienda.

Alexandra Jonker

Staff Editor

IBM Think

Tom Krantz

Staff Writer

IBM Think

Soluzioni correlate
IBM StreamSets

Crea e gestisci pipeline di dati intelligenti in streaming attraverso un'interfaccia grafica intuitiva, che facilita la perfetta integrazione dei dati in ambienti ibridi e multicloud.

Esplora StreamSets
IBM watsonx.data™

Watsonx.data ti consente di scalare analytics e AI con tutti i tuoi dati, ovunque risiedano, attraverso uno storage dei dati aperto, ibrido e governato.

Scopri watsonx.data
Servizi di consulenza per dati e analytics

Sblocca il valore dei dati enterprise con IBM Consulting, creando un'organizzazione basata su insight in grado di generare vantaggi aziendali.

Esplora i servizi di analytics
Fai il passo successivo

Progetta una strategia dati che elimini i silo, riduca la complessità e migliori la qualità dei dati per esperienze eccezionali di clienti e dipendenti.

  1. Esplora le soluzioni di gestione dei dati
  2. Scopri watsonx.data
Note a piè di pagina

1, 4 The CMO revolution: 5 growth moves to win with AI, IBM Institute for Business Value, giugno 2025.

2 The 2025 CDO Study: The AI multiplier effect, IBM Institute for Business Value, 12 novembre 2025.

3 Go further, faster with AI, IBM Institute for Business Value, 09 dicembre 2025.

5 The enterprise in 2030, IBM Institute for Business Value, 16 gennaio 2026.