I dati frammentati sono difficili da accedere, governare e utilizzare e rappresentano una delle tre principali sfide legate ai dati per i vertici aziendali.1 Portano alla creazione di “isole di dati”, metriche incoerenti, più versioni della verità e una dipendenza dai processi manuali di gestione dei dati. Queste sfide si estendono anche alla business planning e al processo decisionale, ostacolando l'efficienza operativa, la produttività e i progetti di innovazione.
La Retrieval-augmented generation (RAG) di livello enterprise, in particolare, richiede grandi set di dati di informazioni proprietarie per fornire risposte contestuali. Tuttavia, quando i team di dati devono gestire dati provenienti da posizioni e repository diversi, queste iniziative perdono rapidamente slancio.
Per molte organizzazioni, evitare la frammentazione dei dati non è facile. Il volume di dati gestiti dalle imprese sta esplodendo, e gran parte di essi è costituito da dati non strutturati. Una ricerca del 2025 ha rilevato che solo il 26% dei Chief Data Officer è sicuro che la propria organizzazione possa utilizzare dati non strutturati in modo da offrire un valore aziendale.2
La costante aggiunta di nuovi strumenti software as a service (SaaS), piattaforme cloud e applicazioni aziendali ai sistemi legacy esistenti aumenta ulteriormente la complessità di un ambiente già di per sé complesso (un fenomeno comunemente definito proliferazione SaaS).
Per ottenere dati unificati, le organizzazioni possono utilizzare diverse strategie, tra cui integrazione dei dati, consolidamento, governance dei dati e architetture di data fabric . Tuttavia, per combattere la frammentazione dei dati è necessario anche un cambiamento di mentalità: adattare la cultura e i modi di lavorare per considerare i dati come asset strategici.
Esistono due tipi di frammentazione dei dati. Questa pagina si concentra sulla proliferazione incontrollata dei dati di un'organizzazione tra sistemi e ambienti. Tuttavia, il termine può anche descrivere un sistema di gestione del database (DBMS) mirato e una strategia di ottimizzazione delle prestazioni del file system.
In uno scenario ideale, l'azienda è ad alta velocità. È efficiente e prende decisioni basate sui dati sulla base di flussi di dati in tempo reale, il tutto assistito da strumenti di intelligenza artificiale (AI) velocissimi. Tuttavia, per molte organizzazioni la realtà è ben diversa: più lenta, più costosa e molto più manuale a causa della frammentazione del loro ecosistema di dati.
Ecco alcuni esempi chiave di frammentazione dei dati in un contesto aziendale:
Quando i dati sono frammentati, è difficile mantenere una visione affidabile e unificata a cui diversi dipartimenti e sistemi possano fare riferimento in modo costante, la cosiddetta singola fonte affidabile (SSOT).
Senza una SSOT, compaiono discrepanze nei dati, i team perdono fiducia nei report centralizzati e finiscono per affidarsi ai propri set di dati e alle proprie analisi. Questo processo decisionale frammentato crea incoerenza e disallineamento in tutta l'azienda.
Lavorare con dati non collegati tra loro è intrinsecamente inefficiente. I team dati devono cercare, raccogliere e riconciliare i dati, oltre a collegare manualmente le pipeline o duplicare i dati quando i sistemi non sono compatibili.
I dati sono spesso non strutturati, il che richiede una preparazione supplementare dei dati per unificarli e renderli pronti all'uso. Queste attività ripetitive possono richiedere ore per essere completate, creando inefficienze nei workflow che riducono la produttività.
Gli ambienti di dati in silos possono rallentare applicazioni e sistemi richiedendo passaggi aggiuntivi per recuperare i dati rispetto agli ambienti unificati o centralizzati. Questo introduce la latenza, il che significa che quando i dati arrivano finalmente al loro utilizzo a valle, è probabile che siano obsoleti e possano produrre insight non aggiornati.
La latenza crea anche barriere significative al successo dell'AI, limitando i modelli all'analisi retrospettiva piuttosto che al processo decisionale in tempo reale.
La frammentazione dei dati può fare aumentare i costi in diversi modi, inclusi i costi di storage associati alla manutenzione di sistemi eterogenei, gli investimenti in software ridondanti e le risorse aggiuntive necessarie per integrare nuovi sistemi. Nel tempo, questi aumenti dei costi operativi aumentano il costo totale di proprietà e rallentano le iniziative di modernizzazione, inclusa l’adozione di nuove tecnologie come l’AI.
I dati distribuiti su molteplici sistemi operativi, cloud pubblici e privati , data center on-premise e server sono più difficili da rilevare, governare e proteggere in conformità con i requisiti normativi e le politiche di privacy.
Questa proliferazione dei dati introduce vulnerabilità di sicurezza, ampliando la superficie di attacco per i criminali informatici e creando punti ciechi: il fatto che un team disponga di solidi controlli di accesso ai dati nella propria piattaforma non garantisce che gli stessi dati siano protetti altrove.
Resta al passo con le tendenze più importanti e interessanti del settore relative ad AI, automazione, dati e oltre con la newsletter Think. Leggi l' Informativa sulla privacy IBM.
L'AI aziendale sta diventando sempre più accessibile, ma la maggior parte degli ambienti dati enterprise è ancora troppo frammentata per supportarla su larga scala. Ad esempio, i dati del 2025 mostrano che quasi tutte le organizzazioni intervistate prevedevano di implementare l'AI avanzata entro il prossimo anno, tuttavia il 58% ha ammesso di non disporre di una base di dati ben definita.3
Senza un ambiente unificato che fornisca accesso sia ai dati strutturati e non strutturati, le organizzazioni faranno fatica a portare i progetti di AI in produzione con la velocità e la scalabilità necessarie per restare competitive.
Ecco perché:
In definitiva, l'AI aziendale è efficace e utile solo quanto i dati su cui si basa: il 72% dei CEO arriva a dire che i dati proprietari sono fondamentali per sbloccare il valore dell'AI generativa. 4
In un video che spiega perché l'unificazione dei dati è importante, Edward Calvesbert, Vicepresidente Product Management watsonx.data di IBM, sottolinea ulteriormente la criticità dei dati proprietari per l'AI:
"I dati della tua organizzazione sono la tua miniera d'oro. È ciò che hai tu e che i tuoi concorrenti non hanno. Quindi, mentre le organizzazioni riflettono su come avere un'AI più affidabile e precisa, tutto inizia con la disponibilità di dati AI-ready".
La frammentazione dei dati è spesso un sintomo di una rapida trasformazione digitale: le organizzazioni moderne memorizzano e creano dati in un ambiente IT sempre più disperso e caotico. Le cause specifiche della frammentazione dei dati includono:
Le organizzazioni moderne tendono a combinare più piattaforme cloud pubbliche con infrastrutture cloud private e sistemi legacy. Sebbene un formato multicloud ibrido offra flessibilità, scalabilità e velocità, può limitare notevolmente la visibilità completa dei dati a livello aziendale.
L'infrastruttura dati decentralizzata (inclusi storage, piattaforme e governance) crea un ambiente frammentato, difficile da unificare e gestire efficacemente.
Non è insolito che le singole unità di business utilizzino fogli di calcolo, strumenti, dashboard e piattaforme distinti. Tuttavia, i sistemi isolati non possono comunicare facilmente i propri dati, soprattutto quando esiste un mix di strumenti legacy e moderni.
Ciò che rende questa disconnessione particolarmente problematica è che molti di questi sistemi spesso lavorano con dati correlati o sovrapposti, ognuno gestendoli in isolamento, ignari degli altri. Questa separazione crea profondi silos di dati, portando a un accumulo di dati involontario, così come a incongruenze e ridondanze.
I dati sono il carburante che mantiene competitive le aziende moderne. Seguendo questa logica, le organizzazioni riservano ogni punto dati generato dalla loro vasta gamma di strumenti e sistemi per un uso futuro, che si tratti di business intelligence (BI) o di machine learning (ML).
Tuttavia, la maggior parte di questi dati è costituita da informazioni non strutturate contenute in PDF, documenti, immagini e video. Sta arrivando a una velocità senza precedenti e in volumi enormi. Le tradizionali funzionalità di gestione dei dati faticano a gestire centralmente questo diluvio di dati, che porta ad approcci frammentati in tutta l'organizzazione.
La governance dei dati aiuta a garantire la qualità, la sicurezza e la disponibilità dei dati di un'organizzazione. Le funzioni aziendali risentono negativamente quando gli standard di governance, i processi, le politiche e le procedure non sono chiari o vengono applicati in modo inadeguato.
Questa ambiguità porta i team a creare standard e tassonomie di dati unici per i propri sistemi individuali, ostacolando la condivisione futura delle informazioni, la collaborazione e la visibilità end-to-end.
Nella pratica, unificare i dati aziendali non significa che le organizzazioni debbano aggregare completamente ogni informazione in un unico spazio di storage.
Questo approccio non è realistico a causa delle complessità degli ambienti multicloud ibridi, dei crescenti volumi di dati e della necessità di considerare conformità, sicurezza e governance. L'obiettivo dell'unificazione dovrebbe invece essere quello di connettere i dati giusti al momento giusto alle persone giuste.
Alcune strategie per risolvere la frammentazione dei dati includono:
La frammentazione dei dati non è solo un problema informatico, ma anche culturale: il 68% dei dirigenti vede le attuali strutture organizzative come un ostacolo alla realizzazione del pieno valore dell'AI.5
Per risolverlo, è necessaria una nuova mentalità che punti alla data stewardship, in cui tutti i dipendenti considerano i dati come un asset strategico. Questo cambiamento implica la promozione di un approccio data-as-as-product , in cui le esperienze con i dati rispecchiano quelle dei prodotti. Sono accessibili, facili da usare e offrono un valore misurabile.
Una solida governance dei dati aiuta a ridurre la frammentazione, standardizzando e applicando un framework per il modo in cui i dati vengono creati, memorizzati e sono accessibili lungo tutto il loro ciclo di vita. La strategia di governance può includere la gestione dei metadati, la gestione della qualità dei dati, gli standard dei dati e i controlli degli accessi .
Tuttavia, la governance non esiste in modo isolato; deve essere costruita intorno a obiettivi e roadmap aziendali reali, con ruoli definiti per gli stakeholder e l'infrastruttura tecnologica necessaria per ottenere i risultati desiderati.
La combinazione di fonti di dati eterogenee può aiutare a risolvere la frammentazione dei dati creando un repository di dati centralizzato. Questo approccio viene tipicamente ottenuto spostando i dati in un data warehouse o in un data lake utilizzando pipeline ETL/ELT .
Oltre a ridurre i silos di dati, la consolidazione fornisce un’unica fonte di verità che supporta un accesso, un’analisi e un processo decisionale coerenti.
I processi di integrazione dei dati combinano e trasformano i dati frammentati in modo che siano facilmente accessibili per l'uso aziendale. Gli approcci comuni includono ETL/ELT e data replication.
Soluzioni più recenti, come l'integrazione zero-copy, interrogano i dati direttamente dove risiedono invece di spostarli. L'Integration Platform as a Service (iPaaS) è emersa come soluzione, utilizzando application programming interface (API) per connettere sistemi e dati in ambienti ibridi e multi-cloud.
Un data fabric crea una vista unificata dei dati tra ambienti distribuiti. Questa moderna architettura dati utilizza automazione, metadati attivi, machine learning e API per abbattere i silos, gestire gli asset di dati e semplificare la gestione dei dati su larga scala.
Bilanciando governance e accesso, i data fabric aiutano le aziende a utilizzare meglio i propri dati negli ambienti multicloud, mantenendo al contempo sicurezza e conformità.
Gli strumenti di AI e ML possono aiutare a risolvere la frammentazione dei dati automatizzando attività come data discovery, integrazione, classificazione, pulizia e recupero dei dati. Queste funzionalità sono sempre più integrate nei sistemi di data storage, integrazione, governance e gestione dei dati principale .
Gli strumenti abilitati all’IA/ML possono inoltre rafforzare la governance aggiungendo automaticamente metadati, tracciando il lineage e applicando le opportune policy di accesso, rendendo i dati distribuiti nell’organizzazione più facili da trovare, utilizzare e proteggere.
Con la giusta strategia di dati e gli strumenti per ridurre la frammentazione dei dati, le organizzazioni possono iniziare a ottenere enormi vantaggi. Innanzitutto, vedranno una distribuzione accelerata dell'AI e processi decisionali migliorati. Poi, nel lungo termine, avranno un ecosistema dei dati democratizzato che supporta e trasforma continuamente l’azienda.
Crea e gestisci pipeline di dati intelligenti in streaming attraverso un'interfaccia grafica intuitiva, che facilita la perfetta integrazione dei dati in ambienti ibridi e multicloud.
Watsonx.data ti consente di scalare analytics e AI con tutti i tuoi dati, ovunque risiedano, attraverso uno storage dei dati aperto, ibrido e governato.
Sblocca il valore dei dati enterprise con IBM Consulting, creando un'organizzazione basata su insight in grado di generare vantaggi aziendali.
1, 4 The CMO revolution: 5 growth moves to win with AI, IBM Institute for Business Value, giugno 2025.
2 The 2025 CDO Study: The AI multiplier effect, IBM Institute for Business Value, 12 novembre 2025.
3 Go further, faster with AI, IBM Institute for Business Value, 09 dicembre 2025.
5 The enterprise in 2030, IBM Institute for Business Value, 16 gennaio 2026.