Tutte le organizzazioni hanno bisogno di persone in grado di risolvere problemi. Mi riferisco agli operatori indipendenti, che disprezzano il tipo di pressione che affligge le imprese inefficienti e sono abbastanza sicuri di sé da saper leggere tra le righe. Quando un software dimostra questo tipo di intelligenza, diciamo "semplicemente funziona". Quando si tratta di un dipendente, diciamo "capisce e basta".
Esiste poi l'estremo opposto, caratterizzato da differimenti, ritardi e indecisioni. Spesso rappresentano un passo indietro o agiscono sulla base di informazioni non aggiornate e costituiscono l'anello debole di tutto e, solitamente, sono alla base di una delle frasi di maggiore frustrazione che si possono sentire in un ufficio: "Ci penso io".
Milioni di agenti AI, e senza dubbio lo sai se ti ritrovi a leggere questo blog, verranno creati e implementati nei prossimi anni. Secondo l'IBM Institute for Business Value, il 70% dei dirigenti intervistati afferma che l'agentic AI è fondamentale per la loro strategia futura. La domanda è: che tipo di agenti sta reclutando: risolutori di problemi o creatori di problemi?
La differenza tra i due agenti si riduce a un nemico familiare: i silos. È troppo allettante confermare il bias dell'ottimismo durante le condizioni ideali della stagione pilota; quando è il momento più importante, ovvero il momento dell'implementazione a livello aziendale, le complessità delle grandi imprese ostacolano il progresso. Workflow non lineari, governance frammentata e accesso ai dati non coerente trasformano tutti gli agenti in un problema di manutenzione isolato. Quello che avrebbe dovuto stimolare la produttività diventa un'importante ostacolo alla produttività. Chiamatela ironia dell'AI.
Per scalare, le organizzazioni devono orchestrare tutti i loro agenti in modo olistico, creando un elenco di collaboratori AI governati in modo coerente e facilmente integrabili con gli strumenti esistenti. Se l'orchestrazione funziona, i processi si allineano, i silos scompaiono e il potenziale dell'AI si trasforma in risultati reali. Tuttavia, l'orchestrazione da sola non vincerà la gara dell'AI. I dati sono il fattore distintivo. Sono la forza che rende i tuoi agenti (tutti, non solo i casi di test POC) esperti nella tua azienda e sufficientemente affidabili da poter agire in modo autonomo.
Dopotutto, i dati generici portano a un AI generica che usa lo stesso tono monotono dei suoi concorrenti. O peggio ancora, i dati mal gestiti possono trasformare l'AI in una responsabilità che diffonde gli errori più rapidamente e più lontano di quanto possa fare qualsiasi essere umano.
Ci è voluto troppo tempo perché il mercato riconoscesse l'importanza della preparazione dei dati per l'AI, una supervisione che ha fatto sì che il ROI sia rimasto ancora non definito e si manifesta in una serie di statistiche che dimostrano che la maggior parte delle organizzazioni è ancora bloccata nella stagione pilota. Infatti, solo il 5% delle organizzazioni intervistate ha integrato strumenti di AI nei propri workflow su larga scala, secondo un rapporto del MIT.
È in corso una profonda correzione, in quanto le organizzazioni investono miliardi nelle iniziative sui dati. Secondo i dati del prossimo sondaggio dell'IBM Institute of Business Value, circa il 13% dei budget IT sarà destinato alla strategia dei dati nel 2025, rispetto al 4% del 2022. Allo stesso modo, l'82% dei chief data officer intervistati dichiara di assumere per ruoli che l'anno scorso non addirittura esistevano.
L'obiettivo, ovviamente, è quello di arricchire la propria AI con il tipo di dati proprietari e affidabili che rendono unica l'azienda. Quando tu o i tuoi clienti sollecitate l'AI, questa dovrebbe restituire informazioni contestualmente pertinenti e coerenti con gli obiettivi, i valori e gli obblighi normativi della tua organizzazione. L'agentic AI aumenta ulteriormente la posta in gioco. Quando metti in movimento un agente e gli dai il potere di prendere decisioni e perseguire obiettivi espliciti, devi essere sicuro che conosca la tua azienda e la sua cultura, i tuoi dati, a fondo.
Per avere successo, gli agenti hanno bisogno di dati di qualità, che, secondo The Data Management Association, devono essere accurati, completi, coerenti, tempestivi, unici e validi. IBM aggiunge una settima dimensione della qualità dei dati, l'omogeneità, che rappresenta una misura della qualità che garantisce che vari dati possano essere armonizzati per un'interpretazione coerente e arricchiti per la comprensione semantica.
Mantenere la qualità dei dati non è facile, soprattutto nell'era degli zettabyte. Le verifiche manuali in ambito di qualità sono lunghe, soggette a errori e richiedono una scala di professionisti dei dati che semplicemente non esiste, in un contesto di persistente carenza di talenti.
Le organizzazioni hanno tentato di colmare questo divario creando in modo precario stack di dati che poi crollano con data warehouse, data lake e strumenti di integrazione. Patch, dashboard e script aggiungono ulteriore complessità. L'approccio ad hoc porta troppo spesso a un debito tecnico che si accumula costantemente e in modo imprevedibile. L'innovazione passa in secondo piano quando il personale IT si limita a svolgere attività di semplice manutenzione, riversando la propria produttività nelle incrinature del patrimonio di dati.
Cosa possiamo fare adesso?
La risposta inizia con un livello di dati che collega, arricchisce e gestisce tutte le fonti di dati e ha funzione di fonte di ispirazione per gli agenti AI fluenti nel contesto e nella voce della tua organizzazione. Grazie a questa base, gli agenti prendono decisioni affidabili, accelerando i workflow, riducendo i rischi e promuovendo la produttività su larga scala.
I metadati sono la lingua di quel livello. Fornisce il contesto che rende i tuoi dati facilmente utilizzabili per l'AI o per workload più tradizionali, come l'analytics e l'ingegneria dei dati. Tuttavia, la classificazione manuale non è scalabile. Il tagging automatico invece sì, perché applica la struttura alla velocità di ingestione. Cattura il lineage, la sensibilità e il significato aziendale, con una supervisione umana disponibile quando necessario, per ridurre i rischi e accelerare le attività a valle, come il recupero e la conformità. In breve, trasforma gli asset non elaborati in conoscenza governata e contestuale, prima ancora che qualcuno la richieda.
Il contesto è potente. In definitiva, porta a un'AI più accurata e a un processo decisionale più sicuro. Tuttavia, i dati senza i giusti permessi rappresentano un peso, non un asset.
Le regole di accesso non dovrebbero essere sui fogli di calcolo. Dovrebbero viaggiare insieme ai dati. Quando gli asset vengono spostati da un archivio di documenti a un lakehouse per un lavoro di perfezionamento, anche le autorizzazioni dovrebbero cambiare. Quando le policy si applicano in base a identità, ruolo e scopo, le persone giuste vedono i dati giusti al momento giusto. Questo processo riduce il rischio, previene esposizioni accidentali e impedisce che la conformità diventi una semplice esercitazione antincendio.
Una governance forte è fondamentale, ma è solo una parte dell'equazione. L'architettura sottostante stabilisce se il controllo può scalare o se invece si arresta. L'approccio aperto e hybrid by design è quello giusto, in quanto la maggior parte delle aziende si muove già su più cloud e ambienti on-premise. La separazione di storage e calcolo evita migrazioni costose e le interruzioni che ne sono alla base. I formati di file aperti, come Apache Iceberg, rendono possibile tutto ciò disaccoppiando le applicazioni dallo storage, consentendo agli strumenti di leggere e scrivere i dati sul posto, ovunque si trovino. Impediscono inoltre il collegamento al database di un singolo fornitore. La flessibilità non è un lusso, ma una protezione nei confronti dei costi incontrollati e dei sistemi rigidi che non riescono ad adattarsi quando le priorità cambiano. Non sorprende quindi che tre quarti delle organizzazioni prevedono di aumentare l'uso di tecnologie AI open source, inclusi formati di file open source, nei prossimi anni, citando costi di implementazione e manutenzione più bassi, secondo uno studio di McKinsey.
I dati non strutturati restano la grande riserva inutilizzata. Fatture, e-mail, log, immagini, persino questo blog, contengono, spero, insight che raramente finiscono nell'analytics in quanto sono sparpagliati tra sistemi, bloccati in formati incompatibili e privi di etichette ordinate. L'estrazione manuale è un fallimento in partenza. Richiede ore di impegno umano, favorisce gli errori e crolla sotto il peso dei dati su scala aziendale. L'automazione è l'unico modo per imporre ordine a livello aziendale: individuare entità, acquisire valore e stratificare semantiche che riflettano il modo in cui la tua azienda parla effettivamente e come vuole apparire sul mercato. Da lì emerge uno schema che le macchine possono elaborare e di cui gli umani, e gli agenti AI, possono fidarsi.
Quando questi dati arricchiti fluiscono in uno livello di recupero che combina text-to-SQL, recupero vettoriale e query ibride, gli agenti smettono di andare a tentativi. Cominciano a ragionare e ad agire con sicurezza. I sistemi RAG tradizionali, al contrario, spesso faticano a comprendere il contesto, rendendoli poco adatti al ragionamento su scala aziendale. Un approccio unificato evita queste insidie, dando agli agenti la profondità e la precisione necessarie per agire in modo deciso.
Trasformare il caos non strutturato in chiarezza strutturata è solo un inizio, ma l'intelligenza è quello che rende utile questa chiarezza. Senza di questo, anche i dati meglio organizzati restano inerti. La data intelligence fornisce a ogni asset una storia: da dove proviene, come è cambiata e chi ne è responsabile. La catalogazione e il lineage non sono solo questioni di ordine: sono la base della fiducia. Il punteggio di qualità garantisce che gli agenti non ragionino su basi instabili. La pubblicazione di prodotti di dati con termini ben definiti trasforma le risorse non elaborate in servizi fruibili su cui i team possono fare affidamento. Quando un agente fa riferimento a una cifra, la fonte dovrebbe essere lontana solo un clic. Quando una definizione cambia, ogni sistema dipendente dovrebbe saperlo prima che venga presa la prossima decisione.
Ma l'intelligenza da sola non basta. Il rapporto AI in azione 2024 di IBM ha rilevato che la complessità dei dati—inclusa l'Integrazione tra sistemi frammentati—rimane uno dei principali ostacoli alla scalabilità dell'IA. Gli agenti e altri sistemi che si basano sui dati hanno bisogno di un'Integrazione continua invece che di un unico e finito. L'integrazione è il modo in cui i dati vengono modellati in movimento: standardizzati, arricchiti, governati e pronti all'uso man mano che scorrono. Le pipeline devono adattarsi ad ogni esecuzione, imparando dalle derive e ottimizzando le prestazioni, i costi e la qualità. Anche l'osservabilità conta. Quando l'integrazione è visibile e reattiva, i sistemi a valle—inclusi gli agenti—non ereditano errori silenziosi o logica obsoleta.
Quando integrazione e intelligenza lavorano insieme, il risultato sembra familiare: funziona e basta. Non per una questione di fortuna, ma perché l'architettura sottostante è volontaria. Un livello di dati che collega il tuo patrimonio, applica un significato e porta la governance in ogni spostamento, agentico o di altro tipo, aumenta l'accuratezza e promuove un processo decisionale sicuro. Ecco come trasformare una demo promettente in un sistema affidabile. Ecco come si passa dai progetti pilota alla produzione senza perdere di vista il filo.
1. From AI projects to profits: How agentic AI can sustain financial returns, IBM Institute for Business Value, 9 June 2025.
2. The GenAI Divide: State of AI in Business 2025, MIT Nanda, July 2025
3. The AI multiplier effect: Accelerate growth with decision-ready data, IBM Institute for Business Value, December 2025
4. The Six Primary Dimensions for Data Quality Assessment, DAMA United Kingdom, October 2013.
5. Data quality dimensions, IBM, 17 October 2025.
6. Open source technology in the age of AI, McKinsey & Company, the Mozilla Foundation and the Patrick J. McGovern Foundation, April 2025.
7. AI in Action 2024, IBM, 2024.