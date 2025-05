Le aziende si trovano ad affrontare un grosso ostacolo all'AI generativa accurata ed efficace, in particolare l'agentic AI. Ma l'ostacolo non è quello che la maggior parte dei leader aziendali si immagina.

Il problema non sono i costi di inferenza o l’inafferrabile modello "perfetto". Il problema sono i dati.

Le organizzazioni necessitano di dati affidabili e specifici dell'azienda affinché l'agentic AI crei davvero valore: dati non strutturati contenuti in e-mail, documenti, presentazioni e video. Si stima che nel 2022, il 90% dei dati generati dalle aziende non fosse strutturato, ma nei progetti IBM solo l'1% è rappresentato negli LLM.

I dati non strutturati possono essere estremamente difficili da sfruttare. Sono altamente distribuiti e dinamici, bloccati in diversi formati, mancano di etichette chiare e spesso richiedono un contesto aggiuntivo per essere interpretati correttamente. La Conventional Retrieval-Augmented Generation (RAG) è inefficace nell'estrarne il valore e non può combinare correttamente dati non strutturati e strutturati.

Nel frattempo, una serie di strumenti disconnessi può rendere lo stack dei dati per l'AI complesso e ingombrante. Le aziende si destreggiano tra data warehouse, data lake e strumenti di governance dei dati e di integrazione. Lo stack di dati può sembrare disorientante tanto quanto i dati non strutturati che dovrebbe gestire.

Molte organizzazioni non stanno affrontando il problema di base. Si concentrano esclusivamente sul livello di applicazione dell'AI generativa, piuttosto che sul livello di dati essenziale sottostante. Finché le organizzazioni non correggeranno le proprie basi di dati, gli agenti AI e altre iniziative di AI generativa non riusciranno a esprimere appieno il loro potenziale.