L'agentic AI ha un problema con i dati non strutturati: IBM sta svelando una soluzione

6 maggio 2025

Autore

Edward Calvesbert

Vice President

Product Management, watsonx Platform

Al Think di questa settimana, IBM sta semplificando radicalmente lo stack di dati per l'AI.

IBM presenta in anteprima la principale evoluzione di watsonx.data, che può aiutare le organizzazioni a rendere i dati pronti per l'AI e a fornire una base dati aperta e ibrida e una gestione dei dati strutturati e dei dati non strutturati pronta all'uso aziendale.

Il risultato? Il quaranta percento di AI più accurata rispetto al RAG tradizionale, secondo i test con IBM watsonx.data.1 I prodotti e le caratteristiche che dovrebbero essere disponibili a giugno includono:

  • Integrazione watsonx.data, software per orchestrare l'accesso ai dati e l'ingegneria in diversi stili e formati di integrazione in un'unica interfaccia, con flessibilità e scalabilità al centro
  • watsonx.data intelligence, software per trasformare il modo in cui le organizzazioni rendono accurati, gestiscono e utilizzano dati significativi, sfruttando la potenza dell'AI per semplificare la governance dei dati
  • L'aggiunta di watsonx come fornitore di API all'interno del Llama Stack di Meta, che migliora la capacità delle aziende di implementare l'AI generativa su larga scala e con, al centro, l'apertura

Integrazione watsonx.data e intelligence watsonx.data saranno disponibili come prodotti autonomi e alcune funzionalità saranno disponibili anche tramite watsonx.data, massimizzando scelta del cliente e modularità.

Per completare questi prodotti, IBM ha recentemente annunciato l'intenzione di acquisire DataStax, che eccelle nello sfruttare i dati non strutturati per l'AI generativa. Con DataStax, i clienti possono accedere a funzionalità aggiuntive di ricerca vettoriale.

Basato su test interni che confrontano la correttezza delle risposte degli output dei modelli AI utilizzando il livello di recupero watsonx.data Premium Edition con RAG solo vettoriali su tre casi d'uso comuni, con set di dati IBM che utilizzano lo stesso set di modelli di inferenza, giudizio e embedding open source e variabili aggiuntive. I risultati possono variare.

Il contesto di questa importante evoluzione

Le aziende si trovano ad affrontare un grosso ostacolo all'AI generativa accurata ed efficace, in particolare l'agentic AI. Ma l'ostacolo non è quello che la maggior parte dei leader aziendali si immagina.

Il problema non sono i costi di inferenza o l’inafferrabile modello "perfetto". Il problema sono i dati.

Le organizzazioni necessitano di dati affidabili e specifici dell'azienda affinché l'agentic AI crei davvero valore: dati non strutturati contenuti in e-mail, documenti, presentazioni e video. Si stima che nel 2022, il 90% dei dati generati dalle aziende non fosse strutturato, ma nei progetti IBM solo l'1% è rappresentato negli LLM.

I dati non strutturati possono essere estremamente difficili da sfruttare. Sono altamente distribuiti e dinamici, bloccati in diversi formati, mancano di etichette chiare e spesso richiedono un contesto aggiuntivo per essere interpretati correttamente. La Conventional Retrieval-Augmented Generation (RAG) è inefficace nell'estrarne il valore e non può combinare correttamente dati non strutturati e strutturati.

Nel frattempo, una serie di strumenti disconnessi può rendere lo stack dei dati per l'AI complesso e ingombrante. Le aziende si destreggiano tra data warehouse, data lake e strumenti di governance dei dati e di integrazione. Lo stack di dati può sembrare disorientante tanto quanto i dati non strutturati che dovrebbe gestire.

Molte organizzazioni non stanno affrontando il problema di base. Si concentrano esclusivamente sul livello di applicazione dell'AI generativa, piuttosto che sul livello di dati essenziale sottostante. Finché le organizzazioni non correggeranno le proprie basi di dati, gli agenti AI e altre iniziative di AI generativa non riusciranno a esprimere appieno il loro potenziale.

Aiutare le organizzazioni a rendere i dati pronti per l'AI

Le nuove funzionalità di IBM consentiranno alle organizzazioni di inserire, gestire e recuperare dati non strutturati (e strutturati) e, a partire da lì, scalare un'AI generativa accurata ed efficace.

Iscriviti per ricevere gli aggiornamenti

Le ultime notizie sui prodotti da IBM

Ricevi i principali annunci sui prodotti e le caratteristiche, comprese le recenti video chat sui prodotti e le offerte didattiche di IBM e dei nostri partner di formazione. Leggi l' Informativa sulla privacy IBM.

Grazie per aver effettuato l'iscrizione!