6 maggio 2025
Al Think di questa settimana, IBM sta semplificando radicalmente lo stack di dati per l'AI.
IBM presenta in anteprima la principale evoluzione di watsonx.data, che può aiutare le organizzazioni a rendere i dati pronti per l'AI e a fornire una base dati aperta e ibrida e una gestione dei dati strutturati e dei dati non strutturati pronta all'uso aziendale.
Il risultato? Il quaranta percento di AI più accurata rispetto al RAG tradizionale, secondo i test con IBM watsonx.data.1 I prodotti e le caratteristiche che dovrebbero essere disponibili a giugno includono:
Integrazione watsonx.data e intelligence watsonx.data saranno disponibili come prodotti autonomi e alcune funzionalità saranno disponibili anche tramite watsonx.data, massimizzando scelta del cliente e modularità.
Per completare questi prodotti, IBM ha recentemente annunciato l'intenzione di acquisire DataStax, che eccelle nello sfruttare i dati non strutturati per l'AI generativa. Con DataStax, i clienti possono accedere a funzionalità aggiuntive di ricerca vettoriale.
Basato su test interni che confrontano la correttezza delle risposte degli output dei modelli AI utilizzando il livello di recupero watsonx.data Premium Edition con RAG solo vettoriali su tre casi d'uso comuni, con set di dati IBM che utilizzano lo stesso set di modelli di inferenza, giudizio e embedding open source e variabili aggiuntive. I risultati possono variare.
Le aziende si trovano ad affrontare un grosso ostacolo all'AI generativa accurata ed efficace, in particolare l'agentic AI. Ma l'ostacolo non è quello che la maggior parte dei leader aziendali si immagina.
Il problema non sono i costi di inferenza o l’inafferrabile modello "perfetto". Il problema sono i dati.
Le organizzazioni necessitano di dati affidabili e specifici dell'azienda affinché l'agentic AI crei davvero valore: dati non strutturati contenuti in e-mail, documenti, presentazioni e video. Si stima che nel 2022, il 90% dei dati generati dalle aziende non fosse strutturato, ma nei progetti IBM solo l'1% è rappresentato negli LLM.
I dati non strutturati possono essere estremamente difficili da sfruttare. Sono altamente distribuiti e dinamici, bloccati in diversi formati, mancano di etichette chiare e spesso richiedono un contesto aggiuntivo per essere interpretati correttamente. La Conventional Retrieval-Augmented Generation (RAG) è inefficace nell'estrarne il valore e non può combinare correttamente dati non strutturati e strutturati.
Nel frattempo, una serie di strumenti disconnessi può rendere lo stack dei dati per l'AI complesso e ingombrante. Le aziende si destreggiano tra data warehouse, data lake e strumenti di governance dei dati e di integrazione. Lo stack di dati può sembrare disorientante tanto quanto i dati non strutturati che dovrebbe gestire.
Molte organizzazioni non stanno affrontando il problema di base. Si concentrano esclusivamente sul livello di applicazione dell'AI generativa, piuttosto che sul livello di dati essenziale sottostante. Finché le organizzazioni non correggeranno le proprie basi di dati, gli agenti AI e altre iniziative di AI generativa non riusciranno a esprimere appieno il loro potenziale.
Le nuove funzionalità di IBM consentiranno alle organizzazioni di inserire, gestire e recuperare dati non strutturati (e strutturati) e, a partire da lì, scalare un'AI generativa accurata ed efficace.
Newsletter sulle novità IBM
Ricevi i principali annunci sui prodotti e le caratteristiche, comprese le recenti video chat sui prodotti e le offerte didattiche di IBM e dei nostri partner di formazione. Leggi l' Informativa sulla privacy IBM.