IBM® watsonx.data: Migliorare la precisione dell'AI con dati non strutturati e strutturati pronti per l'AI

Rendering digitale per rappresentare l'impresa watsonx.ai

Autore

Edward Calvesbert

Vice President, Product Management - watsonx.data

IBM

Oggi, IBM ha lanciato l'evoluzione di IBM® watsonx.data, l'unico data lakehouse ibrido e aperto per l'AI e l'analytics aziendali, per la disponibilità generale.

Le organizzazioni possono ora semplificare e scalare l'accesso, la preparazione e la fornitura di dati non strutturati e strutturati per alimentare le applicazioni gen AI più accurate e pertinenti, scalare l'analisi self-service e semplificare e scalare l'accesso ai dati, l'arricchimento e la governance dei dati precedentemente complessi.

AI più accurata rispetto alla RAG convenzionale

I dati Enterprise sono lo strumento migliore per potenziare un'AI accurata e differenziata che sia rilevante per il settori e i clienti e generi un vantaggio competitivo. Tuttavia, il 90% dei dati aziendali sono dati non strutturati, che sono rimasti in gran parte inaccessibili e sottoutilizzati per la gen AI.2

Ora puoi accedere, preparare e fornire i tuoi dati aziendali non strutturati per alimentare un'AI più precisa del 40% rispetto al RAG convenzionale con IBM® watsonx.data*. Watsonx.data è unicamente:

  1. Ibrido e aperto per accedere ai dati ovunque risiedano e alla distribuzione in ambienti on-premise, cloud e multi-cloud con interoperabilità con l'ecosistema esistente e gli investimenti in dati.
  2. Ottimizzato per il workload con diversi motori di query adatti allo scopo, tra cui il nuovo Spark open source ottimizzato da Apache Gluten per ottimizzare i workload in termini di costi e prestazioni.
  3. Pronto per la gen AI con funzionalità di data fabric integrate, integrazione watsonx.data e watsonx.data intelligence, il tutto all'interno del data lakehouse, per evitare di creare un altro silo di dati.

Ora puoi scalare e automatizzare:

  1. Inserimento dei tuoi dati non strutturati e strutturati da una varietà di nuovi sistemi di origine tra cui Filenet, Box, Google Docs e altri.
  2. Arricchimento semantico dei tuoi dati, creando sia embedding vettorializzati che derivati strutturati da entità estratte e normalizzate nei tuoi documenti per alimentare applicazioni AI che comprendono il contesto posizionale, le relazioni e i calcoli per risultati più precisi e completi.
  3. Governance dei tuoi dati con controlli di accesso ereditati dai sistemi di origine dei documenti fino al recupero dei tuoi dati per l'intelligenza artificiale, con annotazione delle PII per evitare che emergano informazioni sensibili.
  4. Recupero di tali dati in un ampio spettro di workload, dalla BI alle applicazioni di gen AI e agenti

Tutto questo può essere fatto all'interno di IBM® watsonx.data per sbloccare i dati aziendali non strutturati per AI e analytics tradizionali, come ingegneria dei dati, BI e apprendimento automatico (ML).

Velocità e scalabilità per workload analitici complessi

IBM® watsonx.data offre ora Spark accelerato da Apache Gluten come uno dei suoi molteplici motori di query adatti allo scopo, aumentando significativamente le prestazioni per i workload Spark SQL ad alta intensità di calcolo. Apache Gluten, una libreria ad alte prestazioni, ottimizza i workload Apache Spark SQL scaricando l'esecuzione su Velox, un motore di esecuzione C++ nativo. Questa integrazione offre un'elaborazione più rapida delle query e una maggiore efficienza delle risorse per l'analytics su larga scala. Ora le organizzazioni possono eseguire attività analitiche complesse con velocità e scalabilità ancora maggiori e a costi inferiori.

Il nuovo database DataStax NoSQL aggiunge funzionalità operative e vettoriali 

IBM ha recentemente acquisito DataStax, portando un datastore vettoriale operativo NoSQL, basato su Apache Cassandra, su watsonx.data. Questa aggiunta a watsonx.data migliora le nostre capacità vettoriali e rafforza le nostre capacità di retrieval-augmented generation ed embedding.

DataStax è ottimizzato per le applicazioni di gen AI in lettura e scrittura e workload operativi che richiedono prestazioni in tempo reale, elevata disponibilità e scalabilità, offrendo alle organizzazioni la velocità, l'affidabilità e il supporto multimodale necessari per le moderne applicazioni AI.

DataStax si connette inoltre perfettamente con Langflow, che sarà presto disponibile come parte di IBM® watsonx.ai. Langflow è uno strumento open source con oltre 60.000 stelle GitHub, che consente agli sviluppatori di prototipare, creare e distribuire retrieval-augmented generation e applicazioni AI multi-agente attraverso un'interfaccia intuitiva a uso limitato di codice per ridurre gli attriti nello sviluppo e accelerare il time to value.

Disponibilità generale dell'anteprima di Think 2025

Abbiamo annunciato l'anteprima chiusa di queste funzionalità a Think 2025, condividendo il palco con illustri relatori ospiti durante la sessione principale dei dati, le sessioni spotlight e le demo di techbyte, che stanno aprendo la strada all'innovazione dei dati e dell'AI nei loro settori.

Lockheed Martin è salita sul palco insieme a Meta. Lockheed ha recentemente utilizzato la trasformazione di watsonx.data, consentendo a 70.000 ingegneri, scienziati e tecnici di recuperare risposte e informazioni da milioni di documenti utilizzando il linguaggio naturale. "Stiamo accelerando rapidamente la nostra innovazione ed efficienza, per far uscire le soluzioni dal laboratorio e portarle sul campo, contribuendo a creare un mondo più sicuro e protetto", afferma John Clark, vicepresidente senior della divisione Tecnologia e innovazione strategica di Lockheed.

EY recentemente ha presentato le rivoluzionarie soluzioni di conformità fiscale globale basate su AI che affrontano le maggiori sfide che i dipartimenti fiscali devono affrontare, costruite con watsonx. "EY fornisce servizi fiscali in oltre 150 paesi e, quasi universalmente, in questi paesi i nostri clienti hanno problemi con i dati", afferma Christopher Aiken, Americas Indirect Tax AI Leader di EY. "watsonx ha ridotto il nostro impegno umano per la pulizia, l'arricchimento e la recensione dei dati del 30-50%".

L'USAA sta sfruttando la gen AI per guidare il futuro delle assicurazioni e migliorare l'esperienza del cliente. "Nel settore assicurativo gestiamo una quantità significativa di dati non strutturati", afferma Ramnik Bajaj, Chief Data Analytics e AI Officer di USAA. "Ad esempio, i verbali di ispezione delle abitazioni, i verbali di polizia e le immagini degli incidenti contengono pochissimi dati strutturati. Con la gen AI, abbiamo l'opportunità di estrarre attributi chiave e insight da questi dati non strutturati, rendendoli molto più accessibili e utili per sottoscrittori, periti e rappresentanti dell'assistenza".

Inizia oggi con watsonx.data

Ora puoi iniziare con l'evoluzione watsonx.data come parte dell'edizione premium.

Maggiori informazioni

Prova una prova gratuita con 2000 USD di crediti gratuiti

Contattaci per iniziare