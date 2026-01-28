Utilizzando Astra DB on IBM® watsonx.data come database vettoriale e Langflow per accelerare l'iterazione durante la costruzione di sistemi RAG, Shorthills ottiene un miglioramento del 60% nel richiamo e nella precisione.
Le moderne tecniche di intelligenza artificiale, come il recupero semantico e la retrieval-augmented generation (RAG), possono ridurre il tempo che gli studi legali dedicano a esaminare lunghi documenti. Queste lavorano tramite l'individuazione di sezioni concettualmente rilevanti, il riepilogo di ciò che è rilevante e la restituzione di citazioni tracciabili in modo che i risultati possano essere convalidati.
Fatto nel modo giusto, questo trasforma la ricerca legale da un workflow manuale "open-ten-tabs" in un'esperienza di ricerca guidata e supportata da prove, senza sacrificare il rigore richiesto dai team legali. Nella ricerca legale, gli utenti non hanno bisogno solo di una risposta: hanno bisogno della risposta giusta. Tale risposta deve essere corroborata dalle autorità competenti, dalle eccezioni pertinenti e dai passaggi esatti che è possibile citare, e il più rapidamente possibile.
Con questo obiettivo in mente, Shorthills AI, con sede nel New Jersey, ha sviluppato un framework di agenti di AI generativa sotto forma di chatbot ottimizzati per domini specifici, utilizzando RAG e grafici di conoscenza. Questo framework fornisce insight basati sull'AI per il settore legale, dove rilevanza, completezza e fonti verificabili contano tanto quanto la velocità pura.
Utilizzando Astra DB su IBM watsonx.data come database vettoriale e Langflow per accelerare l'iterazione durante la costruzione di sistemi RAG, Shorthills ottiene un miglioramento del 60% nel richiamo e nella precisione.
Le soluzioni IBM contribuiscono anche a migliorare di quattro volte la completezza, ossia la capacità dei risultati di catturare i dettagli e gli aspetti della richiesta dell'utente. Offrono inoltre un miglioramento di nove volte della diversità, ovvero la capacità di offrire agli utenti più interpretazioni e angolazioni anziché una singola linea di ragionamento. Questa caratteristica è fondamentale per preparare argomentazioni e confutazioni nei workflow legali.
I dipartimenti legali, che setacciano un set di dati di centinaia di migliaia di documenti legali, richiedono un recupero affidabile, molteplici punti di vista su un problema e la capacità di risalire ai risultati fino ai documenti di origine. Ottenere il 70% della risposta può comportare rischi significativi, senza tralasciare che le allucinazioni non sono accettabili.
Un vincolo fondamentale per molti clienti legali è la distribuzione. Alcune organizzazioni potrebbero non essere in grado di condividere dati sensibili in contenuti legali con hyperscaler a causa di vincoli normativi. Questi vincoli potrebbero richiedere che una base di conoscenza rimanga on-premise, ad esempio contenuti che includono informazioni di identificazione personale (PII) o informazioni sanitarie protette (PHI).
Il sistema legale AI di Shorthills è costituito da due pipeline:
I file vengono importati in un data lake e poi preparati in modo che il recupero funzioni in modo affidabile su larga scala:
Per quanto riguarda le query, Shorthills adotta una filosofia pragmatica per il proprio ambiente di produzione: evitare di fare affidamento su un unico metodo di ricerca universale.
Per implementare questo approccio, il sistema include dei router che inviano una query alla ricerca per parole chiave, vettoriale o grafica, a seconda dell'intento dell'utente. Ogni opzione comporta diversi compromessi in termini di tempi e costi.
Altre considerazioni critiche includono:
Infine, l'esperienza va oltre un'interfaccia solo per chat. In questo caso d'uso, gli utenti possono recuperare più tipi di sorgenti di dati, inclusi documenti Word, immagini, PDF e file di testo.
Una ragione chiave per cui Shorthills ha scelto di costruire questa piattaforma di assistenti AI con lo stack IBM derivava dalle realtà dell’implementazione aziendale nel mondo legale:
Questi processi dovevano operare entro parametri ingegneristici pratici: gli LLM richiedono molto calcolo e la scalabilità on-premise richiede il giusto tempo di esecuzione e gli strumenti di implementazione per l'efficienza.
In termini di risultati misurabili per l'utente finale, Shorthills ha riportato:
L'impatto è concreto: miglioramento del richiamo e della precisione, maggiore completezza e diversità e supporto delle citazioni di alta qualità. Questo risultato si traduce nel fatto che gli utenti finali dedicano meno tempo alla ricerca del materiale e più tempo alla sua valutazione.
La lezione fondamentale di Shorthills è che la ricerca di soluzioni di AI in ambito produttivo è un esercizio di ingegneria iterativo. Il passaggio da una manciata di documenti a migliaia (e oltre) modifica il problema. In definitiva, la "ricerca" diventa un percorso di miglioramento continuo, che si evolve attraverso la ricerca per parole chiave, vettori, ibridi e grafici, con un routing attento in modo che latenza e costi rimangano prevedibili.
Basandosi su IBM watsonx.data e Langflow, Shorthills ha implementato un sistema di ricerca basato su AI per professionisti legali in grado di operare su scala aziendale, gestire i vincoli aziendali, compresi i requisiti on-premise. Il sistema offre guadagni di rilevanza misurabili e fornisce le citazioni e l'ampiezza delle prospettive di cui gli utenti legali hanno bisogno per determinare i risultati con sicurezza.
Esigenze simili dei clienti e requisiti di governance esistono in settori come la sanità e i servizi finanziari. La scalabilità dell'infrastruttura sottostante ci permette di distribuire soluzioni simili in molteplici settori e in tutto il mondo.
Come prossimo passo, Shorthills vede questa base di recupero estendersi anche ai workflow basati su agenti. In questi workflow, un agente può fare ricerca, redigere e confezionare output per recensioni umane senza dover ricostruire ogni volta i dati sottostanti e lo stack.