Intelligenza artificiale Compute e server Automazione IT

Produzione RAG per la ricerca legale: come Shorthills AI ha ampliato il recupero dei dati con IBM watsonx.data

Utilizzando Astra DB on IBM® watsonx.data come database vettoriale e Langflow per accelerare l'iterazione durante la costruzione di sistemi RAG, Shorthills ottiene un miglioramento del 60% nel richiamo e nella precisione.

Pubblicato il 28 gennaio 2026
Due donne d'affari impegnate in una discussione su un moderno tavolo da ufficio

Le moderne tecniche di intelligenza artificiale, come il recupero semantico e la retrieval-augmented generation (RAG), possono ridurre il tempo che gli studi legali dedicano a esaminare lunghi documenti. Queste lavorano tramite l'individuazione di sezioni concettualmente rilevanti, il riepilogo di ciò che è rilevante e la restituzione di citazioni tracciabili in modo che i risultati possano essere convalidati.

Fatto nel modo giusto, questo trasforma la ricerca legale da un workflow manuale "open-ten-tabs" in un'esperienza di ricerca guidata e supportata da prove, senza sacrificare il rigore richiesto dai team legali. Nella ricerca legale, gli utenti non hanno bisogno solo di una risposta: hanno bisogno della risposta giusta. Tale risposta deve essere corroborata dalle autorità competenti, dalle eccezioni pertinenti e dai passaggi esatti che è possibile citare, e il più rapidamente possibile.

Insight basati su AI per il settore legale

Con questo obiettivo in mente, Shorthills AI, con sede nel New Jersey, ha sviluppato un framework di agenti di AI generativa sotto forma di chatbot ottimizzati per domini specifici, utilizzando RAG e grafici di conoscenza. Questo framework fornisce insight basati sull'AI per il settore legale, dove rilevanza, completezza e fonti verificabili contano tanto quanto la velocità pura.

Utilizzando Astra DB su IBM watsonx.data come database vettoriale e Langflow per accelerare l'iterazione durante la costruzione di sistemi RAG, Shorthills ottiene un miglioramento del 60% nel richiamo e nella precisione.

Le soluzioni IBM contribuiscono anche a migliorare di quattro volte la completezza, ossia la capacità dei risultati di catturare i dettagli e gli aspetti della richiesta dell'utente. Offrono inoltre un miglioramento di nove volte della diversità, ovvero la capacità di offrire agli utenti più interpretazioni e angolazioni anziché una singola linea di ragionamento. Questa caratteristica è fondamentale per preparare argomentazioni e confutazioni nei workflow legali.

Applicazione pratica: ricerca di documenti legali su larga scala che migliora la pertinenza, la completezza e la fiducia

I dipartimenti legali, che setacciano un set di dati di centinaia di migliaia di documenti legali, richiedono un recupero affidabile, molteplici punti di vista su un problema e la capacità di risalire ai risultati fino ai documenti di origine. Ottenere il 70% della risposta può comportare rischi significativi, senza tralasciare che le allucinazioni non sono accettabili.

Un vincolo fondamentale per molti clienti legali è la distribuzione. Alcune organizzazioni potrebbero non essere in grado di condividere dati sensibili in contenuti legali con hyperscaler a causa di vincoli normativi. Questi vincoli potrebbero richiedere che una base di conoscenza rimanga on-premise, ad esempio contenuti che includono informazioni di identificazione personale (PII) o informazioni sanitarie protette (PHI).

Architettura tecnica: una pipeline scalabile per ricerca ibrida RAG/parola chiave e recupero di grafi

Il sistema legale AI di Shorthills è costituito da due pipeline:

  1. Acquisizione ed elaborazione di documenti e dati
  2. Query e recupero, progettati per supportare molteplici modalità di recupero (parola chiave, vettore e grafico) e per indirizzare le query alla tecnica giusta in base all'intento

1. Pipeline di acqusizione: dai file legali grezzi alle strutture ricercabili

I file vengono importati in un data lake e poi preparati in modo che il recupero funzioni in modo affidabile su larga scala:

  • Chunking dei documenti in pezzi più piccoli, ponendo particolare attenzione al chunking significativo (non una semplice suddivisione per caratteri e parole) aiuta a preservare il contesto come definizioni, citazioni e strutture argomentali.
  • Estrazione di entità basata su un modello linguistico di grandi dimensioni (LLM) identifica i campi legali rilevanti, come nome del giudice, nome del caso, tipo di caso, ID del documento e tipo di sentenza. Poi si costruisce un diagramma delle relazioni tra entità, in modo che le relazioni possano essere utilizzate in seguito durante la fase di recupero.
  • Embedding di documenti con un modello di embedding e la memorizzazione dei vettori risultanti supporta il recupero vettoriale e ibrido su larga scala. Shorthills si affida ad Astra DB come base di storage per i dati ricercabili.
Elaborazione di PDF e data storage Elaborazione dei PDF e data storage: i nuovi PDF vengono letti, suddivisi in blocchi di testo più piccoli (ad esempio, paragrafi o sezioni) e gli ID dei file elaborati vengono salvati nel CSV. Questo approccio crea un testo strutturato in blocchi, pronto per l'analisi e aggiorna il record di tracciamento per evitare la rielaborazione.
Chunking ed estrazione di relazioni tra entità Chunking ed estrazione delle relazioni tra entità: i blocchi vengono inviati ad Amazon Bedrock per rilevare entità, come persone, organizzazioni, e le loro relazioni, come "lavora in", "si trova in". L'output grezzo dell'LLM (testo non strutturato) viene temporaneamente memorizzato nella cache in un file JSON locale. Questi dati vengono poi analizzati in formati puliti e strutturati: entità come elementi etichettati e relazioni come connessioni tra di essi. Gli embedding (rappresentazioni numeriche) per i blocchi vengono inoltre generati e memorizzati in un database vettoriale per il recupero futuro.

2. Pipeline di query: routing, recupero ibrido e reranking per pertinenza e latenza

Per quanto riguarda le query, Shorthills adotta una filosofia pragmatica per il proprio ambiente di produzione: evitare di fare affidamento su un unico metodo di ricerca universale.

  • La ricerca per parole chiave è ancora importante per gli identificatori esatti, come i numeri o gli ID dei documenti.
  • La ricerca vettoriale migliora la corrispondenza semantica quando gli utenti pongono domande in linguaggio naturale, come riconoscere che "display" e "schermo" potrebbero riferirsi allo stesso concetto.
  • La ricerca grafica può cogliere i collegamenti tra i documenti, ma su larga scala può diventare lenta e affamata di memoria, quindi deve essere utilizzata in modo selettivo.
Pipeline di ricerca in cima alla knowledge base Pipeline di ricerca in cima alla knowledge base: una query utente passa attraverso l'API Gateway e diventa una ricerca ibrida (parola chiave e vettore) alimentata da Amazon Bedrock, dove i dati rilevanti vengono recuperati da watsonx. I dati vengono poi passati attraverso uno strato di deduplicazione e classificazione e restituiti all'utente come un risultato di ricerca raffinato e ricco di contesto.

Per implementare questo approccio, il sistema include dei router che inviano una query alla ricerca per parole chiave, vettoriale o grafica, a seconda dell'intento dell'utente. Ogni opzione comporta diversi compromessi in termini di tempi e costi.

Altre considerazioni critiche includono:

  • È necessaria un'implementazione di ricerca ibrida scalabile che combini la ricerca per parole chiave e vettoriali con funzionalità grafiche, ove appropriato. Questo approccio ottimizza l'accuratezza dei risultati e impedisce che i sistemi si intasino con la crescita dell'archivio dei documenti.
  • Il sistema include una fase di riclassificazione dopo il recupero per migliorare la rilevanza finale prima che i risultati vengano restituiti all'utente.

Infine, l'esperienza va oltre un'interfaccia solo per chat. In questo caso d'uso, gli utenti possono recuperare più tipi di sorgenti di dati, inclusi documenti Word, immagini, PDF e file di testo.

Benefici: flessibilità, sicurezza e scalabilità

Una ragione chiave per cui Shorthills ha scelto di costruire questa piattaforma di assistenti AI con lo stack IBM derivava dalle realtà dell’implementazione aziendale nel mondo legale:

  • Il supporto on-premise e la residenza dei dati sono essenziali per i clienti che non possono spostare dati sensibili su hyperscaler a causa della tolleranza al rischio o dei requisiti normativi.
  • IBM watsonx.data sblocca la possibilità di scalare la ricerca su grandi volumi di documenti.
  • La sicurezza di livello aziendale e un'architettura scalabile consentono soluzioni e agenti AI pronti per l'intelligenza artificiale realizzati con IBM watsonx.data e Langflow, un ambiente drag-and-drop a uso limitato di codice per lo sviluppo di agenti e pipeline RAG.

Questi processi dovevano operare entro parametri ingegneristici pratici: gli LLM richiedono molto calcolo e la scalabilità on-premise richiede il giusto tempo di esecuzione e gli strumenti di implementazione per l'efficienza.

In termini di risultati misurabili per l'utente finale, Shorthills ha riportato:

  • tempi di ricerca più rapidi e miglioramento di oltre il 60% nel richiamo e nella precisione;
  • un miglioramento di circa quattro volte in completezza e nove volte in diversità;
  • migliore supporto per i riferimenti e le citazioni nei risultati restituiti, che in precedenza mancavano.

L'impatto è concreto: miglioramento del richiamo e della precisione, maggiore completezza e diversità e supporto delle citazioni di alta qualità. Questo risultato si traduce nel fatto che gli utenti finali dedicano meno tempo alla ricerca del materiale e più tempo alla sua valutazione.

Una base costruita per scalare

La lezione fondamentale di Shorthills è che la ricerca di soluzioni di AI in ambito produttivo è un esercizio di ingegneria iterativo. Il passaggio da una manciata di documenti a migliaia (e oltre) modifica il problema. In definitiva, la "ricerca" diventa un percorso di miglioramento continuo, che si evolve attraverso la ricerca per parole chiave, vettori, ibridi e grafici, con un routing attento in modo che latenza e costi rimangano prevedibili.

Basandosi su IBM watsonx.data e Langflow, Shorthills ha implementato un sistema di ricerca basato su AI per professionisti legali in grado di operare su scala aziendale, gestire i vincoli aziendali, compresi i requisiti on-premise. Il sistema offre guadagni di rilevanza misurabili e fornisce le citazioni e l'ampiezza delle prospettive di cui gli utenti legali hanno bisogno per determinare i risultati con sicurezza.

Esigenze simili dei clienti e requisiti di governance esistono in settori come la sanità e i servizi finanziari. La scalabilità dell'infrastruttura sottostante ci permette di distribuire soluzioni simili in molteplici settori e in tutto il mondo.

Come prossimo passo, Shorthills vede questa base di recupero estendersi anche ai workflow basati su agenti. In questi workflow, un agente può fare ricerca, redigere e confezionare output per recensioni umane senza dover ricostruire ogni volta i dati sottostanti e lo stack.

Maggiori informazioni su IBM watsonx.data

Paramdeep Singh

Cofounder and President

Shorthills AI

Chad Jennings

Global Head of Customer Voice and Product Experience

IBM