Sapere come funzionano i modelli linguistici di grandi dimensioni è essenziale per capire perché a volte sbagliano. Gli LLM prevedono la parola successiva in una frase basandosi su schemi appresi da grandi quantità di testo. Non estraggono dati da un database, ma fanno ipotesi fondate. Questo può portare a risposte che sembrano accurate ma sono false, specialmente quando l'argomento è poco chiaro, raro o va oltre ciò su cui il modello è stato addestrato.

Le allucinazioni sono difficili da eliminare perché non sono bug nel sistema, sono una caratteristica intrinseca del funzionamento di questi modelli probabilistici. Quando nei dati di addestramento non è disponibile alcun modello solido, o quando un prompt è troppo vago o aperto, il modello potrebbe inventare qualcosa che sembra plausibile.

C'è anche una questione più filosofica in gioco. Quando un modello AI inventa qualcosa, sta fallendo o creando?

Puri osserva che man mano che i modelli diventano più potenti nel loro ragionamento, possono anche mostrare comportamenti più "creativi", al limite dell'allucinazione. "Si potrebbe sostenere che la creatività implichi una sorta di allucinazione", afferma. "Immagina l'inimmaginabile, ma nelle applicazioni aziendali questo è un limite, non un punto di forza."

Il ricercatore IBM Payel Das è tra coloro che cercano di affrontare la questione ripensando il modo in cui i modelli gestiscono le informazioni. "È il paradosso del progresso," dice Das a IBM Think in un'intervista. “Questi modelli stanno migliorando nel ragionamento, ma non necessariamente nella memorizzazione. Possono risolvere problemi più difficili, ma continuano a sbagliare le basi."

Il suo team presso IBM ha sviluppato Larimar, un sistema di aumento della memoria progettato per fornire ai modelli una forma di memoria a breve termine modificabile. L'idea è di permettere ai modelli di rivedere o dimenticare i fatti in base alle necessità, senza riqualificare l'intero sistema; una flessibilità in tempo reale che manca in gran parte agli attuali LLM.

"I modelli odierni sono statici e fragili", afferma. "Non puoi insegnare loro qualcosa a metà conversazione o aggiornare la loro comprensione senza riaddestrarli completamente. Larimar è un passo avanti verso una maggiore flessibilità."

Anche altri approcci basati sulla memoria si stanno rivelando promettenti. MemReasoner, sviluppato dai ricercatori Microsoft, si concentra sull'aiutare i modelli a ragionare in modo più efficace attraverso lunghe sequenze, selezionando e collegando informazioni rilevanti provenienti da parti precedenti di una conversazione. Il progetto CAMELoT di IBM è progettato per aiutare i modelli a rimanere coerenti quando si lavora con grandi volumi di testo o interazioni estese.

Al di fuori del laboratorio, aziende come Vectara stanno costruendo strumenti pratici per affrontare le allucinazioni. Gli "agenti guardiani" di Vectara monitorano gli output dell'AI in tempo reale e riscrivono gli errori prima che raggiungano gli utenti. Das sostiene che, sebbene non esista una soluzione univoca che possa risolvere il problema, combinare strategie di memoria e di revisione rappresenta un notevole passo avanti.

"Non elimineremo mai tutti gli errori", afferma Das. "Proprio come le persone commettono errori. Ma possiamo creare dei modelli che siano in grado di imparare, adattarsi e correggersi meglio. E questo fa una grande differenza."