Che cos'è ReWOO?

Autore

David Zax

Staff Writer

IBM Think

ReWOO (abbreviazione di "reasoning without observation") è un framework di ragionamento che rende i modelli linguistici di grandi dimensioni (LLM) più convenienti e accurati in alcune applicazioni di ragionamento complesse. I modelli con ReWoo avviano un processo di ragionamento riguardo a un problema prima di provare a risolverlo, portando a una maggiore efficienza, precisione e robustezza in caso di guasto dello strumento.

I primi LLM (come i modelli GPT-1 e GPT-2 di OpenAI) hanno fornito risposte dirette; la successiva ondata di modelli a catena di pensiero che ha debuttato nel 2022 ha aggiunto un elemento di ragionamento esternalizzato, con modelli che essenzialmente "pensano ad alta voce" man mano che arrivavano a una risposta, migliorando l'accuratezza e la spiegabilità. 

Successivamente è arrivata una generazione di modelli linguistici aumentati ("sistemi ALM") e agenti AI, che hanno aggiunto funzionalità di tool calling a questo ragionamento. I primi framework ALM, come ReAct, utilizzano un ciclo pensa-agisci-osserva, dove il sistema osserva ciò che genera prima di iniziare a pensare nuovamente. Sebbene generalmente efficaci, framework come ReACT possono richiedere un forte consumo di token, poiché ogni successiva chiamata agli strumenti deve includere tutta la cronologia della conversazione che la precede, un costo che si aggrava a ogni passaggio. 

ReWoo si allontana dal modello pensa-agisci-osserva disaccoppiando il ragionamento dalle osservazioni esterne, consentendo al modello di pianificare la propria catena di ragionamento internamente prima di invocare selettivamente strumenti o recuperare informazioni. Questa separazione riduce gli inutili avanti e indietro e consente al modello di mantenere un piano per tutta la durata del compito.

Le ultime tendenze in materia di AI, proposte da esperti

Ricevi insight selezionati sulle notizie più importanti e interessanti sull'AI. Iscriviti alla nostra newsletter settimanale Think. Leggi l'Informativa sulla privacy IBM.

Grazie per aver effettuato l'iscrizione!

L'abbonamento sarà fornito in lingua inglese. Troverai un link per annullare l'iscrizione in tutte le newsletter. Puoi gestire i tuoi abbonamenti o annullarli qui. Per ulteriori informazioni, consulta l'Informativa sulla privacy IBM.

Come funziona ReWOO

ReWoo utilizza tre moduli distinti, che dividono e risolvono compiti complessi. Innanzitutto, un modulo Planner traccia un blueprint di come si comporterà il modello in base al prompt. In secondo luogo, un modulo Worker esegue il piano, chiamando strumenti esterni (senza ripetere costose chiamate API LLM per "pensare", come in ReAct). Infine, un modulo Solver prende i piani e le prove, sintetizzando la risposta finale. 

Anche se la differenza di approccio può sembrare minore, i risultati sono notevoli: ReWoo si comporta altrettanto bene (o leggermente meglio) di ReAct rispetto ad alcuni benchmark, il tutto utilizzando circa l'80% in meno di token. (Un token è un'unità di significato semantico per un modello di intelligenza artificiale; più token, maggiore è il costo operativo.) Ad esempio, nel set di dati HotpotQA (una serie di domande utilizzate per valutare i sistemi AI), ReWOO ottiene una precisione del 42,4% utilizzando 2.000 token, mentre ReAct raggiunge una precisione del 40,8% utilizzando 10.000 token.  

Fondamentalmente, questa ottimizzazione dell'efficienza dei token rende i modelli di ragionamento economicamente praticabili su larga scala.

ReAct vs. ReWOO: un esempio nel mondo reale

Per illustrare la differenza tra questi due comuni framework di AI generativa, esaminiamo un caso d'uso specifico. Considera i diversi modi in cui un sistema ReAct vs. ReWOO risponderebbe a una domanda dell'utente che chiede aiuto per fare le valigie per un viaggio che prevede un volo tra New York e Chicago domani, seguito da un viaggio a Milwaukee il giorno dopo.

Un sistema ReAct scomporrebbe il problema in una sequenza di tre cicli di pensiero-azione-osservazione prima di dare la sua risposta finale. Nel primo ciclo, penserebbe: "Devo controllare il meteo di domani a New York", usando la Retrieval-augmented generation (RAG) per cercare il meteo (un'azione), osservando infine il risultato. Questo risultato serve quindi come input per un altro ciclo pensa-agisci-osserva in tre fasi per il meteo di Chicago. In terzo luogo, farebbe lo stesso per il meteo di Milwaukee. Infine, raccoglierebbe i risultati in un output (ad es. "Porta vari strati, perché diventa più freddo con ogni spostamento"). 

Diagramma ReACT

Un sistema in stile ReWOO, al contrario, guadagnerebbe efficienza facendo tutta la pianificazione in anticipo. Per prima cosa, pianificherebbe: "Devo sapere che tempo farà domani a New York, domani a Chicago e dopodomani a Milwaukee". Successivamente, funzionerebbe richiamando le API meteo in un'unica sequenza serrata (o potenzialmente in parallelo), senza dover effettuare alcuna "riflessione" costosa in questa fase fondamentale. Infine, offrirebbe la soluzione, raccogliendo le prove e producendo una risposta finale.  

Diagramma ReWOO
Agenti AI

5 tipi di agenti AI: funzioni autonome e applicazioni nel mondo reale

Scopri come l'AI basata sugli obiettivi e sulle utilità si adatta ai workflow e agli ambienti complessi.

Benefici e svantaggi di ReWOO

Oltre all'efficienza dei token, ReWOO dimostra un ulteriore beneficio: la robustezza in caso di guasto degli strumenti. Se uno strumento non funziona in ReACT, ad esempio, il sistema può rimanere bloccato in un ciclo infinito (poiché l'LLM interroga ripetutamente un database danneggiato per il meteo di Chicago, ad esempio).

ReWOO è più agile. Anche se uno strumento non riesce a restituire una determinata prova, il piano generale iniziale è ancora valido: il modulo Worker può progredire e il modulo Solver sarà in grado di fornire almeno una risposta parziale. Nell'esempio del meteo, invece di rimanere intrappolato in un ciclo infinito o eccessivo di interrogazione di un database per il meteo di Chicago, il modulo Solver restituirebbe almeno una risposta che informa l'utente del meteo di New York e di Milwaukee (supponendo che il modulo Worker sia in grado di recuperare queste prove), che in definitiva potrebbe essere sufficientemente utile per le esigenze di pianificazione dell'utente. 

Nonostante i benefici di ReWOO, non è un framework universalmente superiore; è semplicemente migliore per determinati tipi di lavori, in particolare quando i tipi e le quantità di prove necessarie sono regolari e prevedibili. Dove ReWOO non è all'altezza, tuttavia, sono i problemi meno prevedibili o strutturati che possono richiedere creatività, esplorazione o improvvisazione. Con le incognite note, ReWOO eccelle, ma con le incognite sconosciute, annaspa.

Ad esempio, ReWoo non sarebbe ottimale per il debug del codice Python, un processo esplorativo e iterativo in cui ogni correzione potrebbe produrre nuovi errori e indizi, con i piani migliori che vengono rapidamente ovviati. Un framework più adattabile come ReACT, anche se meno efficiente in termini di token in astratto, alla fine sarebbe una soluzione migliore per un problema del genere. 

Come implementare ReWOO

Come con la maggior parte dei sistemi e dei framework AI, sono disponibili vari approcci per l'implementazione dei workflow ReWOO. Un'implementazione "ufficiale" del framework, che è stata descritta per la prima volta dal ricercatore Binfeng Xu (insieme ai suoi colleghi, nel 2023[1]), è disponibile tramite Github. Anche i framework GenAI come LangGraph (che chiama i suoi moduli "nodi") e il relativo LangChain sono molto popolari. È disponibile anche una metodologia di ragionamento multi-step in stile ReWOO utilizzando Granite di IBM®.

Si può iniziare con ReWOO a livello concettuale in qualsiasi ambiente LLM con un prompt ben congegnato che semplicemente incoraggia l'AI a elaborare un piano passo dopo passo per rispondere alle domande successive prima di procedere all'input di qualsiasi strumento. 

Ad esempio, il documento che descrive per la prima volta ReWOO include esempi di prompt, tra cui uno che inizia così: "Per il seguente compito, elabora piani che possano risolvere il problema passo dopo passo. Per ogni piano, indica quale strumento esterno insieme all'input dello strumento per recuperare le prove". Gli autori dello studio aggiungono, tuttavia, che "ReWOO è un paradigma generale e i prompt non sono necessariamente fissi. Incoraggiamo i lettori e gli utenti ad adattare i prompt in base alle proprie esigenze".1

Soluzioni correlate
Agenti AI per il Business

Crea, implementa e gestisci assistenti e agenti AI potenti che automatizzano workflow e processi con l'AI generativa.

    Scopri watsonx Orchestrate
    Soluzioni per agenti AI IBM

    Costruisci il futuro della tua azienda con soluzioni AI di cui puoi fidarti.

    Esplora le soluzioni basate su agenti AI
    Servizi AI di IBM Consulting

    I servizi di AI di IBM Consulting aiutano a reinventare il modo in cui le aziende lavorano con l'AI per la trasformazione.

    Esplora i servizi di intelligenza artificiale
    Prossimi passi

    Sia che tu scelga di personalizzare app e competenze precostituite o di creare e implementare servizi di agenti personalizzati utilizzando uno studio di AI, la piattaforma IBM watsonx è la soluzione che fa per te.

    Scopri watsonx Orchestrate Esplora watsonx.ai
    Note a piè di pagina

    1. "ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models," Binfeng Xu, Zhiyuan Peng, Bowen Lei, Subhabrata Mukherjee, Yuchen Liu, Dongkuan Xu. Arxiv.org, 23 maggio 2024.