Che cos'è ReWOO?

Autore

Staff Writer

IBM Think

ReWOO (abbreviazione di "reasoning without observation") è un framework di ragionamento che rende i modelli linguistici di grandi dimensioni (LLM) più convenienti e accurati in alcune applicazioni di ragionamento complesse. I modelli con ReWoo avviano un processo di ragionamento riguardo a un problema prima di provare a risolverlo, portando a una maggiore efficienza, precisione e robustezza in caso di guasto dello strumento.

I primi LLM (come i modelli GPT-1 e GPT-2 di OpenAI) hanno fornito risposte dirette; la successiva ondata di modelli a catena di pensiero che ha debuttato nel 2022 ha aggiunto un elemento di ragionamento esternalizzato, con modelli che essenzialmente "pensano ad alta voce" man mano che arrivavano a una risposta, migliorando l'accuratezza e la spiegabilità.

Successivamente è arrivata una generazione di modelli linguistici aumentati ("sistemi ALM") e agenti AI, che hanno aggiunto funzionalità di tool calling a questo ragionamento. I primi framework ALM, come ReAct, utilizzano un ciclo pensa-agisci-osserva, dove il sistema osserva ciò che genera prima di iniziare a pensare nuovamente. Sebbene generalmente efficaci, framework come ReACT possono richiedere un forte consumo di token, poiché ogni successiva chiamata agli strumenti deve includere tutta la cronologia della conversazione che la precede, un costo che si aggrava a ogni passaggio.

ReWoo si allontana dal modello pensa-agisci-osserva disaccoppiando il ragionamento dalle osservazioni esterne, consentendo al modello di pianificare la propria catena di ragionamento internamente prima di invocare selettivamente strumenti o recuperare informazioni. Questa separazione riduce gli inutili avanti e indietro e consente al modello di mantenere un piano per tutta la durata del compito.

Newsletter di settore

Le ultime tendenze in materia di AI, proposte da esperti

Ricevi insight selezionati sulle notizie più importanti e interessanti sull'AI. Iscriviti alla nostra newsletter settimanale Think. Leggi l'Informativa sulla privacy IBM.

Come funziona ReWOO

ReWoo utilizza tre moduli distinti, che dividono e risolvono compiti complessi. Innanzitutto, un modulo Planner traccia un blueprint di come si comporterà il modello in base al prompt. In secondo luogo, un modulo Worker esegue il piano, chiamando strumenti esterni (senza ripetere costose chiamate API LLM per "pensare", come in ReAct). Infine, un modulo Solver prende i piani e le prove, sintetizzando la risposta finale.

Anche se la differenza di approccio può sembrare minore, i risultati sono notevoli: ReWoo si comporta altrettanto bene (o leggermente meglio) di ReAct rispetto ad alcuni benchmark, il tutto utilizzando circa l'80% in meno di token. (Un token è un'unità di significato semantico per un modello di intelligenza artificiale; più token, maggiore è il costo operativo.) Ad esempio, nel set di dati HotpotQA (una serie di domande utilizzate per valutare i sistemi AI), ReWOO ottiene una precisione del 42,4% utilizzando 2.000 token, mentre ReAct raggiunge una precisione del 40,8% utilizzando 10.000 token.

Fondamentalmente, questa ottimizzazione dell'efficienza dei token rende i modelli di ragionamento economicamente praticabili su larga scala.

ReAct vs. ReWOO: un esempio nel mondo reale

Per illustrare la differenza tra questi due comuni framework di AI generativa, esaminiamo un caso d'uso specifico. Considera i diversi modi in cui un sistema ReAct vs. ReWOO risponderebbe a una domanda dell'utente che chiede aiuto per fare le valigie per un viaggio che prevede un volo tra New York e Chicago domani, seguito da un viaggio a Milwaukee il giorno dopo.

Un sistema ReAct scomporrebbe il problema in una sequenza di tre cicli di pensiero-azione-osservazione prima di dare la sua risposta finale. Nel primo ciclo, penserebbe: "Devo controllare il meteo di domani a New York", usando la Retrieval-augmented generation (RAG) per cercare il meteo (un'azione), osservando infine il risultato. Questo risultato serve quindi come input per un altro ciclo pensa-agisci-osserva in tre fasi per il meteo di Chicago. In terzo luogo, farebbe lo stesso per il meteo di Milwaukee. Infine, raccoglierebbe i risultati in un output (ad es. "Porta vari strati, perché diventa più freddo con ogni spostamento").

Un sistema in stile ReWOO, al contrario, guadagnerebbe efficienza facendo tutta la pianificazione in anticipo. Per prima cosa, pianificherebbe: "Devo sapere che tempo farà domani a New York, domani a Chicago e dopodomani a Milwaukee". Successivamente, funzionerebbe richiamando le API meteo in un'unica sequenza serrata (o potenzialmente in parallelo), senza dover effettuare alcuna "riflessione" costosa in questa fase fondamentale. Infine, offrirebbe la soluzione, raccogliendo le prove e producendo una risposta finale.

Agenti AI

5 tipi di agenti AI: funzioni autonome e applicazioni nel mondo reale

Scopri come l'AI basata sugli obiettivi e sulle utilità si adatta ai workflow e agli ambienti complessi.

Sviluppa, distribuisci e monitora gli agenti AI

Benefici e svantaggi di ReWOO

Oltre all'efficienza dei token, ReWOO dimostra un ulteriore beneficio: la robustezza in caso di guasto degli strumenti. Se uno strumento non funziona in ReACT, ad esempio, il sistema può rimanere bloccato in un ciclo infinito (poiché l'LLM interroga ripetutamente un database danneggiato per il meteo di Chicago, ad esempio).

ReWOO è più agile. Anche se uno strumento non riesce a restituire una determinata prova, il piano generale iniziale è ancora valido: il modulo Worker può progredire e il modulo Solver sarà in grado di fornire almeno una risposta parziale. Nell'esempio del meteo, invece di rimanere intrappolato in un ciclo infinito o eccessivo di interrogazione di un database per il meteo di Chicago, il modulo Solver restituirebbe almeno una risposta che informa l'utente del meteo di New York e di Milwaukee (supponendo che il modulo Worker sia in grado di recuperare queste prove), che in definitiva potrebbe essere sufficientemente utile per le esigenze di pianificazione dell'utente.

Nonostante i benefici di ReWOO, non è un framework universalmente superiore; è semplicemente migliore per determinati tipi di lavori, in particolare quando i tipi e le quantità di prove necessarie sono regolari e prevedibili. Dove ReWOO non è all'altezza, tuttavia, sono i problemi meno prevedibili o strutturati che possono richiedere creatività, esplorazione o improvvisazione. Con le incognite note, ReWOO eccelle, ma con le incognite sconosciute, annaspa.

Ad esempio, ReWoo non sarebbe ottimale per il debug del codice Python, un processo esplorativo e iterativo in cui ogni correzione potrebbe produrre nuovi errori e indizi, con i piani migliori che vengono rapidamente ovviati. Un framework più adattabile come ReACT, anche se meno efficiente in termini di token in astratto, alla fine sarebbe una soluzione migliore per un problema del genere.

Come implementare ReWOO

Come con la maggior parte dei sistemi e dei framework AI, sono disponibili vari approcci per l'implementazione dei workflow ReWOO. Un'implementazione "ufficiale" del framework, che è stata descritta per la prima volta dal ricercatore Binfeng Xu (insieme ai suoi colleghi, nel 2023[1]), è disponibile tramite Github. Anche i framework GenAI come LangGraph (che chiama i suoi moduli "nodi") e il relativo LangChain sono molto popolari. È disponibile anche una metodologia di ragionamento multi-step in stile ReWOO utilizzando Granite di IBM®.

Si può iniziare con ReWOO a livello concettuale in qualsiasi ambiente LLM con un prompt ben congegnato che semplicemente incoraggia l'AI a elaborare un piano passo dopo passo per rispondere alle domande successive prima di procedere all'input di qualsiasi strumento.

Ad esempio, il documento che descrive per la prima volta ReWOO include esempi di prompt, tra cui uno che inizia così: "Per il seguente compito, elabora piani che possano risolvere il problema passo dopo passo. Per ogni piano, indica quale strumento esterno insieme all'input dello strumento per recuperare le prove". Gli autori dello studio aggiungono, tuttavia, che "ReWOO è un paradigma generale e i prompt non sono necessariamente fissi. Incoraggiamo i lettori e gli utenti ad adattare i prompt in base alle proprie esigenze".¹

Inizia a realizzare il ROI: una guida pratica all'agentic AI

Scopri come essere sempre un passo avanti, scalando l'AI in tutta l'azienda con successo e risultati reali.

Risorse

Aumenta la produttività con agenti AI progettati per la tua azienda

Esplora il potenziale rivoluzionario degli agenti AI che possono integrarsi facilmente nelle tue operazioni aziendali.

Guida all'acquisto degli agenti AI 2025

Immergiti in questa guida completa che analizza i principali casi d'uso, le funzionalità di base e i consigli dettagliati per aiutarti a scegliere le soluzioni giuste per la tua attività.

Reinventa la produttività aziendale con agenti e assistenti AI

Scopri come gli agenti e gli assistenti basati su AI possono collaborare per raggiungere nuovi livelli di produttività.

Rapporto Omdia sull'intelligenza potenziata: l'impatto degli agenti AI

Scopri come sbloccare il pieno potenziale della gen AI con gli agenti AI.

Arriva l'agentic enterprise: mettere l'AI al servizio di tutta la tua tecnologia

Rimani aggiornato sui nuovi agenti AI emergenti, un punto di svolta fondamentale nella rivoluzione dell'AI.

Prova watsonx Orchestrate

Esplora come gli assistenti di AI generativa possono alleggerire il tuo workload e migliorare la produttività.

Come gli agenti AI reinventeranno la produttività

Impara come usare l'AI per essere più creativo ed efficiente e iniziare ad adattarti a un futuro che implica la collaborazione a stretto contatto con gli agenti AI.

Il futuro degli agenti, il consumo energetico dell'AI, l'utilizzo di computer Anthropic e la filigrana di Google sul testo generato dall'AI

Rimani sempre un passo avanti grazie ai nostri esperti di AI in questa puntata di Mixture of Experts, nel corso della quale approfondiranno il futuro degli agenti AI e molto altro.

Come Comparus utilizza un "assistente bancario"

Comparus ha utilizzato le soluzioni di IBM watsonx.ai e ha dimostrato in modo impressionante il potenziale del conversational banking come nuovo modello di interazione.

Soluzioni correlate

Agenti AI per il Business

Crea, implementa e gestisci assistenti e agenti AI potenti che automatizzano workflow e processi con l'AI generativa.

Scopri watsonx Orchestrate

Soluzioni per agenti AI IBM

Costruisci il futuro della tua azienda con soluzioni AI di cui puoi fidarti.

Esplora le soluzioni basate su agenti AI

Servizi AI di IBM Consulting

I servizi di AI di IBM Consulting aiutano a reinventare il modo in cui le aziende lavorano con l'AI per la trasformazione.

Esplora i servizi di intelligenza artificiale

Prossimi passi

Sia che tu scelga di personalizzare app e competenze precostituite o di creare e implementare servizi di agenti personalizzati utilizzando uno studio di AI, la piattaforma IBM watsonx è la soluzione che fa per te.