O que é ReWOO?

Autora

David Zax

Staff Writer

IBM Think

ReWOO [abreviação de "reasoning without observation (raciocínio sem observação)"] é um framework de raciocínio que torna os grandes modelos de linguagem (LLMs) mais econômicos e precisos em algumas aplicações de raciocínio complexas. Modelos com ReWOO envolvem-se em um processo de raciocínio em torno de um problema antes de tentar resolvê-lo, levando a uma eficiência, precisão e robustez muito maiores em falhas de ferramentas.

Os primeiros LLMs (como os modelos GPT-1 e GPT-2 da OpenAI) ofereciam respostas diretamente; a onda subsequente de modelos de cadeia de pensamento que estreou em 2022 adicionou um elemento de raciocínio externalizado, com modelos essencialmente "pensando em voz alta" ao chegar a uma resposta, melhorando a precisão e a explicabilidade. 

Em seguida, veio uma geração de modelos de linguagem aumentada ("sistemas ALM") e agentes de IA, que adicionaram recursos de chamada de ferramentas a esse raciocínio. Os primeiros frameworks de ALM (como o ReAct) empregam um padrão de pensamento-ação-observação, em que o sistema observa o que gera antes de começar a pensar novamente. Embora geralmente eficazes, frameworks como o ReAct podem exigir consumo pesado de tokens, pois cada chamada de ferramenta subsequente deve incluir todo o histórico de conversas que a precede, um custo que se agrava com cada etapa. 

O ReWOO rompe com o padrão pensar-agir-observar ao desacoplar o raciocínio de observações externas, permitindo que o modelo planeje sua cadeia de raciocínio internamente antes de invocar seletivamente ferramentas ou recuperar informações. Essa separação reduz as idas e vindas desnecessárias e permite que o modelo mantenha um plano durante toda a tarefa.

As mais recentes tendências em IA, trazidas a você por especialistas

Receba insights selecionados sobre as notícias mais importantes (e intrigantes) sobre IA. Inscreva-se no nosso boletim informativo semanal Think. Consulte a Declaração de privacidade da IBM.

Agradecemos a você! Você se inscreveu.

Sua assinatura será entregue em inglês. Você encontrará um link para cancelar a assinatura em cada boletim informativo. Você pode gerenciar suas assinaturas ou cancelar a assinatura aqui. Consulte nossa Declaração de privacidade da IBM para obter mais informações.

Como o ReWOO funciona

O ReWOO emprega três módulos distintos, que dividem e conquistam tarefas complexas. Primeiro, um módulo Planner mapeia um blueprint de como o modelo se comportará com base no prompt do usuário. Em segundo lugar, um módulo Worker executa o plano, chamando ferramentas externas (sem repetir chamadas caras da APIs de LLMs para “pensar”, como no ReAct). Finalmente, um módulo Solver reúne os planos e as evidências, sintetizando a resposta final. 

Embora a diferença na abordagem possa parecer pequena, os resultados são drásticos: o ReWOO tem um desempenho tão bom (ou um pouco melhor) do que o ReAct em alguns benchmarks— tudo isso enquanto usa cerca de 80% menos tokens. (Um token é uma unidade de significado semântico para um modelo de IA; quanto mais tokens, maior o custo de operação.) Por exemplo, no conjunto de dados HotpotQA (uma bateria de perguntas usadas para avaliar sistemas de IA), o ReWOO alcança 42,4% de precisão usando 2.000 tokens, enquanto o ReAct alcança 40,8% de precisão usando 10.000 tokens.  

Crucialmente, essa otimização da eficiência de tokens torna os modelos de raciocínio economicamente viáveis em escala.

ReAct versus ReWOO: um exemplo do mundo real

Para ilustrar a diferença entre esses dois frameworks comuns de IA generativa, vamos examinar um caso de uso específico. Considere as diferentes maneiras pelas quais um sistema ReAct versus ReWOO lidaria com uma consulta de usuário pedindo ajuda para fazer as malas para uma viagem que envolvesse um voo entre Nova York e Chicago no dia seguinte, seguido de uma viagem de carro para Milwaukee um dia depois.

Um sistema ReAct decomporia o problema em uma sequência de três ciclos de pensamento-ação-observações antes de dar sua resposta final. No primeiro ciclo, ele pensaria: "Preciso verificar o clima de amanhã em Nova York" usando geração aumentada de recuperação (RAG) para procurar esse clima (uma ação), por fim observando o resultado. Esse resultado serve como entrada para outro ciclo de pensar-agir-observar de três etapas para o clima de Chicago. Em terceiro lugar, faria o mesmo com o clima de Milwaukee. Por fim, ele reuniria suas descobertas em uma saída (por exemplo, “Leve bastante roupa de frio, porque fica mais frio em cada local”). 

Diagrama do ReACT

Um sistema no estilo ReWOO, por outro lado, ganharia eficiência ao fazer todo o planejamento antecipadamente. Primeiro, planejaria: "Preciso ter o clima de Nova York amanhã, o clima de Chicago amanhã e o clima de Milwaukee no dia seguinte". Em seguida, funcionaria, chamando APIs meteorológicas em uma sequência rígida (ou potencialmente em paralelo), sem fazer qualquer “pensamento” dispendioso nesta etapa de trabalho árduo. Por fim, resolveria, reunindo as evidências e produzindo uma resposta final.  

Diagrama do ReWOO
Agentes de IA

Cinco tipos de agentes de IA: funções autônomas e aplicações no mundo real

Saiba como a IA orientada por objetivos e baseada em utilidade se adapta a fluxos de trabalho e ambientes complexos.

Benefícios e desvantagens do ReWOO

Além da eficiência de tokens, o ReWOO demonstra um benefício adicional: robustez sob falhas de ferramentas. Se uma ferramenta falhar no ReAct, por exemplo, o sistema pode ficar preso em um loop infinito (à medida que o LLM consulta repetidamente um banco de dados defeituoso para o clima em Chicago, por exemplo).

O ReWOO é mais ágil. Mesmo que uma ferramenta não consiga retornar uma determinada evidência, o plano inicial abrangente ainda estará em vigor: o módulo Worker poderá progredir, e o módulo Solver poderá fornecer pelo menos uma resposta parcial. No exemplo do clima, em vez de ficar preso em um loop infinito ou excessivo consultando um banco de dados sobre o clima de Chicago, o módulo Solver pelo menos retornaria uma resposta informando ao usuário sobre o clima em Nova York e Milwaukee (supondo que o módulo Worker tenha conseguido recuperar esses bits de evidências), o que poderia, em última análise, ser suficientemente útil para as necessidades de planejamento do usuário. 

Apesar dos benefícios do ReWOO, ele não é um framework universalmente superior; é simplesmente melhor para certos tipos de trabalhos, especialmente quando os tipos e quantidades de evidências necessárias são regulares e previsíveis. No entanto, onde o ReWOO fica aquém do esperado, há problemas menos previsíveis ou estruturados que podem exigir criatividade, exploração ou improvisação. Com desconhecidos conhecidos, o ReWOO se destaca; mas com desconhecidos, ele naufraga.

Por exemplo, o ReWOO não seria ideal para depurar código Python, um processo exploratório e iterativo em que cada correção pode gerar novos erros e pistas, com os planos mais bem elaborados rapidamente se tornando obsoletos. Um framework mais adaptável como o ReAct, embora menos eficiente em termos de tokens em abstrato, acabaria por ser mais adequado para esse problema. 

Como implementar o ReWOO

Como acontece com a maioria dos sistemas e frameworks de IA, várias abordagens estão disponíveis para a implementação de fluxos de trabalho do ReWOO. Uma implementação "oficial" do framework, que foi descrita pela primeira vez pelo pesquisador Binfeng Xu (junto com seus colegas, em 2023[1]), está disponível via Github. Frameworks de IA generativa, como o LangGraph (que chama seus módulos de “nós”) e o LangChain relacionado, também são populares. E uma metodologia de raciocínio em vários passos no estilo ReWOO também está disponível usando o Granite da IBM.

Pode-se começar a usar o ReWOO em um nível conceitual em qualquer ambiente de LLM com um prompt bem elaborado que simplesmente incentiva a IA a elaborar um plano passo a passo para responder às perguntas subsequentes antes de avançar para qualquer entrada de ferramenta. 

O artigo que descrevia o ReWOO pela primeira vez, por exemplo, incluía exemplos de prompts, incluindo um que começa: "Para a tarefa a seguir, faça planos que possam resolver o problema passo a passo. Para cada plano, indique qual ferramenta externa, junto com a entrada da ferramenta, para recuperar evidências." Os autores do estudo acrescentaram, no entanto, que “O ReWOO é um paradigma geral, e os prompts não são necessariamente fixos. Incentivamos os leitores e usuários a ajustar os prompts sob medida às suas próprias necessidades."1

Soluções relacionadas
Agentes de IA para empresas

Crie, implemente e gerencie assistentes e agentes de IA potentes que automatizam fluxos de trabalho e processos com a IA generativa.

    Explore o watsonx Orchestrate
    Soluções de agentes de IA da IBM

    Construa o futuro do seu negócio com soluções de IA em que você pode confiar.

    Explore soluções de agentes de IA
    Serviços de IA do IBM® Consulting

    Os serviços de IA da IBM Consulting ajudam a reinventar a forma como as empresas trabalham com IA para gerar transformação.

    Explore os serviços de inteligência artificial
    Dê o próximo passo

    Se você optar por personalizar aplicativos e habilidades criados previamente ou criar e implementar serviços agênticos personalizados usando um estúdio de IA, a plataforma IBM watsonx tem aquilo de que você precisa.

    Explore o watsonx Orchestrate Explore o watsonx.ai
    Notas de rodapé

    1. "ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models," Binfeng Xu, Zhiyuan Peng, Bowen Lei, Subhabrata Mukherjee, Yuchen Liu, Dongkuan Xu. Arxiv.org, 23 de maio de 2023.