O que é ReWOO?

Autora

Staff Writer

IBM Think

ReWOO [abreviação de "reasoning without observation (raciocínio sem observação)"] é um framework de raciocínio que torna os grandes modelos de linguagem (LLMs) mais econômicos e precisos em algumas aplicações de raciocínio complexas. Modelos com ReWOO envolvem-se em um processo de raciocínio em torno de um problema antes de tentar resolvê-lo, levando a uma eficiência, precisão e robustez muito maiores em falhas de ferramentas.

Os primeiros LLMs (como os modelos GPT-1 e GPT-2 da OpenAI) ofereciam respostas diretamente; a onda subsequente de modelos de cadeia de pensamento que estreou em 2022 adicionou um elemento de raciocínio externalizado, com modelos essencialmente "pensando em voz alta" ao chegar a uma resposta, melhorando a precisão e a explicabilidade.

Em seguida, veio uma geração de modelos de linguagem aumentada ("sistemas ALM") e agentes de IA, que adicionaram recursos de chamada de ferramentas a esse raciocínio. Os primeiros frameworks de ALM (como o ReAct) empregam um padrão de pensamento-ação-observação, em que o sistema observa o que gera antes de começar a pensar novamente. Embora geralmente eficazes, frameworks como o ReAct podem exigir consumo pesado de tokens, pois cada chamada de ferramenta subsequente deve incluir todo o histórico de conversas que a precede, um custo que se agrava com cada etapa.

O ReWOO rompe com o padrão pensar-agir-observar ao desacoplar o raciocínio de observações externas, permitindo que o modelo planeje sua cadeia de raciocínio internamente antes de invocar seletivamente ferramentas ou recuperar informações. Essa separação reduz as idas e vindas desnecessárias e permite que o modelo mantenha um plano durante toda a tarefa.

As mais recentes tendências em IA, trazidas a você por especialistas

Receba insights selecionados sobre as notícias mais importantes (e intrigantes) sobre IA. Inscreva-se no nosso boletim informativo semanal Think. Consulte a Declaração de privacidade da IBM.

Como o ReWOO funciona

O ReWOO emprega três módulos distintos, que dividem e conquistam tarefas complexas. Primeiro, um módulo Planner mapeia um blueprint de como o modelo se comportará com base no prompt do usuário. Em segundo lugar, um módulo Worker executa o plano, chamando ferramentas externas (sem repetir chamadas caras da APIs de LLMs para “pensar”, como no ReAct). Finalmente, um módulo Solver reúne os planos e as evidências, sintetizando a resposta final.

Embora a diferença na abordagem possa parecer pequena, os resultados são drásticos: o ReWOO tem um desempenho tão bom (ou um pouco melhor) do que o ReAct em alguns benchmarks— tudo isso enquanto usa cerca de 80% menos tokens. (Um token é uma unidade de significado semântico para um modelo de IA; quanto mais tokens, maior o custo de operação.) Por exemplo, no conjunto de dados HotpotQA (uma bateria de perguntas usadas para avaliar sistemas de IA), o ReWOO alcança 42,4% de precisão usando 2.000 tokens, enquanto o ReAct alcança 40,8% de precisão usando 10.000 tokens.

Crucialmente, essa otimização da eficiência de tokens torna os modelos de raciocínio economicamente viáveis em escala.

ReAct versus ReWOO: um exemplo do mundo real

Para ilustrar a diferença entre esses dois frameworks comuns de IA generativa, vamos examinar um caso de uso específico. Considere as diferentes maneiras pelas quais um sistema ReAct versus ReWOO lidaria com uma consulta de usuário pedindo ajuda para fazer as malas para uma viagem que envolvesse um voo entre Nova York e Chicago no dia seguinte, seguido de uma viagem de carro para Milwaukee um dia depois.

Um sistema ReAct decomporia o problema em uma sequência de três ciclos de pensamento-ação-observações antes de dar sua resposta final. No primeiro ciclo, ele pensaria: "Preciso verificar o clima de amanhã em Nova York" usando geração aumentada de recuperação (RAG) para procurar esse clima (uma ação), por fim observando o resultado. Esse resultado serve como entrada para outro ciclo de pensar-agir-observar de três etapas para o clima de Chicago. Em terceiro lugar, faria o mesmo com o clima de Milwaukee. Por fim, ele reuniria suas descobertas em uma saída (por exemplo, “Leve bastante roupa de frio, porque fica mais frio em cada local”).

Um sistema no estilo ReWOO, por outro lado, ganharia eficiência ao fazer todo o planejamento antecipadamente. Primeiro, planejaria: "Preciso ter o clima de Nova York amanhã, o clima de Chicago amanhã e o clima de Milwaukee no dia seguinte". Em seguida, funcionaria, chamando APIs meteorológicas em uma sequência rígida (ou potencialmente em paralelo), sem fazer qualquer “pensamento” dispendioso nesta etapa de trabalho árduo. Por fim, resolveria, reunindo as evidências e produzindo uma resposta final.

Agentes de IA

Cinco tipos de agentes de IA: funções autônomas e aplicações no mundo real

Saiba como a IA orientada por objetivos e baseada em utilidade se adapta a fluxos de trabalho e ambientes complexos.

Crie, implemente e monitore agentes de IA

Benefícios e desvantagens do ReWOO

Além da eficiência de tokens, o ReWOO demonstra um benefício adicional: robustez sob falhas de ferramentas. Se uma ferramenta falhar no ReAct, por exemplo, o sistema pode ficar preso em um loop infinito (à medida que o LLM consulta repetidamente um banco de dados defeituoso para o clima em Chicago, por exemplo).

O ReWOO é mais ágil. Mesmo que uma ferramenta não consiga retornar uma determinada evidência, o plano inicial abrangente ainda estará em vigor: o módulo Worker poderá progredir, e o módulo Solver poderá fornecer pelo menos uma resposta parcial. No exemplo do clima, em vez de ficar preso em um loop infinito ou excessivo consultando um banco de dados sobre o clima de Chicago, o módulo Solver pelo menos retornaria uma resposta informando ao usuário sobre o clima em Nova York e Milwaukee (supondo que o módulo Worker tenha conseguido recuperar esses bits de evidências), o que poderia, em última análise, ser suficientemente útil para as necessidades de planejamento do usuário.

Apesar dos benefícios do ReWOO, ele não é um framework universalmente superior; é simplesmente melhor para certos tipos de trabalhos, especialmente quando os tipos e quantidades de evidências necessárias são regulares e previsíveis. No entanto, onde o ReWOO fica aquém do esperado, há problemas menos previsíveis ou estruturados que podem exigir criatividade, exploração ou improvisação. Com desconhecidos conhecidos, o ReWOO se destaca; mas com desconhecidos, ele naufraga.

Por exemplo, o ReWOO não seria ideal para depurar código Python, um processo exploratório e iterativo em que cada correção pode gerar novos erros e pistas, com os planos mais bem elaborados rapidamente se tornando obsoletos. Um framework mais adaptável como o ReAct, embora menos eficiente em termos de tokens em abstrato, acabaria por ser mais adequado para esse problema.

Como implementar o ReWOO

Como acontece com a maioria dos sistemas e frameworks de IA, várias abordagens estão disponíveis para a implementação de fluxos de trabalho do ReWOO. Uma implementação "oficial" do framework, que foi descrita pela primeira vez pelo pesquisador Binfeng Xu (junto com seus colegas, em 2023[1]), está disponível via Github. Frameworks de IA generativa, como o LangGraph (que chama seus módulos de “nós”) e o LangChain relacionado, também são populares. E uma metodologia de raciocínio em vários passos no estilo ReWOO também está disponível usando o Granite da IBM.

Pode-se começar a usar o ReWOO em um nível conceitual em qualquer ambiente de LLM com um prompt bem elaborado que simplesmente incentiva a IA a elaborar um plano passo a passo para responder às perguntas subsequentes antes de avançar para qualquer entrada de ferramenta.

O artigo que descrevia o ReWOO pela primeira vez, por exemplo, incluía exemplos de prompts, incluindo um que começa: "Para a tarefa a seguir, faça planos que possam resolver o problema passo a passo. Para cada plano, indique qual ferramenta externa, junto com a entrada da ferramenta, para recuperar evidências." Os autores do estudo acrescentaram, no entanto, que “O ReWOO é um paradigma geral, e os prompts não são necessariamente fixos. Incentivamos os leitores e usuários a ajustar os prompts sob medida às suas próprias necessidades."1

Comece a obter ROI: Guia prático para a IA agêntica

Aprenda como escalar a IA agêntica para um ROI mensurável em toda a sua empresa. Este playbook descreve as principais barreiras que limitam o impacto, como medir o ROI de forma eficaz e um framework prático para impulsionar a adoção bem-sucedida em toda a empresa.

Recursos

A empresa em 2030: projetada para inovação perpétua

Descubra nossas cinco previsões sobre o que definirá as empresas mais bem-sucedidas em 2030 e as etapas que os líderes podem seguir para obter uma vantagem em priorizar a IA.

Imperativo da governança de IA: evolução das regulamentações e surgimento da IA agêntica

Aprenda como a evolução das regulamentações e o surgimento de agentes de IA estão remodelando a necessidade de frameworks robustos de governança de IA.

Explicação sobre a IA agêntica

O Techsplainers da IBM detalha os fundamentos da IA agêntica, desde os conceitos-chave até os casos de uso do mundo real. Episódios claros e rápidos ajudam você a aprender rapidamente os fundamentos.

Libere o ROI da IA: guia tático para produtividade empresarial

Aprenda estratégias comprovadas para aumentar a produtividade e impulsionar a transformação empresarial com IA e inovação no núcleo.

Como os agentes e assistentes de IA podem trazer benefícios para a sua organização

Aprofunde-se neste guia abrangente que detalha os principais casos de uso e recursos, fornecendo recomendações passo a passo para ajudar você a escolher as soluções certas para sua empresa.

Reinvente a produtividade de negócios com agentes e assistentes de IA

Saiba como agentes de IA e assistentes de IA podem trabalhar juntos para atingir novos níveis de produtividade.

Experimente o watsonx Orchestrate

Entenda como a IA generativa é capaz de aliviar sua carga de trabalho e aumentar a produtividade

De projetos de IA a lucros: como a IA agêntica pode sustentar retornos financeiros

Saiba como as organizações estão deixando de lançar a IA em pilotos díspares para usá-la para impulsionar a transformação no núcleo.

Relatório da Omdia sobre inteligência capacitada: o impacto dos agentes de IA

Descubra como você pode liberar todo o potencial da IA generativa com agentes de IA.

Como os agentes de IA reinventarão a produtividade

Aprenda maneiras de usar a IA para ser mais criativo e eficiente e começar a se adaptar a um futuro que envolve trabalhar em estreita colaboração com agentes de IA.

A vanguarda das empresas agênticas: colocando a IA para trabalhar em todo o seu portfólio de tecnologias

Mantenha-se a par dos novos agentes de IA, um ponto de ruptura fundamental na revolução da IA.

O futuro dos agentes, o consumo de energia da IA, o uso de computadores da Anthropic e textos gerados por IA com a marca d'água do Google

Fique à frente da curva com nossos especialistas em IA neste episódio de Mixture of Experts enquanto eles se aprofundam no futuro dos agentes de IA e muito mais.

Como a Comparus está usando um "assistente bancário"

A Comparus usou as soluções do watsonx.ai e demonstrou de forma impressionante o potencial dos serviços bancários conversacionais como um novo modelo de interação.

Soluções relacionadas

Agentes de IA para empresas

Crie, implemente e gerencie assistentes e agentes de IA potentes que automatizam fluxos de trabalho e processos com a IA generativa.

Explore o watsonx Orchestrate

Soluções de agentes de IA da IBM

Construa o futuro do seu negócio com soluções de IA em que você pode confiar.

Explore soluções de agentes de IA

Serviços de IA do IBM® Consulting

Os serviços de IA da IBM Consulting ajudam a reinventar a forma como as empresas trabalham com IA para gerar transformação.

Explore os serviços de inteligência artificial

Dê o próximo passo

Se você optar por personalizar aplicativos e habilidades criados previamente ou criar e implementar serviços agênticos personalizados usando um estúdio de IA, a plataforma IBM watsonx tem aquilo de que você precisa.

Notas de rodapé

1. "ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models," Binfeng Xu, Zhiyuan Peng, Bowen Lei, Subhabrata Mukherjee, Yuchen Liu, Dongkuan Xu. Arxiv.org, 23 de maio de 2023.