¿Qué es ReWOO?

Autor

David Zax

Staff Writer

IBM Think

ReWOO (abreviatura de “razonamiento sin observación”) es un marco de razonamiento que hace que los modelos de lenguaje grandes (LLM) sean más rentables y precisos en algunas aplicaciones de razonamiento complejas. Los modelos con ReWOO participan en un proceso de razonamiento en torno a un problema antes de intentar resolverlo, lo que lleva a una eficiencia, precisión y robustez mucho mayores en caso de falla de la herramienta.

Los primeros LLM (como los modelos GPT-1 y GPT-2 de OpenAI) proporcionaron respuestas directamente; la siguiente ola de modelos de cadena de pensamiento que debutó en 2022 agregó un elemento de razonamiento externalizado, con modelos que básicamente "piensan en voz alta" a medida que llegaban a una respuesta, mejorando la precisión y la explicabilidad. 

Luego vino una generación de modelos de lenguaje aumentado ("sistemas ALM") y agentes de IA, que agregaron capacidades de llamada a herramientas además de este razonamiento. Los primeros marcos de ALM (como ReAct) emplean un patrón de pensamiento-acción-observación, donde el sistema observará lo que genera antes de comenzar a pensar nuevamente. Si bien en general son efectivas, las infraestructuras como ReAct pueden requerir un gran consumo de tokens, ya que cada llamada posterior a la herramienta debe incluir todo el historial de conversación que la precede, un costo que se exacerba con cada paso. 

ReWOO rompe con el patrón pensar-actuar-observar al desacoplar el razonamiento de las observaciones externas, lo que permite que el modelo planifique su cadena de razonamiento internamente antes de invocar herramientas de forma selectiva o recuperar información. Esta separación reduce las idas y venidas innecesarias y permite que el modelo mantenga un plan a lo largo de la tarea.

Las últimas tendencias de IA presentadas por expertos

Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .

¡Gracias! Ya está suscrito.

Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

Cómo funciona ReWOO

ReWOO emplea tres módulos distintos, que dividen y dominan tareas complejas. En primer lugar, un módulo de Planner traza un proyecto técnico de cómo se comportará el modelo en función de la instrucción del usuario. En segundo lugar, un módulo Worker ejecuta el plan, llamando a herramientas externas (sin repetir las costosas llamadas a la API de LLM para "pensar", como en ReAct). Finalmente, un módulo Solver toma los planes y la evidencia, sintetizando la respuesta final. 

Aunque la diferencia en el enfoque puede parecer menor, los resultados son drásticos: ReWOO funciona tan bien (o ligeramente mejor) como ReAct contra algunos puntos de referencia, todo mientras usa alrededor de un 80 % menos de tokens. (Un token es una unidad de significado semántico para un modelo de IA; cuantos más tokens, mayor será el costo de operación).  Por ejemplo, en el conjunto de datos HotpotQA (una batería de preguntas utilizadas para evaluar los sistemas de IA), ReWOO logra una precisión del 42.4 % con 2000 tokens, mientras que ReAct logra una precisión del 40.8 % con 10 000 tokens.  

Crucialmente, esta optimización de la eficiencia de token hace que los modelos de razonamiento sean económicamente viables a escala.

ReAct frente a ReWOO: un ejemplo del mundo real

Para ilustrar la diferencia entre estas dos infraestructuras comunes de IA generativa, examinemos un caso de uso específico. Considere las diferentes formas en que un sistema ReAct frente a ReWOO abordaría la consulta de un usuario que solicita ayuda para empacar para un viaje que implica un vuelo entre Nueva York y Chicago mañana, seguido de un viaje a Milwaukee un día después.

Un sistema ReAct descompondría el problema en una secuencia de tres ciclos de pensamiento-acción-observaciones antes de dar su respuesta final. En el primer ciclo, pensaría: "Necesito verificar el clima de mañana en Nueva York", utilizando generación aumentada por recuperación (RAG, por sus siglas en inglés) para buscar ese clima (una acción), finalmente observando el resultado. Ese resultado sirve como entrada para otro ciclo de pensar-actuar-observar de tres pasos para el clima de Chicago. En tercer lugar, haría lo mismo con el clima de Milwaukee. Finalmente, cotejaría sus hallazgos en un resultado (por ejemplo, “Empacar en capas, porque hace más frío en cada lugar”). 

Diagrama ReACT

Un sistema de estilo ReWOO, por el contrario, ganaría eficiencia al hacer toda la planificación por adelantado. Primero, planearía: "Necesito saber el clima de Nueva York mañana, el clima de Chicago mañana y el clima de Milwaukee pasado". A continuación, funcionaría llamando a las API meteorológicas en una secuencia estrecha (o potencialmente en paralelo), sin hacer ningún "pensamiento" costoso en este paso de caballo de batalla. Finalmente, resolvería, recopilaría las pruebas y daría los resultados finales.  

Diagrama ReWOO
Agentes de IA

Cinco tipos de agentes de IA: funciones autónomas y aplicaciones reales

Descubra cómo la IA orientada a objetivos y basada en utilidades se adapta a los flujos de trabajo y entornos complejos.

Beneficios y desventajas de ReWOO

Además de la eficiencia del token, ReWOO demuestra un beneficio adicional: robustez en caso de falla de la herramienta. Si una herramienta falla en ReAct, por ejemplo, el sistema puede quedar atrapado en un bucle infinito (ya que el LLM consulta repetidamente una base de datos rota para el clima en Chicago, por ejemplo).

ReWOO es más ágil. Incluso si una herramienta no puede devolver una prueba determinada, el plan general inicial sigue vigente: el módulo Worker puede avanzar y el módulo Solver podrá ofrecer al menos una respuesta parcial. En el ejemplo del clima, en lugar de quedar atrapado en un bucle infinito o excesivo consultando una base de datos para el clima de Chicago, el módulo Solver al menos devolvería una respuesta informando al usuario del clima de Nueva York y Milwaukee (suponiendo que el módulo Worker pudiera recuperar esos fragmentos de evidencia), lo que en última instancia podría ser lo suficientemente útil para las necesidades de planeación del usuario. 

A pesar de los beneficios de ReWOO, no es una infraestructura universalmente superior; simplemente es mejor para ciertos tipos de trabajos, particularmente cuando los tipos y cantidades de evidencia necesarios son regulares y predecibles. Sin embargo, ReWOO se queda corto en problemas menos predecibles o estructurados que pueden requerir creatividad, exploración o improvisación. Con incógnitas conocidas, ReWOO sobresale, pero con incógnitas desconocidas, fracasa.

Por ejemplo, ReWOO no sería óptimo para depurar el código Python, un proceso exploratorio e iterativo en el que cada arreglo puede generar nuevos errores y pistas, y los planes mejor trazados se obvian rápidamente. Un marco más adaptable como ReAct, aunque menos eficiente en tokens en abstracto, en última instancia sería una mejor opción para ese problema. 

Cómo implementar ReWOO

Al igual que con la mayoría de los sistemas y la infraestructura de IA, hay varios enfoques disponibles para la implementación de flujos de trabajo de ReWOO. Una implementación "oficial" del marco, que fue descrita por primera vez por el investigador Binfeng Xu (junto con sus colegas, en 2023[1]), está disponible a través de Github. Los marcos de GenAI como LangGraph (que llama a sus módulos "nodos") y el LangChain relacionado también son populares. Y también está disponible una metodología de razonamiento de varios pasos al estilo ReWOO mediante Granite de IBM.

Uno puede comenzar con ReWOO a nivel conceptual en cualquier entorno LLM con una instrucción bien elaborada que simplemente aliente a la IA a elaborar un plan paso a paso para responder preguntas posteriores antes de avanzar a cualquier entrada. 

El documento que describe primero a ReWOO, por ejemplo, incluye instrucciones de muestras, como una que comienza así: “Para la siguiente tarea, haga planes que puedan resolver el problema paso a paso. Para cada plan, indique qué herramienta externa junto con la entrada de la herramienta para recuperar evidencia”. Sin embargo, los autores del estudio agregan que “ReWOO es un paradigma general y las instrucciones no son necesariamente fijas. Alentamos a los lectores y usuarios a ajustar las instrucciones a sus propias necesidades”.1

Soluciones relacionadas
Agentes de IA para empresas

Cree, implemente y gestione poderosos asistentes y agentes de IA que automaticen flujos de trabajo y procesos con IA generativa.

    Explore watsonx Orchestrate
    Soluciones de agentes de IA de IBM

    Construya el futuro de su empresa con soluciones de IA en las que pueda confiar.

    Explorar las soluciones de agentes de IA
    Servicios de IA de IBM Consulting

    Los servicios de IA de IBM Consulting ayudan a reinventar la forma en que las empresas trabajan con IA para la transformación.

    Explorar los servicios de inteligencia artificial
    Dé el siguiente paso

    Ya sea que elija personalizar aplicaciones y habilidades predefinidas o crear y desplegar servicios agénticos personalizados utilizando un estudio de IA, la plataforma IBM watsonx responde a sus necesidades.

    Explore watsonx Orchestrate Explore watsonx.ai
    Notas de pie de página

    1. "ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models," Binfeng Xu, Zhiyuan Peng, Bowen Lei, Subhabrata Mukherjee, Yuchen Liu, Dongkuan Xu. Arxiv.org, 23 de mayo de 2023.