¿Qué es ReWOO?

Autor

David Zax

Staff Writer

IBM Think

ReWOO (abreviatura de "razonamiento sin observación") es un marco de razonamiento que hace que los modelos de lenguaje de gran tamaño (LLM) sean más rentables y precisos en algunas aplicaciones de razonamiento complejas. Los modelos con ReWOO se involucran en un proceso de razonamiento en torno a un problema antes de intentar resolverlo, lo que conduce a una mayor eficiencia, precisión y solidez en caso de fallo de la herramienta.

Los primeros LLM (como los modelos GPT-1 y GPT-2 de OpenAI) proporcionaron respuestas directamente; la siguiente ola de modelos de cadena de pensamiento que debutó en 2022 añadió un elemento de razonamiento externalizado, con modelos esencialmente "pensando en voz alta" a medida que llegaban a una respuesta, mejorando la precisión y la explicabilidad. 

A continuación vino una generación de modelos de lenguaje aumentado ("sistemas ALM") y agentes de IA, que añadieron capacidades de llamada a herramientas además de este razonamiento. Los primeros marcos de ALM, como ReAct, emplean un patrón de pensamiento-acción-observación, en el que el sistema observará lo que genera antes de empezar a pensar de nuevo. Aunque suelen ser eficaces, los marcos como ReAct pueden requerir un gran consumo de tokens, ya que cada llamada a herramientas posterior debe incluir todo el historial de conversaciones que la precede, un coste que se acumula con cada paso. 

ReWOO rompe con el patrón "pensar-actuar-observar" al desvincular el razonamiento de las observaciones externas, lo que permite al modelo planificar su cadena de razonamiento internamente antes de invocar herramientas o recuperar información de forma selectiva. Esta separación reduce las idas y venidas innecesarias y permite que el modelo mantenga un plan a lo largo de la tarea.

Las últimas tendencias en IA, presentadas por expertos

Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.

¡Gracias! Está suscrito.

Su suscripción se enviará en inglés. Encontrará un enlace para darse de baja en cada boletín. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

Cómo funciona ReWOO

ReWOO emplea tres módulos distintos, que dividen y conquistan tareas complejas. En primer lugar, un módulo Planner traza un plan de cómo se comportará el modelo en función de la instrucción del usuario. En segundo lugar, un módulo Worker ejecuta el plan, llamando a herramientas externas (sin repetir las costosas llamadas a la API de LLM para "pensar", como en ReAct). Por último, un módulo Solver toma los planes y las pruebas, sintetizando la respuesta final. 

Aunque la diferencia de enfoque puede parecer menor, los resultados son espectaculares: ReWOO funciona tan bien (o ligeramente mejor) que ReAct en algunos puntos de referencia, todo ello utilizando alrededor de un 80 % menos de tokens. (Un token es una unidad de significado semántico para un modelo de IA; cuantos más tokens, mayor será el coste de operación). Por ejemplo, en el conjunto de datos HotpotQA (una batería de preguntas utilizadas para evaluar los sistemas de IA), ReWOO logra una precisión del 42,4 % con 2000 tokens, mientras que ReAct logra una precisión del 40,8 % con 10 000 tokens.  

Básicamente, esta optimización de la eficiencia de token hace que los modelos de razonamiento sean económicamente viables a escala.

ReAct vs. ReWOO: un ejemplo del mundo real

Para ilustrar la diferencia entre estos dos marcos comunes de IA generativa, examinemos un caso de uso específico. Considere las diferentes formas en que un sistema ReAct vs. ReWOO abordaría una consulta de un usuario que solicita ayuda para empacar para un viaje que implica un vuelo entre Nueva York y Chicago mañana, seguido de un viaje a Milwaukee un día después.

Un sistema ReAct descompondría el problema en una secuencia de tres ciclos de pensamiento-acción-observación antes de dar su respuesta final. En el primer ciclo, pensaría: "Necesito comprobar el tiempo de mañana en Nueva York", utilizando la generación aumentada por recuperación (RAG) para buscar ese tiempo (una acción), observando finalmente el resultado. Ese resultado sirve entonces como base para otro ciclo de tres pasos (pensar-actuar-observar) para el clima de Chicago. En tercer lugar, haría lo mismo con el clima de Milwaukee. Por último, recopilaría sus hallazgos en un resultado (por ejemplo, "Llevar varias capas, porque hace más frío en cada lugar"). 

Diagram ReACT

Un sistema de estilo ReWOO, por el contrario, ganaría eficiencia haciendo toda la planificación por adelantado. En primer lugar, planificaría: "Necesito saber el tiempo que hará mañana en Nueva York, mañana en Chicago y pasado mañana en Milwaukee". A continuación, debería funcionar llamando a las API meteorológicas en una secuencia ajustada (o potencialmente en paralelo), sin realizar ningún "proceso de reflexión" costoso en este paso fundamental. Finalmente, se resolvería recopilando las pruebas y dando una respuesta definitiva.  

Diagram ReWOO
Agentes de IA

Cinco tipos de agentes de IA: funciones autónomas y aplicaciones del mundo real

Descubra cómo la IA basada en objetivos y servicios se adapta a flujos de trabajo y entornos complejos.

Beneficios e inconvenientes de ReWOO

Además de la eficiencia del token, ReWOO demuestra un beneficio adicional: robustez en caso de fallo de la herramienta. Si una herramienta falla en ReAct, por ejemplo, el sistema puede quedar atrapado en un bucle infinito (ya que el LLM consulta repetidamente una base de datos rota para el clima en Chicago, por ejemplo).

ReWOO es más ágil. Incluso si una herramienta no puede devolver una prueba determinada, el plan general inicial sigue en vigor: el módulo Worker puede progresar y el módulo Solver podrá ofrecer al menos una respuesta parcial. En el ejemplo del tiempo, en lugar de quedar atrapado en un bucle infinito o excesivo consultando una base de datos sobre el tiempo en Chicago, el módulo Solver al menos devolvería una respuesta informando al usuario sobre el tiempo en Nueva York y Milwaukee (suponiendo que el módulo Worker pudiera recuperar esos datos), lo que en última instancia podría ser suficientemente útil para las necesidades de planificación del usuario. 

A pesar de los beneficios de ReWOO, no es un marco universalmente superior; simplemente es mejor para ciertos tipos de trabajos, especialmente cuando los tipos y cantidades de pruebas necesarias son regulares y predecibles. Sin embargo, donde ReWOO se queda corto es con problemas menos predecibles o estructurados que pueden requerir creatividad, exploración o improvisación. Con incógnitas conocidas, ReWOO destaca, pero con incógnitas desconocidas, fracasa.

Por ejemplo, ReWOO no sería una solución óptima para depurar código Python, un proceso exploratorio e iterativo en el que cada corrección puede generar nuevos errores y pistas, y en el que los planes mejor trazados pueden quedar rápidamente obsoletos. Un marco más adaptable como ReAct, aunque menos eficiente en términos de tokens en abstracto, sería en última instancia más adecuado para este tipo de problema. 

Cómo implementar ReWOO

Al igual que con la mayoría de los sistemas y marcos de IA, hay varios enfoques disponibles para la implementación de flujos de trabajo ReWOO. Hay disponible una implementación "oficial" del marco, que fue descrita por primera vez por el investigador Binfeng Xu (junto a sus compañeros, en 2023[1]), a través de Github. Los marcos de IA generativa como LangGraph (que llama a sus módulos "nodos") y el LangChain relacionado también son populares. Y también está disponible una metodología de razonamiento de varios pasos al estilo ReWOO utilizando Granite de IBM.

Se puede dar los primeros pasos con ReWOO a nivel conceptual en cualquier entorno LLM con una instrucción bien elaborada que simplemente anime a la IA a elaborar un plan paso a paso para responder a las preguntas posteriores antes de pasar a cualquier entrada. 

El artículo que describe por primera vez ReWOO, por ejemplo, incluye ejemplos de instrucciones, entre ellas una que comienza así: "Para la siguiente tarea, haga planes que puedan resolver el problema paso a paso. Para cada plan, indique qué herramienta externa junto con la entrada de la herramienta para recuperar pruebas". Sin embargo, los autores del estudio añaden que "ReWOO es un paradigma general y las instrucciones no son necesariamente fijas. Animamos a los lectores y usuarios a adaptar las instrucciones a sus propias necesidades"1.

Soluciones relacionadas
Agentes de IA para empresas

Cree, implemente y gestione potentes asistentes y agentes de IA que automaticen flujos de trabajo y procesos con IA generativa.

    Explore watsonx Orchestrate
    Soluciones de agente de IA de IBM

    Construya el futuro de su empresa con soluciones de IA en las que puede confiar.

    Explore las soluciones de los agentes de IA
    Servicios de IA de IBM Consulting

    Los servicios de IA de IBM Consulting ayudan a reinventar la forma de trabajar de las empresas usando IA para la transformación.

    Explore los servicios de inteligencia artificial
    Dé el siguiente paso

    Tanto si opta por personalizar las aplicaciones y habilidades prediseñadas como si prefiere crear e implementar servicios agentivos personalizados mediante un estudio de IA, la plataforma IBM watsonx le ofrece todo lo que necesita.

    Explore watsonx Orchestrate Explore watsonx.ai
    Notas a pie de página

    1. "ReWOO: Decoupling Reasoning from Observations for Efficient Augmented Language Models". Binfeng Xu, Zhiyuan Peng, Bowen Lei, Subhabrata Mukherjee, Yuchen Liu, Dongkuan Xu. Arxiv.org. 23 de mayo de 2023.