El marco ReAct se inspira en la forma en que los humanos pueden usar intuitivamente el lenguaje natural, a menudo a través de nuestro propio monólogo interno, en la planificación y ejecución paso a paso de tareas complejas.
En lugar de implementar flujos de trabajo basados en reglas o predefinidos, los agentes ReAct confían en las capacidades de razonamiento de su LLM para ajustar dinámicamente su enfoque en función de nueva información o los resultados de pasos anteriores.
Imagine hacer las maletas para un viaje corto. Puede empezar por identificar las consideraciones clave ("¿Cómo será el tiempo mientras esté allí?") y, a continuación, consultar activamente fuentes externas ("Comprobaré la previsión del tiempo local").
Al utilizar esa nueva información ("Va a hacer frío"), determina su próxima consideración ("¿Qué ropa de abrigo tengo?") y acción ("Revisaré mi armario"). Al tomar esa medida, es posible que se encuentre con un obstáculo inesperado ("Toda mi ropa de abrigo está guardada") y ajuste su próximo paso en consecuencia ("¿Qué ropa me puedo poner encima?").
En una forma similar, el marco ReAct utiliza el prompt engineering para estructurar la actividad de un agente de IA en un patrón formal de pensamientos, acciones y observaciones alternas:
Después de realizar una acción, el modelo vuelve a evaluar su progreso y utiliza esa observación para ofrecer una respuesta final o informar el siguiente pensamiento. Lo ideal sería que la observación también tuviera en cuenta la información previa, ya sea de una ventana anterior del contexto estándar del modelo o de un componente de memoria externo.
Dado que el rendimiento de un agente ReAct depende en gran medida de la capacidad de su LLM central para resolver "verbalmente" su camino a través de tareas complejas, los agentes ReAct se benefician enormemente de modelos altamente capaces con un razonamiento avanzado y capacidad para seguir instrucciones.
Para minimizar el coste y la latencia, un marco ReAct multiagente podría basarse principalmente en un modelo más grande y de mayor rendimiento que sirva como agente central cuyo proceso de razonamiento o acciones podrían implicar delegar subtareas a más agentes creados utilizando modelos más pequeños y eficientes.