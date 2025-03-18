ReAct 框架的灵感来源于人类在逐步规划和执行复杂任务时可以直观地使用自然语言的方式，这通常是通过我们自己的内心独白。



ReAct 智能体并不执行基于规则或其他预定义的工作流，而是依靠其 LLM 的推理能力，根据新信息或先前步骤的结果动态调整其方法。

想象一下为一次短途旅行打包行李。你可能会先确定几个关键因素（“那里天气会怎样？”），然后主动查询外部信息（“我会查看当地的天气预报”）。



通过使用这些新信息（“天气会很冷”），您可以确定下一个考虑因素（“我有什么保暖的衣服？”）和行动（“我要看看我的衣橱”）。采取该行动后，您可能会遇到意想不到的障碍（“我所有保暖的衣服都收起来了”），并相应调整下一步（“我可以叠穿哪些衣服？”）。

类似地，ReAct 框架使用提示工程以交替执行思考、行动和观察的正式模式构建 AI 智能体的活动：

语言化的 CoT 推理步骤（想法）帮助模型将较大的任务分解为更易于管理的子任务。

采取行动后，模型会重新评估其进度，并使用该观察结果提供最终答案或通知下一个想法。理想情况下，观察还可以考虑先前信息，无论是来自模型标准上下文窗口的早期信息还是来自外部内存组件的信息。

由于 ReAct 智能体的性能在很大程度上取决于其中央 LLM 在完成复杂任务时的“口头”思考能力，因此 ReAct 智能体从具有高级推理和指令遵循能力的高能力模型中获益很大。

为了最大限度地降低成本和延迟，多智能体 ReAct 框架可能主要依赖更大、性能更高的模型作为中央智能体，其推理过程或动作可能涉及将子任务委托给使用更小、更高效的模型构建的更多智能体。