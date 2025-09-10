早期的 LLM（如 OpenAI 的 GPT-1 和 GPT-2 模型）直接提供答案；随后于 2022 年首次亮相的思维链模型增加了一个外化推理的元素，模型在得出答案的过程中基本上是在"大声思考"，从而提高了准确性和可解释性。

接下来出现的是增强语言模型（“ALM 系统”）和 AI 智能体，它们在这种推理的基础上增加了工具调用能力。早期的 ALM 框架（如ReAct）采用“思考-行动-观察”模式，系统在再次开始思考之前会观察自己生成的内容。虽然ReAct这类框架通常有效，但它们可能消耗大量令牌，因为每个后续的工具调用都必须包含之前所有的对话历史——每个步骤都会增加成本。

ReWOO 通过将推理与外部观察分离，允许模型在有选择地调用工具或检索信息之前在内部规划其推理链，从而摆脱了“思考-行动-观察”模式。这种分离减少了不必要的来回交互，并允许模型在整个任务中保持一个计划。