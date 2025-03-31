随着 OpenAI o1、DeepSeek-R1 和 Google Gemini 2.5 等推理模型争相冲击 AI 智能基准榜单榜首，寻求 AI 集成的企业却对一种名为“模型臃肿”的现象日益警惕——这种现象指模型变得不必要地庞大或复杂，不仅推高了计算成本与模型训练时间，还降低了其提供企业所需响应的速度。

OpenAI o1 和 DeepSeek-R1 使用思维链 (CoT) 推理将复杂问题分解为若干步骤，与现有模型相比实现前所未有的性能和更高的准确性。但 CoT 在推理过程中也需要大量资源，从而导致冗长的输出和更高延迟，IBM 副总裁兼 AI 基础架构组合负责人 Volkmar Uhlig 在接受 IBM Think 采访时表示。

多篇新发表的论文中提出了一类全新的提示技术，涵盖思维原子 (AoT) 与草稿链 (CoD) 等方法。这类技术旨在通过助力模型更高效地解决问题，提升思维链 (CoT) 的效率与准确性，进而降低相关成本与延迟。

AI 科学家兼初创公司创始人 Lance Elliott 这些新型衍生技术，本质上是提示词工程师工具包中的多元变体。“普通家庭的手工工具包里可能会有一把常规锤子，这就相当于思维链，”他在接受 IBM Think 采访时表示，“思维原子则好比用于切割和修整石膏板的专用锤子。你当然可以用常规锤子来处理石膏板相关工作，但如果有一把石膏板专用锤，而且你知道如何正确使用它，那显然用专用锤会更合适。”

IBM 的 AI 技术解决方案架构师 Vyoma Gajjar 认为这些思维链的新型衍生技术极具应用潜力,尤其适合那些“希望通过更具成本效益的提示词策略，驱动小型模型为其特定用例输出精准答案”的企业，她表示。