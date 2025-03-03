IBM 研究院高级项目经理 Abraham Daniels 告诉 IBM Think，混合推理标志着 AI 行业焦点从单纯构建更强大的系统转向创建更实用系统的转变。对于企业而言，这一改变可能至关重要，因为运行复杂 AI 的成本已成为主要考量因素。

模型在进行深度推理时，比提供简单响应时要消耗显著更多的计算资源，因此成本也更高。混合推理让企业能够通过将计算级别与任务复杂度相匹配，来优化 AI 支出。

Anthropic 近期推出了具有“扩展思考模式”的 Claude 3.7 Sonnet，允许用户在需要时请求更深入的分析。IBM 同样为其 Granite 模型配备了“切换”功能，让用户能够控制何时启用密集推理。

“我们构建混合推理时所秉持的理念，与市面上其他推理模型有所不同，”一位 Anthropic 发言人对 IBM Think 表示。“我们的方法基于人脑的工作方式。作为人类，我们并非拥有两个独立的大脑来分别处理快速思考和深度思考——在 Anthropic，我们认为推理需要深度集成到我们所有模型的能力中，而非作为一个独立功能。这一理念基于我们对 Claude 如何与客户在所有应用中集成的理解。虽然某些交互需要快速响应，例如头脑风暴营销素材，但其他场景，如复杂的财务分析或行业研究，则需要更深入、更长时间的思考。我们希望能让客户尽可能简单且经济高效地获取和使用这两项功能。”

这种方法使得 AI 的思考过程变得更加透明。“模型本身仍然是一个黑箱，但至少在输出端，你可以大致看到模型是如何得出该结论的，”Daniels 说。他表示，这种可见性可以改善结果并应对可解释性问题，这对受监管的行业尤为重要。

Daniels 和其他专家认为，这一发展旨在满足实际需求：为简单直接的问题消除不必要的计算开销。

“并非所有任务都需要大量的推理，它本质上赋予了你一种能力，即当处理更复杂的事情时，你可以付出更多——无论是延迟还是成本方面，”IBM 研究院技术产品管理总监 Kate Soule 在播客中说道。