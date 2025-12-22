2026 年，最智慧的 AI 模型可能不再是规模最大的。

这正成为实验室、投资者与研究人员的共识——过去一年他们目睹了原有认知体系的颠覆。未来十二个月将不再以构建更庞大系统为焦点，而是转向开发更智慧的模型：那些在回应前会思考、能以少博多的系统。

IBM 院士 Kush Varshney 在接受 IBM Think 采访时表示：“小型语言模型能达到与庞大规模模型相当甚至更优的性能。”

若在一年前，此观点无异于异端。过去十年间，AI 始终遵循着残酷而简单的信条：更多数据、更多参数、更强算力、更高智能。实验室竞相公布参数规模，如同健美选手对镜展示肌肉。训练消耗的电力堪比小型城市。整个行业弥漫着圈地运动般的狂热，只是这场竞赛的疆域以万亿次浮点运算衡量。

随后时间来到 2025 年 1 月。中国公司 DeepSeek 发布的新模型，令英伟达股价单日暴跌 17%。算法智慧开始替代蛮力计算。人们不再需要恢弘圣殿，而是更精巧的蓝图。

美国主要实验室迅速转向。数月之内，他们从构建日益庞大的系统，转向开发能在回答前暂停推理的模型。北卡罗来纳大学凯南-弗拉格勒商学院运营学副教授 Seyed Emadi 在接受 IBM Think 采访时直言：“若要概括 2025 年的 AI 发展，我们停止了让模型变大，开始让它们变聪明。”

这一转向正塑造着未来图景。研究人员的共识鲜明得近乎惊人。当被问及过去一年最重要进展时，加州大学圣地亚哥分校机器学习教授 Misha Belkin 指出“思维模型的兴起与推理时扩展” ，并在采访中称其为 2026 年的基石。密歇根大学人工智能实验室主任 Rada Mihalcea 提出补充观点，她告诉 IBM Think：“多智能体系统的进步，以及对……缺陷的更深入理解”将定义未来发展路径。

这一转变意味着对硅基智能内涵的重新思考。旧范式将智能视为训练过程中注入的要素，如同炖菜中加入的调味料。模型一旦完成便固化定型。新范式则将智能视为运行时涌现的特性——通过赋予模型更多推理时间（即“推理时计算”）来实现。

这一变革的影响仍在持续显现。斯坦福大学研究 AI 推理能力的研究员 Gabriel Poesia 观察到，模型在“延长思考时间”与“在长思考过程中无缝使用工具”方面表现日益精进。用通俗语言解释就是：机器学会了三思而后行。

传统模型如同条件反射：输入即输出，毫无思考间隙。新型模型则具备深思能力。当面对难题时，模型会沉浸其中反复推演——有时长达数分钟——检查逻辑链条，从死胡同中回溯调整。这过程与人类思考惊人相似。但这是否构成真正意义上的思考，仍是悬而未决的重大命题。