如果机器能学会我们如何推理，或许也能帮助我们理解自身行为的原因。
Centaur 是一款旨在模拟人类推理机制的新型人工智能模型。该模型基于 Meta 的 Llama 3.1 架构开发，通过从 160 项心理学研究中提取的超过 1000 万条决策数据进行训练，能够处理逻辑问题、道德困境和日常选择，从而揭示人类思维背后的规律。研究人员将其视为一种探索工具——其拟人化程度足以发现传统模型可能忽略的深层洞见。
“我期待利用这个模型来探索人类思维的奥秘，”Helmholtz Munich 研究中心人本人工智能研究所副所长、Centaur 研究论文第一作者 Marcel Binz 在接受 IBM Think 采访时表示。
多数认知模型会将实验数据简化为原始数值。Centaur 则反其道而行。它完整读取每项任务的全部内容，包括自然语言指令和人类反应的每个步骤。该模型在名为 Psych 101 的数据集上接受训练，该数据集汇集了从视觉谜题、记忆测试到道德困境和语言游戏等经典心理学问题。通过获取与人同等的完整信息，Centaur 得以学会像人类那样执行任务。
这种方法使其泛化能力远超训练数据范围。当研究人员将标准强化学习问题从“宇航员”场景改写为“魔法飞毯”场景时，Centaur 仍表现出相同的行为倾向。在 LSAT 式逻辑谜题等全新任务类型中，它同样表现优异。
采用语言而非压缩数值描述的设计具有明确意图。“我们希望模型能看到实验参与者看到的内容，”Binz 解释道。“完整的指令，完整的语境。没有捷径。”
Centaur 并非为解释大脑运作机制而构建。其核心在于复现人类在行为研究中的实际表现。这种预测能力对研究者具有直接意义——他们过去常需为每种认知功能构建狭窄的人工模型。
斯坦福大学心理学教授 Russell Poldrack（未参与该项目）将 Centaur 视为该领域重大转型的一部分。
“历史上我们总是给模型高度简化的任务版本，”他在接受 IBM Think 采访时表示。“如今我们可以赋予其与人同等的完整信息，并观察到模拟人类行为的表现。”
这种差异不仅体现在规模上，更在于设计初衷。多数认知模型旨在解释特定行为。而 Centaur 的构建目标在于观察并复现跨领域行为——例如视觉推理与记忆任务。这为发现研究者可能忽略的新规律创造了可能。
在该研究的一个案例中，团队探究人们如何在具有多重专家评级的产品间做出选择。Centaur 的行为揭示了一种两步策略：人们首先计算正面评价的数量，仅将专家可信度作为平局决胜依据。这一发现催生了全新且可解释的人类决策模型，经优化后 Centaur 能与之高度匹配。
“我们并非试图取代认知模型，”Binz 强调，“而是希望为研究者提供更好的工具来探索人类潜在行为模式。”
尽管覆盖面广，Centaur 仍存在明确局限。它无法模拟时间维度、注意力动态或物理互动。它无法解释人类反应时长、社交环境中的行为变化或决策随时间推移的演变过程。
这些局限可能反而具有价值。在 Centaur 失效的领域，研究者或许能发现那些仅从语言数据中难以习得的认知特征线索。
而这正是 Poldrack 建议的切入点。“我想找到那些它失效的环节，”他表示。“它遗漏了什么？在何处偏离人类行为？原因何在？”
Centaur 采用的 Transformer 模型架构，本身并非为模拟复杂认知动态而设计。可能需要引入循环结构、记忆模块或多模态训练，才能使其更接近这类能力。但即便是当前阶段，该模型在广泛任务中产生类人行为的能力已非同寻常。
部分研究者质疑，大语言模型 (LLM) 究竟是在真正推理，还是在简单地重复训练期间接触到的模式。Binz 在描述 Centaur 时措辞谨慎。“它并非在模拟人脑运作机制，”他说。“但也不仅仅是复制行为。它是在进行某种泛化。”
Poldrack 指出这种争论并非新现象。语言模型究竟是在真正思考，还是仅仅模仿语言中的统计规律——这一问题始终处于 AI 批评的核心，常被称为“随机鹦鹉”困境。
“当人们最初用‘随机鹦鹉’的批评指向大语言模型时，我的第一反应是：人类至少某种程度上也属于随机鹦鹉。”他解释道。
他援引心理学中的范例理论，该理论认为人们在决策时往往依赖具体记忆而非抽象规则。
“当我看到狗时，并不会重新计算狗的定义，”他解释道。“而是在匹配记忆中已有的形象。这种方式快速且有效。”
Poldrack 提出，Centaur 可能正在调用过往经验，以新方式组合信息并生成预测。但他指出，这个过程是否等同于思考仍是一个开放性问题。
当前能够实现 Centaur 这类模型的原因之一，在于数据终于跟上了研究问题的需求。Poldrack 指出，数十年间心理学研究一直处于“数据受限状态”，实验通常仅涉及三四十名参与者，并依赖人工分析。
Psych-101 数据集改变了这一现状。该数据集汇集了数十年心理学研究积累的数千万条决策记录，全部以统一规范的自然语言格式重构。它涵盖广泛实验中的完整任务描述、操作指令及人类反应序列。这正是训练 Centaur 的基础。模型不再从孤立的输入输出中学习，而是接触每项任务的全流程语境。这使其能够遵循经验的结构与脉络，以更贴近人类的方式处理问题。
Poldrack 认为，这种数据规模虽未必提供深度解释，却为探索开启了新路径。
“我们从未拥有过这类规模的数据体系，”他说道。“如今我们可以训练出能反映跨任务行为特征——而非仅限单任务内部——的模型。”
Binz 表示团队计划在未来数月扩展 Psych-101 数据集，纳入心理语言学、发展心理学研究及跨文化任务。其目标不止于拟合平均行为模式。研究者更希望理解年龄、人格特质或文化背景如何导致个体差异，以及这些差异如何影响人们的反应方式。
“最终目标是构建能够对认知机制本身进行推理的模型，”他表示。
Centaur 并未伪装成大脑的替代品。但它可能为认知科学提供长期缺乏的要素：一个经大规模训练的通用行为模型，其行为模式与人类足够相似，能帮助我们辨明现有理论的有效边界。
“它本质上是个预测行为极其精准的大型黑箱，”Binz 指出。“但我们对箱内机制理解越深，就越可能窥见人类自身的认知奥秘。”
