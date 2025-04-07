Anthropic 的 Claude AI 模型不仅能写诗，它还能提前思考，使诗句押韵。它不仅仅是回答问题，它会跨语言权衡意义，构建内部概念，有时甚至会伪造逻辑以迎合用户。研究人员首次能够实时观察这些过程的展开。

在一项新研究中，Anthropic 的研究人员使用一套新型可解释性工具揭开了 Claude 语言模型的层次结构，也就是说，这些工具可以帮助解释 AI 模型如何以及为何做出决策。他们的结果揭示了一个系统，以类似于人类认知的方式处理复杂的推理任务，具有内部规划、概念抽象和偶尔的认知偏见。这些研究结果突破了人工智能开发透明度的界限，已经引起了 IBM 团队的共鸣，IBM 的研究人员一直在对 IBM 的模型进行可解释性研究。对于这两家公司来说，这些突破不仅仅是科学趣闻，它们是构建可理解、可信且可改进模型的重要一步。

IBM 首席研究科学家 Kaoutar El Maghraoui 在接受 IBM Think 采访时说道：“Anthropic 所做的事情非常有趣。他们开始显示出模型会发展出类似联想记忆的内部推理结构。我们在自己的模型中也观察到了类似的行为。”