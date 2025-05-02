在英国牛津一个灰蒙蒙的早晨，Christopher Summerfield 坐在实验心理学系办公室里，桌角整齐叠放着书稿。那段时间异常繁忙：在人类认知研究、与 AI 实验室合作以及满满的教学日程之间，Summerfield 仍抽出时间撰写了《这些奇异的新思想：AI 如何学会说话及其意义》（These Strange New Minds: How AI Learned to Talk and What It Means）。
这部新著集历史叙述、思想宣言与哲学沉思于一体，围绕一个长期困扰技术专家与哲学家的问题展开：当机器表现出思考迹象时，其背后真实的运作本质究竟是什么？
Summerfield 的新书恰逢其时。AI 的突破——从 GPT-4 等多模态模型的问世，到受大脑启发的 IBM NorthPole 芯片——正在重塑科学家、政策制定者及公众对机器智能的认知。随着 AI 系统能力的提升，其认知状态——是否真正具备推理、规划与思考能力——成为当下最紧迫且最具争议的议题。在《这些奇异的新思想》中，Summerfield 认为，要洞察 AI 的未来，首先必须理解人类推理的本质，并认识生物思维与 AI 之间的异同。
作为牛津大学认知神经科学教授，Summerfield 担任人类信息处理（HIP）实验室负责人，该团队旨在研究人类与人工系统如何学习、分类信息并做出决策。他的工作融合了行为实验、计算建模与神经数据分析，经常探索大脑功能与机器学习的相似之处。随着 AI 模型日益复杂，他的研究逐渐汇聚于认知科学、AI 与社会科学的交叉领域。
实验心理学系目前坐落于牛津科学区边缘一片略显陈旧的建筑群中，仿佛一个处于转型的空间：白板上密布图表，旧木的气息与新布线的味道交织。很快，Summerfield 和同事们将搬入生命与思维大楼——一座由浅色石材与玻璃构成的闪亮建筑群，现代整洁的外观下正在打造脑电图室、睡眠实验室和眼动追踪室。即便牛津改造了基础设施，大楼内的氛围依旧未变——严谨而从容，透着那份静默而专注的力量，这是毕生致力于理解人类与其他智能思维如何形成的人所特有的气质。
在实验室之外，Summerfield 开设了一门课程——《如何从零构建大脑》（How to build a brain from scratch），该课程融合了心理学、神经科学与 AI，探讨学习与推理的基本原理。他以强调清晰与易懂而著称，这一特质随着 AI 讨论从技术圈扩展到公众领域，愈发显得重要。
在采访中，Summerfield 显得既轻松又专注。几缕凌乱的头发竖起，映衬着他讨论想法时那张坦率而充满活力的面庞。他身着简约的深色毛衣，佩戴金丝边眼镜，看起来更关心解决问题，而非营造光鲜的形象。晨光映照下，他身后的白板上密密麻麻地布满箭头、方程和图表，显得生机勃勃。
“人们往往以截然相反的视角看待 AI，”他说，“乐观者认为，我们很快就会拥有比人类更聪明的技术；而怀疑者则视 AI 为炒作——企业用来控制我们的又一工具。”
近期的发展为他提供了多维视角与研究素材。GPT-4、Claude 以及 IBM 的 Granite 等模型展现出更广泛的推理能力，超越了早期仅预测序列下一个词的系统。研究者们还在开发多智能体框架，使多个 AI 系统通过协作或竞争完成任务——一些人认为，这是一种迈向更复杂、涌现行为的探索路径。
与此同时，像 IBM 这样的公司正致力于受大脑启发的设计。例如，NorthPole 芯片旨在模拟生物神经网络的特性，更注重能效与并行处理，而非单纯的算力堆砌。在 Summerfield 看来，这表明人们越来越意识到，仅仅扩大传统 AI 方法的规模或许不足，而借鉴生物学的新型智能模型，可能为未来指明方向。
当被问及像 ChatGPT 这样的大型语言模型（LLM）是否具备推理能力时，Summerfield 毫不迟疑地回答：“可以，但有一定的界限。”
他补充道：“至少在某些特定领域，当今的 AI 系统的推理能力已超越人类。”
他表示，这并不令人惊讶。几十年来，机器在专业推理任务上的表现早已超越人类——这并非始于 IBM 的国际象棋系统 Deep Blue，而是早在 1956 年，Logic Theorist 程序就成功证明了其创造者未曾预料的数学定理。
当今的 LLM 不仅能检索信息，还能生成代码、撰写文章，并提出复杂问题的解决方案。作为最新的前沿方向，多模态 AI 让系统能够同时处理图像、文本、音频和视频，从而进一步扩展能力，研究者希望这能接近更全面的整体化推理。
“在大多数认知任务上，模型的表现优于大多数人，”Summerfield 说。但他也迅速提醒，仍存在显著局限。模型往往难以胜任那些需要深度社会理解的任务——如驾驭情绪、揣测意图，或把握人际互动中不言而喻的微妙细节。
“社会互动对我们的生存至关重要，”他解释道。“模型并非在那个世界中训练。它们缺失了一些使人类社交推理如此复杂的动机和情感线索。”
近期研究尝试检验 AI 系统是否能发展出“心智理论”——即将心理状态归因于他人的能力。一些实验模型在受控环境中显示出这一能力的迹象，但研究者普遍认为，AI 仍远远落后于人类每天运用的分层直觉式思维模型。
Summerfield 指出，虽然当今系统在模拟逻辑推理方面表现出色，但它们并不真正理解自己在做什么。它们缺乏对世界的亲身体验——这是任何巧妙提示都无法彻底弥补的根本局限。
当我们把目光投向人类思维的另一核心要素——记忆时，这些差异的本质就愈发清晰。
动机为思维指明方向，记忆则赋予其连续性。而在这一点上，机器同生物思维之间的差距尤为明显。
人类拥有多种记忆系统。短期记忆依赖大脑的动态电活动，使人能够在短时间内存储并处理信息。相比之下，长期记忆依赖神经连接的物理性变化——一个缓慢而具适应性的过程，使人们能够在多年乃至数十年间保留知识、经验与技能。
在认知科学中，研究人员将记忆分为：外显记忆（个人事件的记忆）、语义记忆（一般事实和概念）以及程序记忆（如骑自行车等技能）。由杏仁核等大脑结构深度编码的情绪记忆会在一生中影响人的行为和决策。
相比之下，当今的 AI 模型对记忆的处理方式截然不同。大型语言模型（LLM）在固定的上下文窗口中运行：它们在交互过程中暂时保留信息，但会在交互结束后丢弃。一旦对话结束，系统的记忆便会被重置。
“当你与语言模型交互时，”Summerfield 说，“它没有持续的个人历史。除非这些信息被明确传递，否则它无法记住你是谁，也无法记住你们的讨论内容。”
这种限制不仅令人不便。对于人类来说，记忆随着时间的推移，不仅塑造个人身份，还能加深关系、建立信任、感知细微差异，并实现共享意义。缺乏这一能力的 AI 系统本质上仍是交易性的——在即时模式匹配上表现出色，却无法建立持久的上下文。
一些研究人员正在尝试赋予 AI 系统更持久的记忆。OpenAI 的 ChatGPT Memory 项目，使模型能够记住跨会话的交互内容。Anthropic 表示，其设计的 Claude 模型侧重于在较长对话中保持语境连贯性。然而，这些方法仍处于早期阶段，并引发了用户隐私、数据安全及潜在操控风险等重大技术与伦理问题。
即便开发者克服了技术障碍，理念上的差距仍然深远。人类的记忆不仅是事实的存储，它是可塑的、充满情感且主观的。它会随着新的体验而不断演化，并赋予旧有记忆新的意义。
“在人类身上，记忆不仅仅是存储，”Summerfield 指出，“它是一种诠释，即通过当下的视角不断重写过去。”
他认为，缺少这一点，AI 永远无法具备真正智能——也无法体现真正的人性核心。
尽管人工系统目前存在局限性，Summerfield 相信，构建思维机器的尝试已经在重塑科学家对自然智能的理解方式。
“在某些层面上，AI 是一种存在的证明，”他说，“如果某些计算策略对机器有效，也可能同样适用于生物系统。”
最引人注目的进展之一，是发现相对简单的神经网络架构在大规模扩展后，也能展现出过去被认为只可能由更复杂设计实现的行为。Transformer 模型是 ChatGPT、Granite 和 Claude 等系统的核心，它展示了仅通过统计训练，就能够实现大规模的模式识别与泛化能力。
这一成功促使认知科学家重新审视长期以来关于人类如何学习、推理和概括的理论。特别是，它挑战了“智能必须通过复杂符号规则进行硬编码”的观点。相反，它表明，人类的大部分推理可能源自在大量数据和经验上运行的简单机制。
现代 AI 模型能够推断陌生问题的解决方案、完成类比，甚至在适当条件下进行某种形式的元认知：对自身推理的推理。开发人员并未明确编程这些能力；它们是在训练过程中自发产生的，反映了人类认知灵活性的某些特征。
然而，Summerfield 很快提醒不要轻率地进行类比。虽然大脑与 AI 在抽象层面上可能相似，但其底层系统仍有根本差异。他说，人脑是在压力下进化形成的，这种压力将情感、动机和偏见深深嵌入认知结构，而这些特征在机器系统中基本缺失。
他说：“在算法层面上存在惊人的相似之处，但其底层——智能得以实现的媒介——则完全不同。”
人类的思维并非完全逻辑化，也不是冷静无情的。它受到情感的影响，受社会环境的引导，并在生存与繁衍的需求下塑造。这些多层次的复杂性导致了AI 模型尽管拥有卓越的统计学能力，却无法完全复制其行为。
尽管如此，Summerfield 认为，构建与研究 AI 的过程正帮助研究人员更清晰地理解智能本质：智能并非单一能力，而是由众多相互交织的能力所产生的涌现现象。
他说：“我们对自身的理解，与对机器的理解同样深刻。”
如果说在 AI 中植入记忆的努力凸显了机器与思维之间的差距，那么意识问题则进一步放大了这种对比。
人工系统可能具备意识，即可能拥有主观体验、自我意识或内在精神生活，这一概念长期以来一直是认知科学与哲学领域最具争议的话题之一。
Summerfield 以其一贯精准的态度探讨这一问题。他持怀疑态度，并非认为意识具有神秘魔力，而是因为现有证据根本不支持当今 AI 系统，无论多么强大，具备类似主观意识的说法。
“当语言模型说‘我有意识’时，”他解释道，“它只是重复从人类数据中学到的模式，没有任何独立理由认为这些话语反映了内部真实。”
像 GPT-4 这样的 LLM 是为预测下一条最可能的文本而训练的，而非为了产生内省体验。当被问及内部状态时，它们能够给出连贯回答，但连贯性并不能可靠地反映意识。
部分研究者提出了针对机器意识的行为测试，通过考察 AI 反应的复杂性、适应性与连贯性进行评估。然而，在无法触及主观体验的前提下，这类评估仍属于推测范畴。
Summerfield 指出：“我们评估非人类动物的意识已经相当困难了。而在建立于完全不同基础的合成系统中推断意识，更是难上加难。”
在生物系统中，意识似乎源于数十亿神经元的复杂互动，并与情绪、身体感受及具身体验的历史紧密交织。相比之下，当今 AI 模型通过对输入数据进行数学转换来运行，缺乏感官基础和情感背景。
Summerfield 打了一个简单比喻：“你可以在电脑上模拟飓风的行为。但模拟过程中既不潮湿也不刮风，它只是一个抽象概念。”
同样，AI 可以模拟对话的外在模式，甚至模拟意识的自我报告，但并不会产生任何内部体验。缺乏感知、具身化或内在驱动力，AI 模型虽强大，却空洞无实。它们是出色的模仿者，而非独立思考的心智。
目前，Summerfield 认为，将 AI 系统视为复杂工具而非新生实体，是最安全且最有效的做法。若另作他想，可能会将模仿误认为理解，也会分散对其现实世界影响进行紧迫监控的注意力。
谈及未来，Summerfield 提出了一个贯穿我们讨论的核心主题：治理。
“这些系统非常强大，”他说，“它们的发展主要受商业激励推动。”
Summerfield 拥抱技术创新。他认为 AI 在彻底变革医学、教育和科学研究等领域方面拥有巨大潜力。然而，他担心如果不建立严密的保障措施，潜在风险可能会超过其优势。
“我们需要建立机制，确保这些工具的开发和使用负责任，”他说，“这不仅包括技术保障，还应涵盖法律、伦理和民主机制。”
一些治理框架已经开始出现。欧盟的 AI 法案提出了基于风险的监管方法，根据应用可能带来的潜在危害进行管控。在美国，《AI 权利法案蓝图》概述了保护公民免受算法歧视和滥用的原则。与此同时，研究机构和倡导组织正在发布负责任开发与部署的最佳实践。
尽管如此，Summerfield 表示，仍有大量工作亟待完成。他说，许多前沿 AI 系统是在庞大数据集上训练的，而用户往往未给予明确同意。它们的内部机制不透明，即使对创造者而言也是如此，而且部署过程中通常缺乏有效的透明度和问责制。
“这不仅仅是技术修复，”他说，“更关乎社会选择。”
他指的是关于 AI 进步的受益者与风险承担者的选择：谁获益？谁承担风险？谁在掌控这些日益影响我们的经济、信息生态系统乃至亲密关系的工具？
最终，Summerfield 认为 AI 并非遥远陌生的智能，而是我们自身的映照——一面不完美的镜子，映出我们的能力与盲点。他认为，弄清楚我们在镜中所见，将成为未来数年的关键挑战之一。正如《这些奇异的新思想》所强调的那样，理解之旅才刚刚起步。
