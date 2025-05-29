OpenAI 的规模优先思维不仅仅是一个技术结论。Hao 指出，这是其领导层共有的一套连贯但非正统的信念体系的结果。她说，OpenAI 的首席科学家 Ilya Sutskever 是一位深度学习的绝对论者。他认为，如果输入足够多的数据，一个足够大的神经网络最终会发展出类似人类的智能。另一方面，OpenAI 的 CEO Sam Altman 以企业家的视角看待人工智能，认为指数级扩张是获得主导地位的最快途径。OpenAI 总裁 Greg Brockman 是致力于实现这一扩张的工程专家。

实现这一信条的架构是转换器，这是一种于 2017 年首次提出的神经网络。转换器擅长对数据序列（例如文本）进行建模，因为它们可以跟踪句子中长距离单词之间的关系。关键是，它们可以高效地扩展规模。添加更多层和更多参数可以提高性能。

OpenAI 的研究团队意识到，如果他们用足够庞大的数据集和足够的计算能力来训练转换器，就可以绕过对人工设计的特征、符号推理或模块化设计的需求。在他们看来，智能将从数据中产生。

要训练像 GPT-4 这样的模型，OpenAI 不仅需要想法，还需要基础设施。这种规模的语言模型需要成千上万个图形处理单元组成的集群。GPU 最初是为渲染三维图像而设计的，但事实证明，它对作为神经网络核心的矩阵乘法非常有用。但要将它们串联起来作为一个统一的系统，需要定制软件和硬件编排。

OpenAI 的工程师开发了将模型分片的技术，这些分片可以分布在多个芯片上，并进行并行训练。他们创建了检查点协议，以保留部分训练运行，降低灾难性故障的风险。他们构建了自定义通信协议来同步跨机器的更新。这些进步并不耀眼，但却至关重要。

Hao 说：“以前没有人用 10,000 块芯片进行训练。”“他们必须实时解决问题。”

这些进步使得模型的扩展比竞争对手更快、更高效。但也催生了一种新的保密方式。OpenAI 停止公布其突破性成果背后的诸多细节。该公司认为，披露太多就等于放弃了竞争优势。

到 2024 年，大多数大型科技公司都迎头赶上。IBM 、Google、Meta、Amazon、Anthropic 以及 Mistral 等新兴公司都使用类似的转换器架构和训练技术开发了大语言模型。许多公司采用强化学习结合人类反馈的方法，即由人类对模型的输出质量进行评分，从而对模型进行微调，使其更符合人类的偏好。

对外界而言，这些系统之间的差异变得更难辨别。应用程序开发人员开始设计能在后台与任何模型配合使用的接口，以便根据需要切换提供商。定价、延迟和运行时间变得比智能方面的微小差异更重要。

Hao 表示：“现在大家都试图做到不依赖特定模型。“OpenAI 不再垄断优秀的模型。”

随着规模不再是差异化因素，公司开始投资于另一种范式：代理。在人工智能中，代理指的是系统主动采取行动、持续运作并朝着目标前进的能力。代理不是根据提示做出反应，而是计划行动、监控结果并调整行为。

这需要新的能力。模型必须能够跨会话保持记忆，与第三方工具集成，并在没有明确提示的情况下做出决策。目标是从被动的聊天机器人转变为主动的协作者。

OpenAI 一直以来都深受电影《Her》的启发，在这部电影中，一位用户爱上了能无缝适应其需求的 AI 助手。创建这样的系统意味着不仅需要发展智能，还需要提高临场感。Hao 指出，OpenAI 的内部团队一直在产品和研究领域追求这一梦想。

她说：“如果不赋予模型记忆力、持久性和自主性，就无法打造出那样的助手。”

但要让智能体真正有效，OpenAI 需要的不仅仅是算法。它需要新型数据和新的数据收集方法。互联网曾经是训练数据的丰富来源，如今已充斥着合成内容。现在在线提供的许多文档本身就是由以前的模型生成的。

这就造成了一种反馈循环，使在线训练的价值逐渐降低。为了打破循环，公司正在转向更私密的数据收集。Hao 报道称，OpenAI 正在深入了解定制设备，这些设备可以捕捉实时用户行为，包括移动交互、语音对话和环境上下文。

Hao 表示：“线上的 AI 生成内容太多了。”“如果想要高质量的数据，就必须直接从人们那里获取。”

Hao 表示，AI 生成内容的激增带来了关于同意、监控和控制的棘手问题。人们真的可以选择不让自己的数据被收集吗？对于使用他们的话语、图像或行为训练的模型，他们又有多少发言权？

对 Hao 来说，答案不在于技术乐观主义或末日论，而在于透明度。她不认同 AI 领域的主流意识形态——她称之为“boomers”的群体认为人工智能将拯救人类，而“doomers”担心人工智能会带来毁灭。

“我属于问责阵营，”她说，“这些系统反映了制度性权力。我们需要知道它们是如何被制造的，以及哪些人从中受益。”

Hao 表示，公司需要解释其模型如何被测试、使用哪些数据以及如何理解结果。他们应该跟踪错误并分享发现，以便其他人能够进行更仔细的研究。

Hao 警告说，如果没有这种开放性，AI 就有可能成为一个专有的黑匣——强大，但不受约束。