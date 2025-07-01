当前 AI 领域的关注点大多集中在输出上，即模型生成什么、其准确性或说服力如何、在基准测试中的表现怎样。但对 Hagerty 而言，真正的伦理张力出现得更早，始于基础模型层面。这就是现代 AI 的原始基础设施——基于从网络抓取的海量数据训练的机器学习基础层。正是它驱动着 ChatGPT 和 Claude 这类大语言模型 (LLM)。

“基础层才是关键所在，”Hagerty 告诉我。“这是系统最先学习的东西，如果其中充斥垃圾，那些垃圾就不会消失。”

这些基础模型被设计为通用型。Hagerty 指出，正是这一点使其既强大又危险。因为它们并非针对特定任务或约束而构建，往往会吸收一切——从有价值的语义结构到网络上的有害糟粕。而一旦完成训练，这些模型便难以审计。即使是它们的创造者，也往往无法确切说出模型知道什么，或者它将如何响应特定的提示词。

Hagerty 将之比作给摩天大楼浇筑一个有缺陷的水泥地基。如果从一开始配料就不对，您可能不会立即看到裂缝。但随着时间的推移，建筑结构会变得不稳定。在 AI 领域，相应的后果便是系统部署后出现脆弱行为、意外偏见或灾难性误用。如果早期没有经过精心塑造，模型就会将其训练阶段吸收的风险带入每一个下游应用。

他并非唯一有这种担忧的人。斯坦福大学基础模型研究中心的研究人员已多次警告大规模训练带来的新兴风险，包括偏见传播、知识幻觉、数据污染以及难以定位故障。这些问题可缓解但无法根除，因此早期的设计选择（如数据筛选、过滤与治理）就显得尤为关键。

在 Hagerty 看来，取得实质性进展的最大伦理障碍之一，是企业提及“AI”时其含义的极度模糊。若询问五个产品团队“AI 驱动”具体指什么，您很可能会得到五种不同的答案。Hagerty 将这种定义的模糊性视作当前时代核心的伦理缺失之一。

“大多数时候，人们所说的 AI，其实指的是自动化。或是决策树。或者是 if/else 语句，”他说。

术语缺乏清晰度并非学术上的咬文嚼字。当企业将确定性软件包装为智能推理时，用户往往会信任它。当初创公司将基本的搜索与过滤工具吹嘘为生成式模型时，投资者便将资金投向海市蜃楼。Hagerty 称这种现象为“炒作外溢”，并视其为日益增长的混淆与声誉损害的根源。

在金融或医疗等受监管的行业，后果可能更为严重。如果用户被误导，以为系统具备比实际更深刻的认知能力，他们可能会将本应由人类做出的决策委托给系统。工具与智能体之间的界限变得模糊，责任的界定也随之模糊。

这一问题也导致了精力的浪费。Hagerty 引用了近期关于滥用 LLM 进行时间序列预测（一种基于历史数据预测未来值的统计方法）的研究，指出在此类任务上，经典方法反而更准确高效。然而，一些公司仍继续使用 LLM，追求新颖性或彰显创新。

“你是在燃烧 GPU 来获取糟糕的答案，”他说。“更糟的是，你还称之为进步。”

伦理问题不仅是低效。更是一种失实陈述。团队围绕他们几乎不了解的技术构建产品，添加夸大其能力的营销宣传，并将其部署给无法评估其使用内容的用户。