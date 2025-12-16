AI 模型不仅能处理更多的数据，而且其处理数据的方式也与传统系统不同。如果某个传统软件意外泄露敏感信息，工程师可以及时干预并调试代码。但是 AI 模型——包括大语言模型（如 ChatGPT）并非通过编码构建，而是依靠机器学习流程持续演进。它们的构建者本身也无法完全了解其运作原理，因此“调试”即使可行，也绝非易事。

意外输出就是值得关注的风险类别，但组织也需警惕图谋不轨的恶意攻击。研究人员已证明，AI 工具包含新型漏洞，狡诈的黑客可以利用这些漏洞，而这一领域称为“对抗性机器学习”。

例如，近年来，网络安全专家已证实：通过利用 AI 模型的一项特性——即模型在回应训练数据时会给出更高的置信度评分，不法分子可据此推断特定数据是否曾出现在训练集中。在某些情况下，这类推断将构成重大隐私泄露风险。例如，评估某个 AI 模型是否使用 HIV 感染者私人医疗记录进行训练。

在另一个广为人知的案例中，研究人员不仅会推断数据是否曾出现在训练集中，他们还创建了一种算法攻击模式，可以针对用于训练模型的实际数据进行逆向工程。借助 AI 模型的“梯度”特性，研究人员能够将填充噪声的图像迭代优化为高度接近真实人脸的图像，后者曾用于训练面部识别模型。2

数据保护的风险依然很高：IBM 发布的“2025 年数据泄露成本报告”表明，此类泄露事件的平均成本为 440 万美元。（此类泄露事件还会以损害品牌公信力的形式，造成难以量化的损失。）

虽然这些数据泄露事件大多与 AI 无关，但涉及 AI 的案例正日益增多。斯坦福大学发布的“2025 年 AI 指数报告”指出，AI 隐私和安全事件的数量在一年内已增长 56.4%，2024 年报告的案例已达 233 起。3