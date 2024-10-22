各组织正在构建一系列利用生成式 AI 的全新项目。在数据收集和处理阶段，您不仅需要收集大量数据来训练模型，还需要为多个不同人员提供访问权限，例如数据科学家、工程师、开发人员等。将所有数据集中在一个地方并允许许多人访问这些数据，这本身就存在风险。这意味着，生成式 AI 是一种新型数据存储，可以在现有组织数据的基础上创建新数据。无论您是对模型进行训练、微调，还是将其连接到 RAG（矢量数据库），这些数据中都可能包含 PII、隐私问题和其他敏感信息。这堆敏感数据如同明晃晃的靶心，攻击者必然会企图获取其访问权限。

在模型开发过程中，新的应用程序正以全新的方式构建，但同时也带来了新的漏洞，这些漏洞会成为攻击者试图利用的新入口点。开发之初，数据科学团队通常会从在线模型库（如 HuggingFace 或 TensorFlow Hub）下载预训练的开源机器学习模型，并将其重新利用。开源模型共享库的诞生源于数据科学固有的复杂性、从业者短缺，以及它们为组织提供的价值，可以显著减少采用生成式 AI 所需的时间和精力。然而，这些存储库可能缺乏全面的安全控制措施，最终会将风险转嫁给企业，而攻击者正指望着这一点。他们可以向这些模型中注入后门或恶意软件，并将受感染的模型上传回模型共享库，从而影响任何下载该模型的人。ML 模型相关的安全技术普遍匮乏，加上 ML 模型接触到的敏感数据日益增多，这意味着针对这些模型的攻击很有可能会造成损害。

在推理和实时使用过程中，攻击者可以操纵提示来突破防护措施，并通过对包含偏见、虚假和其他有害信息的有害提示生成禁止响应来诱使模型做出不当行为，从而对企业造成声誉损害。或者，攻击者可以操纵模型并分析输入/输出对，以训练代理模型来模仿目标模型的行为，从而有效地“窃取”其能力，并损害企业的竞争优势。