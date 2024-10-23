人工智能 安全

AI 幻觉可能构成网络安全风险

两名电脑程序员处理新项目的后视图

2023 年初，谷歌的人工智能聊天机器人 Bard 因犯下一个严重错误登上新闻头条，而这个错误正是我们如今所说的 AI 幻觉。在演示环节中，当被问及“詹姆斯·韦伯太空望远镜有哪些新发现可以告诉我 9 岁的孩子？”Bard 声称于 2021 年 12 月发射的詹姆斯·韦伯太空望远镜拍摄到了太阳系外系外行星的"首张图像"。然而历史记录显示，欧洲南方天文台的甚大望远镜早在 2004 年就成功捕获了首张系外行星照片。

什么是 AI 幻觉？

简单来说，AI 幻觉是指大语言模型 (LLM)（如生成式 AI 工具）提供了错误的答案。AI 幻觉的表现形式多样：有时是完全编造的答案，例如虚构一篇并不存在的研究论文；有时则是给出错误信息，谷歌 Bard 的这次失误便是典型案例。

产生幻觉的原因多种多样，但最大的原因是模型用于训练的数据不正确——AI 的准确性取决于它采集的信息。输入偏差也是一个重要原因。如果用于训练的数据包含偏差，那么大语言模型将会发现实际上不存在的模式，从而导致错误结果。

随着企业与消费者愈发依赖人工智能实现自动化运营与决策支持，尤其在医疗健康、金融等关键领域，这类错误所潜藏的风险也日益突出。据 Gartner 称，AI 幻觉会损害决策和品牌声誉。此外，AI 幻觉会导致错误信息传播。更重要的是，每一次 AI 幻觉都会削弱人们对 AI 结果的信任度。这将引发广泛影响，而如今企业对该技术的依赖却在持续加深。

虽然人们很容易盲目信任 AI，但在使用 AI 时必须采取平衡的方法。通过采取预防性措施降低 AI 幻觉的发生概率，组织可在充分发挥 AI 技术优势的同时，有效管控包括幻觉风险在内的潜在问题。

组织越来越多地使用生成式 AI 来保障网络安全

虽然有关生成式 AI 的讨论往往集中在软件开发方面，但这一问题对网络安全的影响也越来越大。原因在于各大组织开始将生成式 AI 用于网络安全。

许多网络安全专业人员借助生成式 AI 开展威胁搜寻工作。尽管人工智能驱动的安全信息与事件管理 (SIEM) 系统已优化了响应管理流程，但生成式 AI 可通过自然语言检索功能，实现更高效的威胁搜寻。分析人员可使用自然语言聊天机器人来发现威胁。一旦检测到威胁，网络安全专业人员可以借助生成式 AI 制定一套运行手册。由于生成式 AI 使用训练数据来创建输出，分析人员可以获取最新信息，从而针对特定威胁采取最佳应对措施。

生成式 AI 在网络安全领域的另一常见应用是培训赋能。借助生成式 AI 技术，网络安全专业人员可利用实时数据与当前活跃威胁情报，构建高度仿真的攻防场景。通过这类模拟演练，网络安全团队能够获得以往难以获取的实战化经验与实操。由于训练场景中的威胁与他们当日或当周可能遭遇的实际威胁高度相似，专业人员得以针对当前最新威胁开展训练，而非局限于过往的威胁类型。

AI 幻觉如何影响网络安全

网络安全领域中 AI 幻觉引发的最严重问题之一，是这类错误可能导致组织忽视潜在威胁。例如，AI 工具可能遗漏某一潜在风险，最终引发网络攻击。这类情况的发生，往往源于模型中存在的偏倚。而该偏见由带有偏倚的训练数据导致，使得工具未能识别某一关键模式，进而影响最终判断结果。

另一方面，AI 幻觉可能会产生虚假警报。如果生成式 AI 工具伪造威胁或错误识别漏洞，员工将开始对该工具的信任减少。此外，组织会将资源集中在解决虚假威胁上，这意味着真正的攻击可能会被忽略。每当 AI 工具输出不准确的结果，员工对该工具的信任度就会下降，这使得他们未来使用 AI 或采信其结果的可能性大幅降低。

同样，幻觉可能提供不准确的建议，从而延长检测或恢复时间。例如，生成式 AI 工具可能准确发现可疑活动，但提供不准确的后续步骤信息或系统建议。由于 IT 团队采取了错误的应对措施，网络攻击未能得到遏制，威胁参与者成功获取了系统访问权限。

减少 AI 幻觉对网络安全的影响

通过理解和预判 AI 幻觉，组织可以采取积极措施，既减少幻觉发生，也减少其影响。

以下是三个技巧：

  1. 对员工进行提示工程培训。生成式 AI 的结果质量在很大程度上取决于请求所使用的特定提示词。然而，许多员工在编写提示词时缺乏正规培训，也不了解如何向模型提供准确有效的信息。组织若能对 IT 团队开展提示词使用专项培训，指导其编写具体明确的提示词，不仅能提升 AI 输出结果的质量，还有可能降低人工智能幻觉的发生概率。
  2. 关注数据清洁度。AI 幻觉的发生往往与训练数据被污染相关，即训练数据中存在错误或不准确信息。例如，若某模型的训练数据包含后续被证实为虚假报告的网络安全威胁信息，该模型可能会误判不存在的威胁。组织若能尽可能确保模型使用干净数据，便能有效减少部分 AI 幻觉的出现。
  3. 将事实检查纳入流程。就当前生成式 AI 工具的成熟度而言，AI 幻觉或许是其应用过程中难以避免的问题。组织应假定此阶段可能返回错误或不准确的信息。通过设计事实核查流程，确保员工采取行动前所返回的所有信息都是准确的，组织可以减少幻觉对业务的影响。

营造公平的网络环境

许多勒索软件团伙和网络犯罪分子正在利用生成式 AI 发现漏洞并发起攻击。借助这类工具打击网络犯罪的组织，能够获得更公平的竞争优势。同时，通过采取前瞻性措施防范 AI 幻觉并降低其影响，企业可更高效地运用生成式 AI，助力网络安全团队更有力地保护数据资产与基础设施安全。。
