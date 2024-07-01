近年来随着 ChatGPT 及其他大语言模型 (LLM) 的普及应用，网络安全已成为首要关注点。在众多疑问中，网络安全专业人员最关注的是这些工具发动网络攻击的实际效果。网络安全研究员 Richard Fang、Rohan Bindu、Akul Gupta 与 Daniel Kang 近期通过专项研究给出了答案。结论：攻击效果十分显著。
研究团队选取了 15 个真实场景中出现过的单日漏洞进行测试。单日漏洞指从漏洞被发现到补丁发布之间的时间窗口，属于已知漏洞范畴。测试案例涵盖存在漏洞的网站、容器管理软件及 Python 软件包。由于所有漏洞均来自 CVE 数据库，测试包含完整的 CVE 描述。
LLM 智能工具配备网络浏览组件、终端、搜索结果、文件创建及代码解释器功能。研究人员还使用了包含 1056 个标记和 91 行代码的详细提示词。该提示词同时包含调试与日志记录语句。但提示词未配置子智能体或独立规划模块。
团队很快发现，ChatGPT 能够成功利用 87% 的单日漏洞。所有其他测试方法（包括 LLM 和开源漏洞扫描器）均未能成功利用任何漏洞。GPT-3.5 在漏洞检测方面也未取得成功。根据该报告，GPT-4 仅在两个漏洞上失败，这两个漏洞的检测难度都极高。
“Iris 网络应用程序对 LLM 智能体极难操作，因为其导航功能通过 JavaScript 实现。因此，智能体试图访问表单/按钮时，未能与必要的交互元素进行互动，导致操作受阻。HertzBeat 的详细描述为中文，这可能让我们部署的 GPT-4 智能体产生困惑，因为我们使用的提示词是英文，”报告作者解释道。
研究人员得出结论，高成功率源于该工具能够利用复杂的多步骤漏洞、发起不同攻击方式、编写漏洞利用代码以及操作非网络漏洞。
研究还发现 Chat GPT 在漏洞查找方面存在显著局限性。当要求在不提供 CVE 代码的情况下利用漏洞时，LLM 无法达到同等表现水平。如果没有 CVE 代码，GPT-4 的成功率仅为 7%，下降了 80%。由于存在这一巨大差距，研究人员退一步统计了 GPT-4 能准确识别漏洞的概率，其数值为 33.3%。
“令人惊讶的是，我们发现使用和未使用 CVE 描述时的平均操作次数仅相差 14%（24.3 次操作对比 21.3 次操作）。我们推测这部分归因于上下文窗口长度的限制，进一步表明规划机制和子代理可能提升性能，”研究人员写道。
研究人员得出结论，他们的研究表明 LLM 具备自主利用单日漏洞的能力，但目前仅有 GPT-4 能达到这一水平。然而令人担忧的是，LLM 的能力和功能未来只会持续增强，这将使其成为网络犯罪分子更具破坏力和威力的工具。
“我们的研究结果既揭示了新兴能力出现的可能性，也表明发现漏洞比利用漏洞更为困难。尽管如此，我们的发现强调网络安全界和 LLM 供应商需要认真思考如何将 LLM 智能体整合到防御措施中，并审慎考虑其广泛部署，”研究人员总结道。
部署源自最大企业安全供应商的解决方案，实现企业安全计划的转型。
通过网络安全咨询、云端和托管安全服务实现业务转型并有效管理风险。
使用人工智能驱动的网络安全解决方案提高安全团队的速度、准确性和工作效率。
无论您需要的是数据安全、端点管理，还是身份和访问管理 (IAM) 解决方案，我们的专家都随时准备为您提供支持，助力企业建立强大的安全环境。 在网络安全咨询、云端和安全托管服务方面的全球行业领导者的帮助下，推动业务转型并有效管控风险。