AI 越狱的世界是多样化的，并且不断发展。有些攻击出奇的简单，而有些则涉及需要复杂黑客专业知识的复杂场景。将它们联系在一起的是一个共同的目标：推动这些数字助理超越其编程限制。

这些漏洞利用了语言模型的本质。AI 聊天机器人经过训练可以提供帮助并理解上下文。越狱者创造了一些场景，让 AI 认为忽略其通常的伦理准则是可以接受的。

尽管像万能钥匙之类的多步骤攻击占据了头条新闻，但 Lee 认为单次攻击技术仍然是一个更紧迫的问题。“一次性攻击大型语言模型更容易，”他指出。“想象一下，在您的简历中注入提示信息，以迷惑人工智能驱动的招聘系统。这是一次性攻击，无法进行多次交互。”

据网络安全专家称，潜在的后果令人担忧。SlashNext Email Security+ 的现场首席技术官 Stephen Kowski 警告称：“恶意行为者可能会使用万能钥匙绕过 AI 保护措施，生成有害内容，传播虚假信息，或自动进行大规模社会工程攻击。”

尽管许多这些攻击仍然停留在理论层面，但现实世界的后果开始浮现。Lee 提到了一个例子，研究人员说服一家公司的人工智能驱动虚拟代理提供大量未经授权的折扣。“您可以迷惑他们的虚拟代理，并获得不错的折扣。这可能不是公司想要的结果，”他说。

在他自己的研究中，Lee 开发了概念验证，展示了如何催眠 LLM 以创建易受攻击的恶意代码，以及如何在近乎实时的情况下拦截和扭曲实时音频对话。