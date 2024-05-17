随着针对企业的深度伪造攻击占据新闻头条，检测专家正在收集关于这些攻击形成方式及其利用漏洞的宝贵见解。
在 2023 年至 2024 年之间，频繁的网络钓鱼和社会工程活动导致账户劫持、资产和数据窃取、身份盗用，以及各行业企业的声誉损害。
大型银行和金融机构的呼叫中心如今不堪重负，面临利用语音克隆技术的大量深度伪造电话攻击，企图入侵客户账户并启动欺诈交易。内部帮助台和员工同样遭受通过电话和消息进行的社会工程活动轰炸，且往往能得逞，正如对内部软件开发公司 Retool 的攻击案例所示，该事件导致该公司客户损失数千万美元。一名财务工作人员被诱骗向诈骗分子转移资金。基于说话人的身份验证系统正被深度伪造音频精巧规避和绕过。
不法分子的入门门槛如今较以往更低。创建深度伪造的工具比以往更廉价、更易获取，即使毫无技术知识的用户也有机会策划复杂的、AI 驱动的欺诈活动。
鉴于网络犯罪手段的日益扩散与升级，利用 AI 实时检测 AI 伪造内容，对保护企业的财务与声誉利益至关重要。
深度伪造是指通过生成式 AI 模型制作或篡改的合成媒体（如图像、视频、音频或文本），其呈现效果足以以假乱真。
深度伪造音频指利用深度学习模型生成或篡改的合成声音。深度伪造音频通常采用语音克隆方法，仅需采集不足一分钟的真实人声样本即可伪造语音。语音克隆对依赖声纹生物认证来核验客户账户的行业构成严重威胁。以高频电话业务为主的企业持续报告其基础设施遭受通过语音克隆实施的深度伪造攻击。
深度伪造视频的制作通常需对包含目标人物影像的大规模视频图像数据集进行深度神经网络训练。模型通过习得目标对象的面部特征、表情及行为习惯，从而生成逼真的伪造视频内容。网络罪犯利用深度伪造视频冒充企业高管、绕过生物特征验证、制作虚假广告等。与此同时，深度伪造图像可用于篡改文件资料，并阻碍了解您的客户 (KYC) 与反洗钱 (AML) 团队遏制虚假身份开户的监管努力。
深度伪造文本指人为生成、意图模仿人类写作风格、结构与语调的内容。这些深度伪造模型通过在海量文本数据集上进行训练，学习词汇间的模式与关联关系，从而学会生成看似连贯且符合语境的句子。此类深度伪造技术能生成大量令人信服的文本，助力网络罪犯实施大规模社交工程和网络钓鱼攻击，并在文件伪造中同样效用显著。
音频深度伪造已成为现代企业，尤其是金融机构面临的最大风险因素之一。银行客户服务中心日益频繁地遭遇试图侵入客户账户的深度伪造语音克隆电话，随着诈骗分子提交经 AI 篡改的文件以开设虚假账户，AI 驱动的欺诈已成为大多数银行的头号安全隐忧。金融工作者在伪造 CEO 声音与形象的深度伪造视频会议中被操控，转移数千万资金 。继 Retool 网络钓鱼攻击后，该公司仅一家加密货币客户便损失了价值 1500 万美元的资产。
但深度伪造网络犯罪造成的损害远不止语音克隆，它能冲击任何行业。保险公司因诈骗分子提交深度伪造证据以骗取非法赔款而面临重大损失。竞争对手可伪造客户证言，或制作声称存在缺陷产品的深度伪造视频与图像，以此损害品牌声誉。尽管制作一条深度伪造内容的平均成本仅为 1.33 美元，但 2024 年全球深度伪造欺诈造成的预期损失将高达 1 万亿美元 。深度伪造对市场乃至整体经济均构成威胁：一则关于五角大楼爆炸的深度伪造消息曾在官方辟谣前引发股市恐慌。更精密的攻击极易导致公司价值大幅受损，并对全球经济造成破坏。
对媒体公司而言，深度伪造造成的声誉损害会迅速导致观众流失与广告收入下滑。在观众已对所见内容普遍存疑的时代，深度伪造进一步抬高了准确报道与事实核查的代价。若作为新闻报道依据或证据的音像资料被证实是未经核实、未作标识的深度伪造内容，对新闻编辑室及媒体与受众关系的损害或将无法挽回。
社交媒体平台同样脆弱，尤其当其已成为大多数美国人的主要新闻来源时。恶意行为者仅需花费 7 美分即可将 weaponized 深度伪造内容传播给 10 万社交媒体用户。任由 AI 操控的新闻内容不受约束地传播，将导致严重的受众与广告商流失、股东动荡，更毋庸提及对整体社会造成的侵蚀效应。
深度伪造虚假信息活动可能损害选举公正性，引发公民骚乱与政府机构内部混乱。此类动荡会引发市场震荡、削弱经济活力，并侵蚀选民对选举制度的信任。新罕布什尔州已有超过4万名选民受到深度伪造拜登机器人电话的影响。但这类活动不仅限于选举。国家支持的行为者可制作领导人发表虚假声明的合成视频，以破坏外交贸易关系、煽动冲突并操纵股市。世界经济论坛《2024 年全球风险报告》将 AI 助长的虚假信息列为未来两年世界面临的首要威胁。
组织应如何应对这一紧迫威胁？归根结底在于检测能力。
能够准确、快速、大规模地检测 AI 生成的语音、视频、图像及文本，可助力组织在企图利用深度伪造实施欺诈或散布虚假信息的威胁参与者前占据先机。
致力于保障客户服务中心、面向客户的团队及内部帮助台安全的人员，将需要寻找能够实时检测 AI 生成语音的解决方案。由于这些接触点极易受欺诈攻击，实时语音深度伪造检测应能无缝嵌入现有语音认证或生物识别平台工作流程，使企业无需针对全新技术栈重新培训员工即可实现平滑集成。
六分之一的银行在客户旅程的任何阶段都难以核实客户身份，金融从业者指出客户开户流程是最易受欺诈的工作环节。文本与图像检测器能有效遏制伪造文件、身份盗用及网络钓鱼企图。完备的深度伪造检测工具集应能强化 KYC 与反欺诈团队的开户及重复认证流程，以防范呈现攻击与注入攻击。
新闻工作者应具备可靠手段确保信源真实性，从而自信开展报道。图像、视频及文本检测模型有助于确保记者不会在合法报道中采用虚假证据。53% 的美国人通过社交媒体获取新闻。配备完善的检测解决方案应能协助内容审核团队（不应期望其人工核验海量内容）保护社交媒体平台免于成为虚假内容的非故意传播渠道。
精密的音频深度伪造检测工具旨在标记政治操纵的最新流行手段：使用政治候选人语音克隆的误导性自动呼叫。国家支持的攻击者现已能轻松伪装成国家元首及其他政治人物。当前检测方案可在关键时刻识别合成冒充内容，确保公众能及时获得预警。文本检测助力政府机构拦截有害的 AI 生成文件与通信，在身份欺诈影响公民生活与生计前予以防范。
Reality Defender 正是这样一种能检测并防护各媒介高级深度伪造的解决方案。其与平台无关的 API 允许组织上传海量内容，并按需扩展检测能力——采用多模型方法从多角度分析每个上传文件，且涵盖最新深度伪造生成模型。由此生成更完整、更可靠的结果评分，准确反映 AI 操纵概率。借助跨多模态的多元模型，组织可采取基于数据的明智后续措施，保护其客户、资产与声誉免受当前及未来复杂深度伪造攻击的侵害。