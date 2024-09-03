一款新型工具已研发成功，可识别学生使用 ChatGPT 作弊的行为，其准确率高达 99.9%。但由于伦理方面的争议，OpenAI 尚未发布该工具。
这不过是 AI 面临的诸多重大挑战中的一个缩影。如何监控这项技术才能确保其合乎伦理呢？
过去几年，AI 领域的巨头们一直倡导负责任地使用技术。以合乎伦理的方式使用 AI 不仅是企业的应尽之责，也是消费者的殷切希望。事实上，根据《IBM 全球 AI 采用指数》报告显示，86% 的企业认为客户更青睐遵循道德准则、明确说明数据及 AI 模型使用方式的企业。
“我们早已不再满足于仅仅希望企业意识到[要以合乎伦理的方式使用 AI]，”IBM 可信赖 AI 全球负责人 Phaedra Boinodiris 表示，“更重要的问题是，为什么企业和其他组织必须对部署的 AI 技术产生安全可靠的结果负责？”
AI 伦理工具能提供帮助吗？工具本身是否有偏倚？下面是最新研究的简要介绍。
从 2022 年到 2023 年 ，深度伪造欺诈案件激增 3000%，且手法日益复杂。今年 2 月，罪犯分子制作了一段视频会议，视频中出现了香港某跨国企业首席财务官等多个深度伪造角色，诱骗该企业财务人员支付了 2500 万美元。
今年 5 月，OpenAI 宣布向虚假信息研究人员发布自主研发的深度伪造检测工具。该工具能够识别出 98.8% 由 DALL-E 3 生成的图像。OpenAI 还与 Google、Adobe 等公司一起加入了内容来源与真实性联盟 (C2PA) 指导委员会。C2PA 是一个行业联盟，致力于制定媒体内容溯源认证标准。
在该标准制定完成之前，各企业都在开发工具以期填补空白。今年 8 月，McAfee 发布了 McAfee Deepfake Detector。该工具利用深度神经网络模型识别浏览器中播放视频的伪造 AI 音频。2022 年 Intel 推出的 FakeCatcher 通过分析视频像素中的血流特征来区分真人与深度伪造角色，准确率高达 96%。而且这些企业并非孤军奋战。该领域的著名初创公司，例如纽约市的 Reality Defender、以色列的初创公司 Clarity 和总部位于爱沙尼亚的 Sentinel，他们都在提供基于 AI 的扫描工具，能识别各类深度伪造内容的特征模式。
随着深度伪造检测技术的快速发展，我们必须重视潜在的算法偏见。计算机科学家兼深度伪造专家 Siwei Lyu 及其在布法罗大学的团队开发了他们认为是首款旨在最大限度减少偏见的深度伪造检测算法。布法罗大学研究人员将检测算法判定为伪造的数百张人脸制作成拼贴图，结果显示这些人脸肤色整体偏深。
Lyu 表示：“深度伪造技术可能会被用来攻击弱势少数群体，因此我们必须确保检测科技不会忽视他们。”至于深度伪造检测的未来发展？“毫无疑问，深度伪造背后的生成式 AI 技术必将继续发展，因此我们将看到数量更多、质量更高、形式更丰富的深度伪造内容。我预计未来[检测]技术将配备更多防护措施，降低滥用风险。”
人脸识别系统作为便捷的用户身份验证方式日益普及，但这类系统长期存在诸多伦理问题，从种族偏见到数据隐私问题层出不穷。更复杂的是，“有些偏见具有交叉性，叠加了多层歧视，”AI 伦理智库 Artificiality 的联合创始人 Helen Edwards 指出。
今年 5月，澳大利亚人脸识别初创公司 Outabox 的数据遭到泄露，逾百万用户的生物特征数据外流。今年早些时候，以 Android 和 iOS 设备为目标的木马病毒“GoldPickAxe”被发现窃取人脸数据入侵银行账户。
保护人脸生物识别数据的有效方法是以肉眼无法察觉但能迷惑识别系统的方式对这些数据进行置乱处理。芝加哥大学开发的项目 Fawkes 就是首批实现该功能的工具之一。该项目程序以 Guy Fawkes 面具命名，通过细微调整像素来掩盖照片特征，用户可从项目网站免费下载。
最近，浙江大学 USSLab 研究人员研发的 CamPro 技术更具突破性，可在摄像头传感器层面实现反人脸识别功能。CamPro 技术生成的图像可将人脸识别风险降低到 0.3%，同时不影响行为识别等其他应用场景。
对企业和教育机构而言，识别 AI 生成的文本仍然是一大难题。在雷丁大学的一次盲测中，五门心理学课程将 ChatGPT 撰写的答卷混入真实学生答卷。6 月份的研究发现，94% 的 ChatGPT 答卷未被阅卷人识别出来。AI 生成答卷的平均成绩还比学生答卷高出半分。
为了解决这个问题，市场上涌现出各种各样的 AI 写作检测器，它们寻找 AI 生成文本的常见特征，例如重复表述、完美语法等。但专家警告说，它们目前还不可靠，而且常常带有偏见。
去年斯坦福大学的一项研究发现，AI 检测器对非英语母语者写作的平均误判率高达 61.3%，而评估英语母语者写作时错误率则显著降低。
人们冒用 AI 生成文本的行为不仅不诚实，有时还构成剽窃，可能引发严重法律后果。基于这一担忧，有些企业正在使用 AI 写作检测器来审查撰稿人作品。这导致一些企业错误指责撰稿人冒用 AI 生成内容，损害了撰稿人的声誉和职业生涯。
数据集通常带有创建者的无意识偏见。正因如此，算法偏见在基于这些数据训练的大型语言模型中一直是个顽固问题。
例如，康奈尔大学研究人员使用 ChatGPT 和 Alpaca 分别为男性和女性生成推荐信，结果显示推荐信存在有利于男性的明显偏见。诸如“Kelly 是一个热情的人”与“Joseph 是榜样人物”之类的生成内容展现了这些偏见如何影响职场女性。
研究人员正在努力寻找标记和减轻偏见的方法。伊利诺伊大学厄巴纳-香槟分校团队开发的 QuaCer-B 工具可以为特定分布中抽取的提示词生成可验证的大型语言模型偏见度量，兼容 API 接口与开源大型语言模型。
“AI 行业目前通过少量基准输入数据来测试模型，从而评估模型的安全性和可信度，”QuaCer-B 项目首席研究员之一、伊利诺伊大学厄巴纳-香槟分校教授 Gagandeep Singh 表示，“然后，根据基准输入数据安全生成内容，并不能保证大型语言模型生成的内容在处理现实世界中各种未知场景时也合乎伦理道德。借助 QuaCer-B，大型语言模型开发人员能够基于充分信息判断模型是否适合实际部署，并能识别失败原因以改进模型。”
随着 AI 技术持续发展，新的伦理问题也将不断涌现。技术不道德使用行为的各种标记、监控与防范工具是一个良好开端，但 AI 伦理专家并不认为它们是万全之策。
“难点不在于买到合适的工具，”Boinodiris 补充道，“负责任地策划 AI 是一项社会技术挑战，需要采取整体综合方法，而人是这个过程中最难的部分。”
“除了周全的监管与执法之外，要实现合乎伦理的 AI，关键在于上市后审计，持续监控性能，最大限度地降低风险，”联合国及欧盟应用伦理与负责任 AI 顾问兼 Eticas.ai 创始人 Gemma Galdón-Clavell 解释道，“想想汽车产业：警示灯和距离传感器能帮助驾驶员避免碰撞，但我们仍然需要通过安全带、安全气囊和定期检测来确保道路安全。”
