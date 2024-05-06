无论治理政策是依靠软法还是正式执法，也无论写得多么全面或博学，它们都只是原则。组织如何将这些政策付诸实践才是关键。

例如，纽约市于 2023 年 10 月发布了自己的 AI 行动计划，并于 2024 年 3 月正式确定了其 AI 原则。尽管这些原则与上述主题一致（包括指出 AI 工具“在部署之前应进行测试”），但该市推出的用于回答有关创办和经营企业问题的 AI 聊天机器人却给出了鼓励用户违法的回答。实施过程中哪个环节出了问题？

实施治理需要以人为本、可问责、广泛参与的方法。我们来看看各机构必须采取的三项关键行动：

1. 指定负责的领导者并为其履行职责提供资金支持

没有责任，就谈不上信任。为了落实治理框架，政府机构需要指定负责的领导者，其要具备明确职责且有资金支持的来完成工作。仅举一个知识缺口的例子：我们接触过的几位高级科技领导者根本不了解数据为何会存在偏倚。

数据是人类经验的产物，容易受到固化的世界观和不平等的影响。AI 可以被视为一面镜子，它能将我们的偏见反映出来。我们必须找到能够理解这一点的负责领导者，这些领导者既要在财务上获得授权，又要负责确保他们的 AI 以合乎道德的方式运营，并符合其所服务社区的价值观。

2. 提供应用型治理培训

我们观察到，许多机构会举办 AI“创新日”和编程马拉松，这些活动旨在提高运营效率（例如降低成本、让公民或员工参与进来，以及实现其他关键绩效指标）。我们建议通过以下步骤扩大这些编程马拉松的范围，以应对人工智能治理的挑战：

第 1 步： 在展示试点项目的三个月前，让一位候选治理领导者向编程马拉松参与者发表关于 AI 伦理的主题演讲。





在展示试点项目的三个月前，让一位候选治理领导者向编程马拉松参与者发表关于 AI 伦理的主题演讲。 第 2 步： 让制定政策的政府机构担任活动评委。提供试点项目的评判标准，如人工智能治理构件（文档输出），包括情况说明书、审计报告、影响层次分析（预期、非预期、主要和次要影响）以及模型运行中的功能和非功能要求。





让制定政策的政府机构担任活动评委。提供试点项目的评判标准，如人工智能治理构件（文档输出），包括情况说明书、审计报告、影响层次分析（预期、非预期、主要和次要影响）以及模型运行中的功能和非功能要求。 第 3 步： 在演示日期前的六到八周内，针对特定用例举行研讨会，为团队提供有关开发这些构件的应用培训。邀请多元化、多学科团队参加这些研讨会，评估伦理并建立风险模型，从而加强开发团队的能力。





在演示日期前的六到八周内，针对特定用例举行研讨会，为团队提供有关开发这些构件的应用培训。邀请多元化、多学科团队参加这些研讨会，评估伦理并建立风险模型，从而加强开发团队的能力。 第 4 步：在活动当天，让每个团队全面展示他们的工作，说明他们如何评估和降低与其用例相关的各种风险。具有领域专业知识、监管和网络安全背景的评委应对每个团队的工作提出质疑和评价。

这些时间表是根据我们的培训经验制定的，我们为从业人员提供了针对非常具体用例的应用培训。让有志成为领导者的人有机会在教练的指导下完成治理的实际工作，同时让团队成员扮演有辨识力的治理评委的角色。

但仅有编程马拉松还不够。一个人不可能在三个月内学会所有事情。各机构应投资建设促进持续学习的人工智能素养文化，必要时摒弃旧有假设。

3. 除了算法影响评估之外，还要评估库存

开发许多 AI 模型的组织通常依赖算法影响评估表作为主要机制来收集有关库存的重要元数据，在部署之前会评估并降低 AI 模型的风险。这些表格仅调查 AI 模型的所有者或采购者，了解 AI 模型的用途、模型的训练数据和方法、责任方以及对差异性影响的担忧。

在缺乏严格的教育、沟通和文化考量的情况下，单独使用这些表格会引发诸多担忧。其中包括：

激励：个人是否有动力认真填写这些表格？我们发现，大多数人缺乏动力，因为他们有任务指标要完成。



风险责任：这些表格可能暗示模型所有者将免除风险，因为他们使用了某种技术或云主机或者模型是从第三方采购的。



AI 的相关定义：模型所有者可能没有意识到他们采购或部署的模型符合法规中所描述的 AI 或智能自动化的定义。



忽略差异性影响：将算法评估表的填写和提交责任放在一个人身上，可以说在设计上忽略了对差异性影响的准确评估。

我们发现有些人的表格输入信息令人担忧，包括来自不同地域和不同教育水平的 AI 从业者，以及那些声称自己阅读过发布的政策并理解原则的人。此类输入包括“如果我不收集 PII，我的 AI 模型怎么可能会不公平？”和“由于我完全出于好意，因此不存在差异性影响的风险。”这些都表明，迫切需要开展应用培训，并建立一种组织文化，根据明确定义的伦理准则来持续衡量模型行为。