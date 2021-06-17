多种力量推动了行业对值得信赖的 AI 的关注—企业的社会责任姿态、对声誉风险的担忧以及越来越多的法规。组织认识到，它们需要一种系统化的方法来确保 AI 和机器学习的可靠性与可操作性。值得信赖的 AI 的元素包括公平性、稳健性、隐私性、可解释性和透明度。用例模式包括对现有应用程序进行运行状况检查和创建组织范围内的人工智能治理框架；但今天，我们将重点关注实施新的应用程序。
组织需要一种系统化的方法，以可信赖的方式构建并运行新的 AI 应用程序。此方法必须考虑端到端数据科学和 AI 生命周期。AI 生命周期由一系列阶段组成，而这些阶段汇集了各种角色和最佳实践。（请参阅 O'Reilly 的报告《实施 AI》，了解总体情况）。生命周期的各个阶段包括：
理想情况下，值得信赖的 AI 的各个方面都应在每个阶段得到解决，而不仅仅是在最后阶段得到解决。我们需要在每个阶段设立适当的防护措施，其中涵盖从业务定义、数据探索和模型构建，到模型验证、部署、监控和持续管理。让我们深入了解一下每个阶段，以及如何解决值得信赖的 AI 的各个方面。
此阶段可用于指导确定用例的优先级和 AI 行动计划的制定。相关团队由业务利益相关者、数据科学家、数据所有者、运营主管和其他角色组成，并首先关注用例，以便定义业务价值并指定关键绩效指标 (KPI)。然后，AI 会处理技术任务，以将业务目标转化为待解决的具体 AI 任务。最后，团队需制定结构化行动计划，以创造用于支持业务目标的既定技术任务的解决方案。
应用企业设计思维原则是此阶段的一项最佳实践。设计思维有助于在用例的背景下识别和定义偏见/公平性、稳健性、可解释性等各种业务与技术方面的问题。此阶段有助于回答以下问题（例如）：
同样重要的是，要记下团队在构建这些用例时需遵循的所有组织数据和 AI 政策，以免在针对生产用途尝试验证时出现临时挑战。
此阶段允许数据消费者查找和访问相关数据集。数据科学团队可在中央目录（使用元数据或业务术语进行搜索）中“购买数据”。他们能理解这些数据，其中包括其所有者、沿袭、与其他数据集的关系，等等。为数据科学家提供数据沿革的技术视角非常重要，这样他们才能理解每一次数据转换，而这些转换可能会影响他们如何创建和使用功能。
根据该探索，他们可以请求数据馈送。一旦获得批准，数据集便可提供给数据科学团队在其数据科学开发环境中使用。
如果团队需要使用受管制的个人数据（例如，个人身份信息 (PII) 或受保护的健康信息 (PHI)），则数据管理员或数据提供商必须通过适当的匿名化处理来确保共享数据遵守法规。
数据科学团队会深入了解并准备这些数据，并在此阶段构建、训练和测试其 AI/ML 模型。此阶段的活动最好以一系列敏捷冲刺的形式来开展。即使在开始建模工作之前，也必须在此阶段检查数据偏差。这是为实现公平而设的内部防护措施，而此类防护措施可在模型构建步骤期间及之后予以实施。在此阶段，可类似地考虑和测试模型的稳健性、可解释性及其他方面。
成功完成这些测试后，MLOps 管道便允许将模型和相关资产从开发环境移动到生产前验证环境。
此阶段包括模型验证和部署到生产环境。验证活动可由构建模型的团队以外的团队执行，例如组织的模型验证团队、模型风险管理团队或外部实体。
该团队负责验证质量、稳健性、公平性等并生成验证报告。其中的重点在于捕获验证结果以进行参考和比较。模型情况说明书、局部与全局解释以及其他指标也会受到检查。
如果模型通过验证，Ops 团队便可使用 MLOps 管道将其推广到生产环境。模型将在此处进行部署，以用于在线或批量调用。
在此阶段，Ops 团队会在生产环境中对 AI/ML 模型进行持续监控和管理。团队需配置监控器，以便定期收集指标数据。质量、稳健性和公平性的监控频率由业务需求决定。监控数据和准确性漂移、生成特定事务的解释以及监控全局行为是持续进行的活动的其中部分示例。
企业可选择在监控系统检测到有人超过阈值时采取的行动，而其范围则涵盖从警报到纠正措施。可配置偏差缓解或模型再训练步骤，以确保持续的可信行为。可根据业务或技术标准停用模型。此阶段可为值得信赖的 AI 建立最外层的防护措施。
这些 AI 生命周期阶段符合企业的人工智能治理框架。此类框架允许多个用例一致地遵循生命周期阶段，而无论使用哪种开发工具。它有助于在整个生命周期内实现自动文档记录，并为各个利益相关者提供一致的视图。
实施值得信赖的 AI 需要我们将人员（专业知识）、流程（最佳实践）和平台（科技）相结合。IBM Cloud Pak for Data 和 IBM Spectrum Fusion 提供可支持端到端 AI 生命周期各个阶段的框架。它可融入现有环境，并作为现有模型开发与部署工具的补充。该平台可运行于多种云中（IBM、AWS、Azure、GCP 等）及本地基础设施选项，从而实现真正的混合云能力。
IBM 提供一整套服务产品，其中汇集了教育、专业知识、最佳实践和科技，以帮助客户开始实施值得信赖的 AI。