什么是模型治理?

男子站在服务器前的图像

作者

Tom Krantz

Staff Writer

IBM Think

Alexandra Jonker

Staff Editor

IBM Think

什么是模型治理?

模型治理是一个端到端的过程,企业通过这个过程建立、实施和维护对模型使用的控制。它包括从模型文档和版本控制到回测、模型监控和可观测性的所有内容。

模型治理源于金融业,用于管控复杂金融模型风险。 随着 人工智能  (AI) 和 机器学习  (ML) 技术的兴起, 模型治理 的重要性迅速提升。 麦肯锡咨询数据显示,78% 组织已在至少一个业务职能中使用 AI——凸显了 AI 和 ML 模型在运营和战略决策中的深度嵌入程度。 

模型治理的目的是确保模型(无论是传统金融模型还是机器学习模型)按预期运行、保持合规并随着时间的推移提供可信赖的结果。强大的模型治理框架支持整个模型生命周期的透明度、问责制和可重复性。

在银行与保险等受监管行业, 模型治理 是合规性要求。 美国货币监理署 (OCC) 明确金融机构管理 模型风险 的具体治理实践。 虽然  OCC 指南不具备法律强制力,但应用于监管审查。不合规将导致罚款或其他处罚。

随着实时决策成为常态和监管要求不断发展,有效的模型治理正在成为旨在负责任地利用 AI 的组织的一项关键能力。

小球在轨道上滚动的三维设计

最新的 AI 新闻 + 洞察分析

在每周的 Think 时事通讯中,发现专家精选的有关 AI、云等的洞察分析和新闻。 

为什么模型治理很重要?

组织日益依赖复杂模型支撑高风险决策。无论银行业信贷评分或医疗业患者风险评估,这些模型的有效性完全取决于管理它们的框架。 

模型治理提供了一个结构,用于监督模型的开发、部署和持续性能。通过在模型生命周期的每个阶段建立明确的控制和问责制,组织可以确保其模型始终可靠并与业务目标保持一致。这使得模型治理成为风险管理、监管合规性和运营完整性的基本组成部分。

大多数模型(尤其是 ML 模型)已经嵌入核心业务流程。如果没有适当的治理,这些模型可能会随着时间的推移而漂移,导致模型性能下降、结果有偏倚或决策不符合当前的市场条件或人口趋势。在金融或医疗保健等行业,这些失败可能会产生重大的现实后果。

模型治理提供了一种在这些风险影响业务结果之前对其进行评估和缓解的机制。此外,组织还可利用模型治理来:

  • 与 OCC 和其他监管机构的要求保持一致,提高监管合规性
  • 通过确保模型输出的可解释性、一致性和可靠性来增加利益相关者之间的信任
  • 通过自动化和整合治理工作流程优化运行效率

随着 AI 应用加速,模型治理也为 合乎伦理的人工智能奠定了基础。 它提供了一种方法,将公平性、问责制和透明度融入到各种应用场景中模型的设计和部署过程中。 

AI 学院

AI 领域的信任、透明度和治理

AI 信任可以说是 AI 领域最重要的话题。这个话题会让人不知所措,也是情理之中的事情。我们将解析幻觉、偏见和风险等问题,并分享以合乎道德、负责且公平的方式采用 AI 的步骤。

模型治理框架的组件

模型治理框架为庞杂的算法、数据集、利益相关方及工作流生态系统提供结构化管控。 框架因行业而异,但通常包含以下核心组件:

模型开发和文档编制

强治理始于源头: 模型开发。此环节含目标定义、 训练数据筛选、 数据源 验证及确保 模型输入 与 用例 对齐。数据质量 至关重要,瑕疵或 偏见 输入 将导致低质 输出。

模型文档应该记录所选方法背后的原理、所做的假设、所使用的数据集和预期的模型输出。该文档作为透明度的蓝图,有助于简化未来的更新、审计和模型验证。

模型库存

集中式模型库存允许组织跟踪正在使用的每个模型及其目的、所有权、方法和生命周期中的状态。这包括金融模型、信用评分算法、用于欺诈检测的 ML 模型,甚至嵌入电子表格的模型。

维护良好的模型库存还有助于更好地进行风险评估,并促进围绕模型使用的实时决策。

模型验证和回测

验证是模型风险管理的核心方面。独立验证团队根据历史数据对模型进行测试(回测),评估对利率或人口变化等动态因素的敏感性,并验证输出是否符合业务预期。

对于 ML 模型,验证还包括检查算法偏差、健壮性和过拟合,过拟合是指算法过于贴近(甚至完全贴合)其训练数据,而无法从任何其他数据中得出准确结论。目标是确保模型结果保持稳定和可阐述,即使输入发生变化也是如此。

模型部署和监测

模型部署后,治理不会停止。持续的模型监控对于检测性能下降、模型输入的漂移或数据质量的变化至关重要。可观测性工具可以帮助跟踪准确性和召回率等指标,检测可能需要重新训练或重新校准的异常

在现代机器学习运营 (MLOps) 工作流程中,组织可以自动执行部分部署流程,将治理检查直接纳入持续集成、持续交付 (CI/CD) 管道。这样可以在不影响监督的情况下实现更快的迭代。

角色、职责和 工作流

模型治理是一项团队运动,数据科学家、风险官、业务领导者、合规团队和审计师都是其中的关键参与者。定义明确的职责和工作流可确保在生命周期的每个阶段(从开发到验证再到模型退役)承担责任。

有效的治理还涉及沟通。无论是通过内部仪表板、治理报告,还是跨职能团队的专用播客,信息都必须在利益相关者之间有效流动。

各行业的模型治理用例

 模型治理 原则适用于多行业,各领域风险、法规及优先级不同:

银行和金融

在银行业,模型可以协助完成从信用风险评估到盈利能力预测等各个方面的任务。治理帮助金融机构遵守 OCC 指南、进行压力测试并与更广泛的模型风险管理框架保持一致。

例如,评估贷款批准或利率的模型需要经过严格验证和监控,以避免引入偏差或违反监管规定。通过利用有效的模型治理,银行可以提高透明度并保持监管机构和客户的信心。

医疗保健

医疗保健组织使用模型来帮助进行临床决策支持、运营规划和患者风险评估。这自然事关重大;模型输出的错误可能导致误诊或治疗的优先顺序错误。

该领域的治理解决方案确保 ML 模型在代表性数据集上进行训练,考虑不同的人口因素,并符合隐私和数据治理标准,例如《健康保险流通和责任法案》(HIPAA)。

零售业

零售商越来越依赖 AI 来优化定价、预测需求和个性化客户体验。模型从各种来源采集数据,无论是历史数据(例如销售历史)还是实时信号(例如市场趋势)。

模型治理可支持零售商记录假设、验证模型性能并快速适应现实世界的变化,例如供应链中断或消费者行为的变化。

如何实施模型治理?

模型治理通过区域和全球法规来执行,这些法规要求组织对其整个生命周期中的模型管理方式负责。值得注意的法规包括:

SR 11-7(美国)

SR 11-7 设定了银行业模型风险管理的标准,要求机构维护模型的完整库存清单并实施全企业范围的治理实践。它还要求模型满足其预期目的、保持最新并且具有足够清晰以供独立理解的文档。

NAIC 模型法(美国)

美国保险监督官协会 (NAIC) 推出 AI 与算法决策监管模型, 特别是涉及信贷评分、定价和人口统计公平性时。 这些要素对保险承保与理赔处理治理日益关键。

《欧盟 AI 法案》(欧盟)

《欧盟人工智能法案》,也称为《欧盟 AI 法案》或《AI 法案》,是一部管理欧盟 AI 开发和/或使用的法律。该法案采取基于风险的监管方法,根据 AI 带来的风险对其适用不同的规则。

GDPR(欧盟)

根据《通用数据保护条例》(GDPR),任何处理欧盟公民个人数据的模型都必须遵循公平、透明和问责等原则。这会间接影响 ML 模型治理,尤其是在可解释性和数据质量方面。

FINMA(瑞士)和 PRA(英国)

瑞士金融市场监管局 (FINMA) 和英国审慎监管局 (PRA) 都发布了有关金融服务中 AI 和模型使用的指南,分别是 FINMA 指南 08/2024 和 PRA 监管声明 SS1/23。

这些文档涉及模型治理、ML 模型的可解释性和全面的模型文档等领域。而它们与 SR 11-7 有相似之处,各自特别强调了 AI 特定风险和运营弹性等方面。

巴塞尔银行监管委员会(全球)

Basel 框架概述了有效的风险数据聚合和风险报告 (BCB 239) 的原则,这些原则与文档编制、可解释性和模型风险监督等模型治理实践直接相关。在国际上开展业务的银行通常将 Basel 协议与 SR 11-7 一同作为黄金标准。

模型治理挑战

尽管模型治理的价值显而易见,但大规模实施它会带来一些挑战:

  • 模型的数量和复杂性:随着企业采用更多的 ML 和 AI 工具,维护准确的模型库存清单变得困难,尤其是当模型嵌入电子表格或第三方平台时。

  • 可解释性和信任:许多利益相关者,包括监管机构和企业领导者,都需要可解释的模型。平衡性能与可解释性仍然是 AI 模型治理中持续存在的矛盾。

  • 与  MLOps 整合: 治理框架需要适应实时工作流和 DevOps 风格的部署,同时不能拖慢创新的步伐。 

模型治理新趋势

随着 AI 和 ML 越来越深入地融入到工作流中,新的力量正在塑造组织执行模型治理的方式。虽然验证、模型文档记录和模型监控等基础实践仍然至关重要,但一些新兴趋势开始重新定义期望。

实时监控

实时监控越来越受欢迎,尤其是随着流数据的兴起和对数据驱动决策需求的增加。

增强可观测性

先进的 可观测性 工具正被用于跟踪已部署  ML 模型的性能并检测(模型)漂移。

工作流程自动化

组织正在实现治理工作流的部分自动化。例如,通过将验证检查点嵌入到模型部署管道中,可以减少开发与合规性之间的摩擦。

标准化框架

多团队转向标准化 治理框架(尤其是在银行和医疗等受监管的行业)。 

道德设计

公平性与偏见检测等伦理要素日益融入 验证流程。

这些趋势反映了一个更广泛的转变:模式治理正在从一种防御性方法演变为一种功能。通过利用结构化、跨职能的治理实践,组织可以增强对其机器学习模型的信任,同时加速创新。

相关解决方案
IBM watsonx.governance™

借助 IBM watsonx.governance 随时随地治理生成式 AI 模型,并在云端或本地进行部署。

了解 watsonx.governance
人工智能治理解决方案

了解人工智能治理如何能帮助增强员工对 AI 的信心、加速采用和创新并提高客户信任。

探索人工智能治理解决方案
人工智能治理咨询服务

借助 IBM Consulting,为《欧盟 AI 法案》做好准备并制定负责任的人工智能治理方法。

了解 AI 治理服务
采取下一步行动

借助单一组合来指导、管理和监控您的 AI,以加速负责任、透明且可解释的 AI。

深入了解 watsonx.governance 预约实时演示