数据科学与机器学习运维（MLOps）应用案例

为实现数据分析与模型创建的有效运作，贵企业需要整合系统与流程。Cloud Pak for Data 提供支持企业开发和部署机器学习模型及其他数据科学应用的流程与技术。

观看此视频，了解实施数据科学和机器学习运维解决方案的实际应用场景。

本视频提供了一种可视化学习方法，用于掌握本文档中的概念和任务。

挑戰

通过实施数据科学和机器学习运维（MLOps）用例，您可以为企业解决以下挑战：

获取高质量数据: 组织需要为数据科学团队提供便捷访问高质量、受管控数据的途径，这些团队将利用这些数据构建模型。
模型构建与部署的操作化: 组织需要实施可重复的流程，以快速高效地构建模型并将其部署到生产环境中。
模型监测与再训练: 企业需要根据生产反馈自动监控和重新训练模型。

示例：黄金银行面临的挑战

跟随金银银行的脚步，见证其如何通过实施数据科学与机器学习运维流程，为在线申请提供低利率抵押贷款续期服务，从而拓展业务版图。金银银行的数据科学家需要创建一个抵押贷款审批模型，该模型既能规避风险，又能公平对待所有申请人。他们还必须实现模型重新训练的自动化，以优化模型性能。

进程

要为您的企业实施数据科学和机器学习运维（MLOps），您的组织可以遵循以下流程：

准备并共享数据
构建和训练模型
部署模型
监控已部署的模型
自动化人工智能生命周期

watsonx.ai 和 watsonx.governance 组件在 Cloud Pak for Data 中提供了 Watson Studio、 Watson Machine Learning、 Watson OpenScale、 IBM Knowledge Catalog、 IBM、 Orchestration Pipelines 以及 AI Factsheets 等服务，这些组件为您的组织提供了实施数据科学和 MLOps 解决方案所需的所有工具和流程。

展示数据科学用例流程的示意图

数据科学家可以准备自己的数据集，并在目录中分享它们。该目录作为特征商店，供您的数据科学家团队在此查找具备所需特征的高质量数据资产。他们可以将目录中的数据资产添加到项目中，并在项目中协作准备、分析和建模数据。

准备并共享数据
你可以使用什么	可以执行的操作	最佳使用时间
Data Refinery	从多样化的数据源连接中获取并精炼数据。将生成的数据集作为时间快照进行实体化，这些快照可能包含合并、关联或过滤后的数据，供其他数据科学家进行分析和探索。将生成的数据集发布至目录中。	当您需要对数据进行整理或清洗时，必须先可视化数据。您希望简化大量原始数据的分析准备流程。
目录	将目录用作特性存储库， IBM Knowledge Catalog 用于组织资产以便在组织内的协作者之间共享。利用人工智能驱动的语义搜索和推荐功能，帮助用户找到所需内容。	您的用户需要轻松理解、协作、丰富和访问高质量数据。您希望提高数据可见性并促进业务用户间的协作。您需要用户能够查看、访问、操作和分析数据，而无需了解其物理格式或位置，也无需移动或复制数据。您希望用户通过评分和评论来提升资产价值。

示例：黄金银行产品目录

治理团队负责人创建了一个名为"抵押贷款审批目录"的目录，并将数据管理员和数据科学家添加为该目录的协作者。数据管理员将他们创建的数据资产发布到目录中。数据科学家在目录中找到由数据管理员整理的数据资产，并将这些资产复制到项目中。在他们的项目中，数据科学家可以对数据进行精炼，为训练模型做好准备。

2. 构建并训练模型

为从数据中获取预测性洞察，数据科学家、业务分析师和机器学习工程师可构建并训练模型。数据科学家能够构建人工智能模型，确保采用正确的算法和优化方案进行预测，从而助力解决业务难题。

构建和训练模型
你可以使用什么	可以执行的操作	最佳使用时间
AutoAI	使用 Watson StudioAutoAI 自动选择算法、工程化特征、生成管道候选方案并训练模型管道候选方案。随后评估排序后的管道，将最佳方案保存为模型。将训练好的模型部署到空间中，或从导出您喜欢的模型训练管道 AutoAI 至笔记本进行优化。	您希望通过先进且自动化的方式快速构建优质的训练管道和模型集。您需要能够导出生成的管道以便进一步优化。
笔记本和剧本	使用笔记本和脚本在 Watson Studio 中编写您自己的特征工程模型训练和评估代码，支持 Python 或 R 语言。使用项目中可用的训练数据集，或连接数据库、数据湖或对象存储等数据源。使用您最喜欢的开源框架和库。	您希望运用 Python R 编程技能，对用于创建、训练和评估模型的代码实现完全掌控。
SPSS Modeler 流程	使用 SPSS Modeler 流来 Watson Studio 创建您自己的模型训练、评估和评分流程。使用项目中可用的训练数据集，或连接至数据源（如数据库、数据湖或对象存储）。	您希望在图形化构建器上进行可视化编程。您希望创建可重复的流程来探索数据，并定义模型训练、评估和评分。
RStudio 服务器	在服务器 RStudio 开发环境中使用R语言分析数据，构建并测试模型。	您希望使用开发环境来处理R语言相关工作。
JupiterLab 集成开发环境	通过使用开发 JupiterLab 环境来分析数据、构建模型并进行测试。	你希望使用开发环境进行工作 Python。
Visual Studio Code 编辑器	使用该 Watson Studio 扩展程序直接从连接到 Visual Studio Code 集群 Cloud Pak for Data。使用该扩展程序，您可以启动和停止运行时环境，通过SSH安全连接到集群中的运行时环境，并通过SSH编辑基于 GitWatson Studio -的项目中的文件。	你想要编辑并运行代码在 Visual Studio Code.
深度学习	使用深度学习试验构建器训练神经网络。	你想要训练数千个模型，训练更深层的神经网络，并探索更复杂的超参数空间。
Decision Optimization	准备数据、导入模型、解决问题并比较方案、可视化数据、寻找解决方案、生成报告，并将模型保存以便部署 Watson Machine Learning。	要解决规范性分析问题，你需要评估数百万种可能性才能找到最佳解决方案。
Analytics Engine powered by Apache Spark	通过选择Spark环境运行时，在项目中运行Jupyter笔记本和其他工具的作业。利用Spark 作业API运行Spark SQL或作业，用于数据转换、数据科学或机器学习。	您拥有一个用于运行分布式作业的Spark集群。

示例：黄金银行的模型构建与培训

金银银行的数据科学家创建了一个名为"抵押贷款审批模型"的模型，该模型既能规避意外风险，又能公平对待所有申请人。他们希望从一开始就追踪模型的历史和表现，因此在"抵押贷款审批目录"中添加了一个模型用例。他们运行一个笔记本电脑来构建模型，并预测哪些申请人符合抵押贷款资格。模型训练的详细信息将自动作为元数据记录在模型用例中。

3. 部署模型

如果操作团队成员部署 AI 模型，那么这些模型可供应用程序用于评分和预测以帮助驱动操作。

部署模型
你可以使用什么	可以执行的操作	最佳使用时间
空间用户界面 (UI)	使用 Spaces 用户界面将模型及其他资源从项目部署到空间。	您希望在协作工作区中部署模型并查看部署信息。
命令行工具 (cpdctl)	使用 cpdctl 命令行工具 Watson Machine Learning 来管理模型的生命周期，并自动化端到端流程，包括训练模型、保存模型、创建部署空间以及部署模型。	您希望通过命令行将模型部署并管理到测试或生产环境中。

示例：黄金银行的模型部署

金银银行的运维团队成员将项目中的"抵押贷款审批模型"推广至部署空间，随后创建了在线模型部署。

4. 监控已部署的模型

模型部署后，必须对其进行监控以确保其运行良好。数据科学家必须密切关注模型性能和数据一致性问题。

监控模型
你可以使用什么	可以执行的操作	最佳使用时间
Watson OpenScale	监控模型在多特征维度上的公平性问题。持续监测模型性能及数据一致性随时间的变化。通过权重因子解释模型得出特定预测结果的逻辑路径。维护并报告组织内模型的治理与生命周期管理。	您拥有受保护的特征或可能有助于预测公平性的特征。您希望追踪模型性能和数据随时间的变化一致性。您希望了解模型给出特定预测的原因。

示例：黄金银行的模型监控

金银行的数据科学家使用 Watson OpenScale 该工具监控已部署的"抵押贷款审批模型"，以确保其准确性并公平对待所有金银行的抵押贷款申请人。他们运行一台笔记本电脑来为模型设置显示器，然后通过用户界面 Watson OpenScale 调整配置。数据科学家通过质量 Watson OpenScale 监控器和公平性监控器的指标，评估模型预测结果的准确性，并判断其是否产生任何偏颇的预测结果。他们还能了解模型如何做出决策，以便向抵押贷款申请人解释决策过程。

5. 自动化人工智能生命周期

您的团队可以借助 Orchestration Pipelines 实现 MLOps 和 AI 生命周期的自动化与简化。

自动化人工智能生命周期
你可以使用什么	可以执行的操作	最佳使用时间
Orchestration Pipelines	使用管道创建可重复且可调度的流程，实现从数据采集到模型训练、测试和部署的全自动化工作流， Data Refinery 涵盖笔记本、机器学习管道等环节。	您希望自动化机器学习运维流程中的部分或全部步骤。

示例：黄金银行的自动化机器学习生命周期

金银银行的数据科学家可利用数据管道自动化其完整的数据科学与机器学习运维（MLOps）生命周期及流程，从而简化模型重新训练过程。

数据科学与MLOps教程

教程	描述	教程专业知识
构建包含模型监控功能的人工智能管道	训练模型，将其提升至部署空间，并部署该模型。	运行一个笔记本。
构建包含数据集成的AI管道	创建一条端到端管道，用于准备数据并训练模型。	使用 Orchestration Pipelines 的拖放界面创建管道。