重要说明:

IBM Cloud Pak® for Data 4.6 版本将于 2025 年 7 月 31 日结束支持(EOS)。 欲了解更多信息,请参阅 IBM Cloud Pak for Data 版本 4.X 的停止服务公告

在 IBM Cloud Pak for Data 4.6 版本支持结束之前,升级到 IBM Software Hub 5.1 版本。 更多信息,请参阅 IBM Software Hub 版本 5.1 文档中的升级 IBM Software Hub。

运行内置样本管道

您可以查看和运行内置样本管道,该管道使用样本数据来了解如何在 Watson Pipelines中自动执行机器学习流程。

样本管道中发生了什么?

样本管道会获取训练数据,使用 AutoAI 工具训练机器学习模型,并选择最佳管道以保存为模型。 然后,将模型复制到部署所在的部署空间。

该样本说明了如何使端到端流程自动化,从而使生命周期更易于运行和监控。

样本管道如下所示:

样本编排管道

本教程将指导您完成以下过程:

  1. 设置以运行样本
  2. 创建样本管道
  3. 运行样本
  4. 查看结果
  5. 浏览样本节点和配置

先决条件

要运行此样本,必须首先创建:

  • 项目,您可以在其中运行样本管道。
  • 部署空间,您可以在其中查看和测试结果。 需要部署空间才能运行样本管道。

创建样本管道

在 "管道" 编辑器中创建样本管道。

  1. 打开要创建管道的项目。
  2. 从 " 资产 " 页面中,单击 新建资产 ,然后选择 管道
  3. 输入管道的唯一名称。 例如,输入 Bank marketing sample
  4. 单击保存以打开画布。
  5. 单击 Gallery 样本选项卡,然后单击 Bank marketing sample 磁贴。

运行样本管道

要运行样本管道:

  1. 单击画布工具栏上的运行,然后选择试运行
  2. 提示为 deployment_space 管道参数提供值时,请选择部署空间。
  3. 单击运行以启动管道。

查看结果

管道运行完成后,您可以查看输出以查看结果。

样本管道运行输出

打开作为管道一部分指定的部署空间。 您将在该空间中看到新部署:

样本管道部署

如果要测试部署,请使用部署空间的 " 测试 " 页面以 JSON 格式提交有效内容数据并返回分数。 例如,单击 JSON 选项卡并输入以下输入数据:

 {"input_data": [{"fields": ["age","job","marital","education","default","balance","housing","loan","contact","day","month","duration","campaign","pdays","previous","poutcome"],"values": [["30","unemployed","married","primary","no","1787","no","no","cellular","19","oct","79","1","-1","0","unknown"]]}]}

单击 预测时,模型将生成具有置信度分数的输出,用于预测客户是否预订定期存款促销。

样本模型的预测分数

在这种情况下, "否" 的预测伴随着接近 95% 的置信度分数,预测客户最有可能不会预订定期存款。

浏览样本节点和配置

更深入地了解样本节点如何配置为在管道样本中协同工作。

查看管道参数

管道参数指定整个管道的设置。 在样本管道中,使用管道参数指定一个部署空间来存储和部署从 AutoAI 试验保存的模型。 系统会提示您选择管道参数将链接到的部署空间。

单击画布工具栏上的 "全局对象" 图标以查看或创建管道参数。 在样本管道中,管道参数命名为 deployment_space,其类型为 Space。 单击管道参数的名称以查看详细信息。 在此样本中,管道参数将与创建数据文件节点和创建 AutoAI 试验节点配合使用。

用于指定部署空间的流参数

装入 AutoAI 试验的训练数据

在此步骤中,创建数据文件节点配置为访问试验的数据集。 单击该节点以查看配置。 数据文件为 bank-marketing-data.csv,其中提供了样本数据以用于预测银行客户是否会报名参加定期存款投资项目。 这些数据位于 Cloud Object Storage 存储区中,并且可进行刷新来使模型训练保持最新状态。

装入数据选项
选项
作用域 (文件) 用于训练 AutoAI 试验的数据资产的位置。 在这种情况下,数据文件位于项目中。
文件路径 资产的名称 bank-marketing-data.csv
目标作用域 对于此样本,目标是部署空间。

创建 AutoAI 试验

使用以下值配置创建 AutoAI 试验节点:

创建 AutoAI 参数
选项
AutoAI 试验名称 onboarding-bank-marketing-prediction
预测类型 二进制
预测列(标签) y
阳性类
训练数据拆分比 0.9
要包括的算法 GradientBoostingClassifierEstimator
XGBClassifierEstimator
要使用的算法 1
要优化的度量 ROC AUC
描述 此试验使用一个样本文件,其中包含从葡萄牙银行响应市场营销活动的电话呼叫中收集的文本数据。 分类目标是预测客户是否将预订由变量 y 表示的定期存款。

这些选项定义了一个试验,此试验使用银行市场营销数据来预测客户是否有可能参加促销活动。

运行 AutoAI 试验

在此步骤中,运行 AutoAI 试验节点将运行 AutoAI 试验 onboarding-bank-marketing-prediction,训练管道,然后保存最佳模型。

运行 AutoAI 参数
选项
AutoAI 试验 Create AutoAI 节点的输出作为运行试验的输入。
训练数据资产 创建数据文件 节点的输出作为试验的训练数据输入。
模型计数 运行模型后,选择性能最佳的模型。 缺省值为 1。

将模型部署到 Web 服务

创建 Web 部署 节点将创建名为 onboarding-bank-marketing-prediction-deployment 的联机部署,以便您可以从 REST API 端点实时交付数据和获取预测。

部署模型
选项
ML 资产 采用 Run AutoAI 节点的最佳模型输出作为创建部署的输入。
部署名称 onboarding-bank-marketing-prediction-deployment

父主题: IBM Watson Pipelines