重要说明:

IBM Cloud Pak® for Data 4.7 版本将于 2025 年 7 月 31 日结束支持(EOS)。 欲了解更多信息,请参阅 IBM Cloud Pak for Data 版本 4.X 的停止服务公告

在 IBM Cloud Pak for Data 4.7 版本支持结束之前,升级到 IBM Software Hub 5.1 版本。 更多信息,请参阅 IBM Software Hub 版本 5.1 文档中的升级 IBM Software Hub。

快速入门: 在 Jupyter Notebook 中构建和部署机器学习模型

您可以在 Jupyter Notebook 中使用 Watson Machine Learning 创建,训练和部署机器学习模型。 阅读有关 Jupyter 笔记本的信息,然后观看视频并学习适合中间用户且需要编码的教程。

必需的服务
Watson Studio
Watson Machine Learning

基本工作流程包含以下任务:

  1. 创建项目。 项目是您与其他人协作处理数据的地方。
  2. 向项目添加 Notebook。 您可以创建空白 Notebook ,也可以从文件或 GitHub 存储库导入 Notebook。
  3. 添加代码并运行 Notebook。
  4. 查看模型管道并将所需管道另存为模型。
  5. 部署并测试模型。

阅读有关 Jupyter Notebook 的信息

Jupyter Notebook 是基于 Web 的交互式计算环境。 如果您选择在 Notebook 中构建机器学习模型,您应熟练掌握在 Jupyter Notebook 中编码的方法。 您可以运行处理数据的小部分代码,然后立即查看计算结果。 通过使用此工具,您可以组装,测试和运行处理数据,将数据保存到 Watson Machine Learning以及部署模型所需的所有构建块。

了解更多有关在笔记本中训练模型的信息

了解有关构建模型的其他方法

观看有关在 Jupyter Notebook 中创建模型的视频

观看视频 观看本视频,了解如何在 Jupyter 笔记本中训练、部署和测试机器学习模型。

此视频提供了一种可视方法来学习本文档中的概念和任务。

尝试教程以在 Jupyter Notebook 中创建模型

在本教程中,您将完成以下任务:

完成本教程大约需要 30 分钟。

样本数据

本教程中使用的样本数据来自属于 scikit-learn 的数据,将用于训练模型以识别 0-9 的手写数字图像。

任务 1: 打开项目

您需要一个项目来存储数据和 AutoAI 试验。 您可以使用现有项目或创建项目。

  1. 从导航菜单 导航菜单 中,选择项目 > 所有项目

  2. 打开现有项目。 如果要使用新项目:

    1. 单击新建项目

    2. 选择创建空项目

    3. 输入项目的名称和可选描述。

    4. 单击创建

如需了解更多信息或观看视频,请参阅创建项目

检查点图标 检查您的进度

下图显示了新项目。

下图显示了新项目。

任务 2: 向项目添加 Notebook

您将在本教程中使用样本 Notebook。 遵循以下步骤将样本 Notebook 添加到项目中:

  1. 从项目中的 资产 选项卡,单击 新建资产> Jupyter Notebook 编辑器

  2. 选择 " 来自 URL "选项卡。

  3. 笔记本 URL 字段中粘贴以下链接:

    https://github.com/IBM/watson-machine-learning-samples/blob/master/cpd4.7/notebooks/python_sdk/deployments/scikit-learn/Use%20scikit-learn%20to%20recognize%20hand-written%20digits.ipynb
    
  4. 输入笔记本名称和描述 (可选)。

  5. 选择此 Notebook 的运行时环境。

  6. 单击创建。 等待 Notebook 编辑器装入。

  7. 从菜单中,单击 内核> 重新启动并清除输出,然后单击 重新启动并清除所有输出 以清除上次保存的运行的输出。

检查点图标 检查您的进度

下图显示了新的 Notebook。

下图显示了新的 Notebook。

任务 3: 设置环境

Notebook 中的第一部分通过指定 Cloud Pak for Data 凭证和 Watson Machine Learning 服务实例位置来设置环境。 执行以下步骤以在 Notebook 中设置环境:

  1. 滚动到 设置环境 部分。

  2. 获取 API 密钥。 如果您没有 API 密钥,请执行以下步骤:

    1. 使用 Cloud Pak for Data 部署打开另一个选项卡。

    2. 单击 概要文件 图标。

    3. 单击 概要文件和设置

    4. 单击 API 密钥> 生成新密钥

    5. 复制 API 密钥并关闭选项卡。

  3. 平台 URL 是您用来访问 Cloud Pak for Data 部署的主机名或 URL。 如果您没有此信息,请询问管理员。 管理员可从 Red Hat OpenShift 控制台获取平台 URL ( Red Hat OpenShift Container Platform -> Projects -> cpd-instance -> Routes )。

  4. usernameapi_key和平台 url 粘贴到单元格 1 中。

  5. 运行单元 1 和 2。

  6. 运行单元 3 以安装 ibm-watson-machine-learning 软件包。

  7. 运行单元 4 以导入 API 客户机并使用凭证创建 API 客户机实例。

  8. 运行单元 5 以查看所有现有部署空间的列表。 如果您没有部署空间,请执行以下步骤:

    1. 使用 Cloud Pak for Data 部署打开另一个选项卡。

    2. 从导航菜单 导航菜单 ,单击部署

    3. 单击新建部署空间

    4. 为部署添加名称和可选描述。

    5. 单击 创建,然后单击 查看新空间

    6. 单击 管理 选项卡。

    7. 复制 空间 GUID 并关闭选项卡,此值将为您的 space_id

  9. 将相应的部署空间标识复制并粘贴到单元 6 中,然后运行单元 6 和单元 7 以设置缺省空间。

检查点图标 检查您的进度

下图显示了设置了所有环境变量的 Notebook。

下图显示了设置了所有环境变量的 Notebook。

任务 4: 运行 Notebook

现在,所有环境变量都已设置,您可以运行 Notebook 中的其余单元。 执行以下步骤以阅读注释,运行单元格并查看输出:

  1. 运行 浏览数据 部分中的单元格。

  2. 运行 创建 scikit-learn 模型 部分中的单元。

    1. 通过将数据拆分为三个数据集 (训练,测试和评分) 来准备数据。

    2. 创建管道。

    3. 训练模型。

    4. 使用测试数据评估模型。

  3. 运行 发布模型 部分中的单元以发布模型,获取模型详细信息以及获取所有模型。

  4. 运行 创建模型部署 部分中的单元。

  5. 运行 获取部署详细信息 部分中的单元。

  6. 运行 评分 部分 * 中的单元格,这将向已部署的模型发送评分请求并显示预测。

  7. 单击 文件> 保存 以保存 Notebook 及其输出。

检查点图标 检查您的进度

下图显示了具有预测的 Notebook。

下图显示了包含预测的 Notebook。

任务 5: 在部署空间中查看和测试已部署的模型

您还可以直接从部署空间查看模型部署。 请遵循以下步骤来测试空间中的已部署模型。

  1. 从导航菜单 导航菜单 ,单击部署

  2. 单击 空间 选项卡。

  3. 从列表中选择相应的部署空间。

  4. 单击 Scikit 模型

  5. 单击 部署 scikit 模型

  6. 查看 端点代码片段

  7. 单击测试选项卡。 您可以通过粘贴以下 JSON 代码来测试已部署的模型:

       {"input_data": [{"values": [[0.0, 0.0, 5.0, 16.0, 16.0, 3.0, 0.0, 0.0, 0.0, 0.0, 9.0, 16.0, 7.0, 0.0, 0.0, 0.0, 0.0, 0.0, 12.0, 15.0, 2.0, 0.0, 0.0, 0.0, 0.0, 1.0, 15.0, 16.0, 15.0, 4.0, 0.0, 0.0, 0.0, 0.0, 9.0, 13.0, 16.0, 9.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 14.0, 12.0, 0.0, 0.0, 0.0, 0.0, 5.0, 12.0, 16.0, 8.0, 0.0, 0.0, 0.0, 0.0, 3.0, 15.0, 15.0, 1.0, 0.0, 0.0], [0.0, 0.0, 6.0, 16.0, 12.0, 1.0, 0.0, 0.0, 0.0, 0.0, 5.0, 16.0, 13.0, 10.0, 0.0, 0.0, 0.0, 0.0, 0.0, 5.0, 5.0, 15.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 8.0, 15.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 13.0, 13.0, 0.0, 0.0, 0.0, 0.0, 0.0, 6.0, 16.0, 9.0, 4.0, 1.0, 0.0, 0.0, 3.0, 16.0, 16.0, 16.0, 16.0, 10.0, 0.0, 0.0, 5.0, 16.0, 11.0, 9.0, 6.0, 2.0]]}]}
    
  8. 单击 预测。 生成的预测指示手写数字为 5 和 4。

检查点图标 检查您的进度

下图显示了包含预测的 测试 选项卡。

下图显示了包含预测的 "测试" 选项卡。

后续步骤

现在,您可以使用此数据集开展进一步分析。 例如,您或其他用户可以执行以下任何任务:

其他资源

父主题: 快速入门教程