IBM Cloud Pak® for Data 4.6 版本将于 2025 年 7 月 31 日结束支持(EOS)。 欲了解更多信息,请参阅 IBM Cloud Pak for Data 版本 4.X 的停止服务公告。
在 IBM Cloud Pak for Data 4.6 版本支持结束之前,升级到 IBM Software Hub 5.1 版本。 更多信息,请参阅 IBM Software Hub 版本 5.1 文档中的升级 IBM Software Hub。
Watson Machine Learning Python 客户机样本和示例
查看并使用样本 Jupyter Notebook ,这些 Notebook 使用 Watson Machine Learning Python 库来演示机器学习功能和技术。 每个 Notebook 都列出了学习目标,以便您可以找到最符合您目标的学习目标。
这些样本是使用 V4 版本的 Watson Machine Learning Python 客户机库构建的。
观看此视频以了解如何在 Jupyter Notebook 中训练,部署和测试机器学习模型。 此视频反映了在 部署样本 表中找到的 使用 scikit-learn 识别手写数字 。
除了遵循本文档中的书面步骤,您还可以观看此视频了解相关操作。
有用变量
预定义的 PROJECT_ID 环境变量使您更容易调用 Watson Machine Learning Python 客户机 API。 PROJECT_ID 是运行环境的 Watson Studio 项目的 GUID。
部署样本
查看或运行这些 Jupyter Notebook ,以了解如何使用各种框架实现方法。 一些样本依赖于经过训练的模型,这些模型也可供从公共存储库下载。
| 样本名称 | 框架 | 演示的方法 |
|---|---|---|
| 使用 scikit-learn 和定制库预测温度 | Scikit-learn | 使用定制定义的变换器训练模型 在 Watson Machine Learning 存储库中持久存储定制定义的变换器和模型 使用 Watson Machine Learning Service 使用已部署的模型执行预测 |
| 使用 PMML 预测鸢尾花物种 | PMML | 部署 PMML 模型并进行评分 |
| 使用 Python 函数识别手写数字 | Python | 使用函数存储样本模型,然后部署该模型 |
| 使用 scikit-learn 识别手写数字 | Scikit-learn | 训练 sklearn 模型 在 Watson Machine Learning 存储库中持久存储已训练的模型 部署模型以使用客户机库进行联机评分 使用客户机库进行评分样本记录 |
| 使用 Spark 和批量部署预测客户流失率 | Spark | 将 CSV 文件加载到 Apache Spark DataFrame 探索数据 为训练和评估准备数据 创建 Apache Spark 机器学习管道 训练和评估模型 在 Watson Machine Learning 存储库中持久保存管道和模型 使用 plotly 软件包探索和可视化预测结果 使用 Watson Machine Learning API 部署模型进行批量评分 |
| 使用 Spark 和 Python 预测信用风险 | Spark | 将 CSV 文件加载到 Apache® Spark DataFrame 探索数据 准备用于训练和评估的数据 从 tar.gz 文件中将管道和模型持久保存在 Watson Machine Learning 储存库中 使用 Watson Machine Learning API 部署模型进行在线评分 使用 Watson Machine Learning API 对样本评分数据进行评分 使用 plotly 软件包探索和可视化预测结果 |
| 使用 Spark 预测产品线 | Spark | 将 CSV 文件加载到 Apache Spark DataFrame 探索数据 准备用于训练和评估的数据 从 tar.gz 文件中将管道和模型持久保存在 Watson Machine Learning 储存库中 使用 Watson Machine Learning API 部署模型进行在线评分 使用 Watson Machine Learning API 对样本评分数据进行评分 使用 plotly 软件包探索和可视化预测结果 |
| 使用 SPSS 预测客户流失率 | SPSS | 使用实例 执行 SPSS 模型的联机部署 ,使用已部署的模型对数据进行评分 |
| 使用 XGBoost 对肿瘤进行分类 | XGBoost | 将 CSV 文件装入到 numpy 数组中 探索数据 准备数据以进行训练和评估 创建 XGBoost 机器学习模型 训练和评估模型 使用交叉验证来优化模型的超参数 在 Watson Machine Learning 存储库中持久存储模型 部署模型以进行联机评分 评分样本数据 |
| 预测汽车业务 | Hybrid(Tensorflow) | 设置 AI 定义 准备数据 使用 Tensorflow 部署 Keras 模型并对模型进行评分 定义,存储和部署 Python 函数 |
| 针对软件规范部署 Python 函数 | 核心 | 创建 Python 函数 创建 Web Service 对模型评分 |
| 机器学习工件管理 | 核心 | 导出和导入工件 装入,部署和对外部创建的模型进行评分 |
| 使用 R Shiny 应用程序来创建 SIR 模型 | R | 将 R Shiny 应用程序持久存储在 Watson Machine Learning 资产存储库中。 使用客户机库部署用于联机评分的应用程序。 使用客户机库对样本记录进行评分。 |
AutoAI 样本
查看或运行以下 Jupyter Notebook 以查看 AutoAI 模型方法是如何实现的。
| 样本名称 | 框架 | 演示的方法 |
|---|---|---|
| 使用 AutoAI 和 Lale 预测信用风险 | 使用 Lale 的混合 (AutoAI) | 使用 Watson Machine Learning 实验来训练 AutoAI 模型 比较已训练的模型质量并选择最佳模型以进一步优化 优化最佳模型并测试新变体 部署已训练的模型并对其评分 |
| 使用 AutoAI 和多项数据来预测销售数量 | 混合 (AutoAI) | 使用 Watson Machine Learning 实验以使用多个数据源来训练 AutoAI 模型 为多个数据集定义 Watson Machine Learning 实验 使用实验来训练 AutoAI 模型 比较已训练的模型质量并选择最佳模型以供进一步部署 部署已训练的模型并对其评分 |