重要说明：

IBM Cloud Pak® for Data 4.6 版本将于 2025 年 7 月 31 日结束支持（EOS）。欲了解更多信息，请参阅 IBM Cloud Pak for Data 版本 4.X 的停止服务公告。

在 IBM Cloud Pak for Data 4.6 版本支持结束之前，升级到 IBM Software Hub 5.1 版本。更多信息，请参阅 IBM Software Hub 版本 5.1 文档中的升级 IBM Software Hub。

Watson Machine Learning Python 客户机样本和示例

查看并使用样本 Jupyter Notebook ，这些 Notebook 使用 Watson Machine Learning Python 库来演示机器学习功能和技术。每个 Notebook 都列出了学习目标，以便您可以找到最符合您目标的学习目标。

这些样本是使用 V4 版本的 Watson Machine Learning Python 客户机库构建的。

观看此视频以了解如何在 Jupyter Notebook 中训练，部署和测试机器学习模型。此视频反映了在 部署样本 表中找到的 使用 scikit-learn 识别手写数字 。

除了遵循本文档中的书面步骤，您还可以观看此视频了解相关操作。

有用变量

预定义的 PROJECT_ID 环境变量使您更容易调用 Watson Machine Learning Python 客户机 API。 PROJECT_ID 是运行环境的 Watson Studio 项目的 GUID。

部署样本

查看或运行这些 Jupyter Notebook ，以了解如何使用各种框架实现方法。一些样本依赖于经过训练的模型，这些模型也可供从公共存储库下载。

样本名称	框架	演示的方法
使用 scikit-learn 和定制库预测温度	Scikit-learn	使用定制定义的变换器训练模型在 Watson Machine Learning 存储库中持久存储定制定义的变换器和模型使用 Watson Machine Learning Service 使用已部署的模型执行预测
使用 PMML 预测鸢尾花物种	PMML	部署 PMML 模型并进行评分
使用 Python 函数识别手写数字	Python	使用函数存储样本模型，然后部署该模型
使用 scikit-learn 识别手写数字	Scikit-learn	训练 sklearn 模型在 Watson Machine Learning 存储库中持久存储已训练的模型部署模型以使用客户机库进行联机评分使用客户机库进行评分样本记录
使用 Spark 和批量部署预测客户流失率	Spark	将 CSV 文件加载到 Apache Spark DataFrame 探索数据为训练和评估准备数据创建 Apache Spark 机器学习管道训练和评估模型在 Watson Machine Learning 存储库中持久保存管道和模型使用 plotly 软件包探索和可视化预测结果使用 Watson Machine Learning API 部署模型进行批量评分
使用 Spark 和 Python 预测信用风险	Spark	将 CSV 文件加载到 Apache® Spark DataFrame 探索数据准备用于训练和评估的数据从 tar.gz 文件中将管道和模型持久保存在 Watson Machine Learning 储存库中使用 Watson Machine Learning API 部署模型进行在线评分使用 Watson Machine Learning API 对样本评分数据进行评分使用 plotly 软件包探索和可视化预测结果
使用 Spark 预测产品线	Spark	将 CSV 文件加载到 Apache Spark DataFrame 探索数据准备用于训练和评估的数据从 tar.gz 文件中将管道和模型持久保存在 Watson Machine Learning 储存库中使用 Watson Machine Learning API 部署模型进行在线评分使用 Watson Machine Learning API 对样本评分数据进行评分使用 plotly 软件包探索和可视化预测结果
使用 SPSS 预测客户流失率	SPSS	使用实例执行 SPSS 模型的联机部署，使用已部署的模型对数据进行评分
使用 XGBoost 对肿瘤进行分类	XGBoost	将 CSV 文件装入到 numpy 数组中探索数据准备数据以进行训练和评估创建 XGBoost 机器学习模型训练和评估模型使用交叉验证来优化模型的超参数在 Watson Machine Learning 存储库中持久存储模型部署模型以进行联机评分评分样本数据
预测汽车业务	Hybrid(Tensorflow)	设置 AI 定义准备数据使用 Tensorflow 部署 Keras 模型并对模型进行评分定义，存储和部署 Python 函数
针对软件规范部署 Python 函数	核心	创建 Python 函数创建 Web Service 对模型评分
机器学习工件管理	核心	导出和导入工件装入，部署和对外部创建的模型进行评分
使用 R Shiny 应用程序来创建 SIR 模型	R	将 R Shiny 应用程序持久存储在 Watson Machine Learning 资产存储库中。使用客户机库部署用于联机评分的应用程序。使用客户机库对样本记录进行评分。

AutoAI 样本

查看或运行以下 Jupyter Notebook 以查看 AutoAI 模型方法是如何实现的。

样本名称	框架	演示的方法
使用 AutoAI 和 Lale 预测信用风险	使用 Lale 的混合 (AutoAI)	使用 Watson Machine Learning 实验来训练 AutoAI 模型比较已训练的模型质量并选择最佳模型以进一步优化优化最佳模型并测试新变体部署已训练的模型并对其评分
使用 AutoAI 和多项数据来预测销售数量	混合 (AutoAI)	使用 Watson Machine Learning 实验以使用多个数据源来训练 AutoAI 模型为多个数据集定义 Watson Machine Learning 实验使用实验来训练 AutoAI 模型比较已训练的模型质量并选择最佳模型以供进一步部署部署已训练的模型并对其评分

父主题: 在 Notebook 中训练和部署机器学习模型