IBM Cloud Pak® for Data 4.6 版本将于 2025 年 7 月 31 日结束支持(EOS)。 欲了解更多信息,请参阅 IBM Cloud Pak for Data 版本 4.X 的停止服务公告。
在 IBM Cloud Pak for Data 4.6 版本支持结束之前,升级到 IBM Software Hub 5.1 版本。 更多信息,请参阅 IBM Software Hub 版本 5.1 文档中的升级 IBM Software Hub。
分析数据并构建模型
您可以使用 Cloud Pak for Data 中的数据分析和模型构建工具及服务来查找见解,以及训练或求解 AI 模型。
可以在项目中使用的工具取决于您已安装的服务:
使用 Watson Studio、Watson Machine Learning 和其他补充服务来分析数据并构建模型
可以使用 Watson Studio 服务来分析数据并构建模型。 Watson Studio的补充服务 (例如 Watson Machine Learning) 向项目添加工具和计算资源。
服务 缺省情况下,Watson Studio、Watson Machine Learning 和其他补充服务不可用。 管理员必须在 IBM Cloud Pak for Data 平台上安装这些服务。 要确定某个服务是否已安装,请打开“服务”目录,并检查是否已启用该服务。

要开始使用 Watson Studio 来分析数据,请完成下列步骤:
创建或打开项目:
- 要创建项目,请从主菜单中选择 项目> 所有项目 ,然后在 " 项目 " 页面上单击 新建项目 。 请参阅创建项目。
- 要打开现有项目,请从主菜单中选择 项目> 所有项目 ,然后单击项目的名称。
将数据添加到项目中。 此外,您也可以从工具中添加数据。
分析数据或构建模型。 请了解如何在 Watson Studio 中选择正确的工具。
可以将下表所列的数据分析和模型构建方法与 Watson Studio 以及其他所列服务配合使用。
| 方法 | Watson Studio 的补充服务 |
|---|---|
| 通过在 Jupyter Notebook 中编写代码来分析数据 | |
| 在与 Git 集成的 JupyterLab IDE 中编码 Notebook 和 Python 脚本 | |
| 在 Data Refinery 中可视化和准备数据 | |
| 在 RStudio IDE 中开发 Shiny 应用程序 | RStudio Server with R 3.6 |
| 使用 Cognos Dashboards 将数据可视化,而不进行编码 | Cognos Dashboards |
| 使用 Spark 环境或 Spark API 运行分析工作负载 | Analytics Engine powered by Apache Spark |
| 在 Apache Hadoop 集群上分析数据 | Execution Engine for Apache Hadoop |
| 在 Hadoop 集群或云对象存储器上使用 SQL 查询来分析数据 | Db2 Big SQL |
| 使用 AutoAI 来构建模型 | Watson Machine Learning |
| 使用 Federated Learning 来训练模型 | Watson Machine Learning |
| 在 Notebook 中构建模型 | Watson Machine Learning |
| 运行深度学习试验 | Watson Machine Learning Watson Machine Learning Accelerator |
| 求解 Decision Optimization 模型 | Watson Machine Learning Decision Optimization |
| 使用 SPSS Modeler 来构建模型 | SPSS Modeler |
使用其他服务分析数据
如果未安装 Watson Studio 服务,那么可以将数据分析方法与下表中列出的服务配合使用。
| 方法 | 服务 |
|---|---|
| 使用 Spark API 运行分析工作负载 | Analytics Engine powered by Apache Spark |
| 在 Hadoop 集群或云对象存储器上使用 SQL 查询来分析数据 | Db2 Big SQL |