重要说明:

IBM Cloud Pak® for Data 4.8 版本将于 2025 年 7 月 31 日结束支持(EOS)。 欲了解更多信息,请参阅 IBM Cloud Pak for Data 版本 4.X 的停止服务公告
在 版本支持结束之前,升级到 版本。 IBM Cloud Pak for Data 4.8 IBM Software Hub 5.1 有关更多信息,请参阅从 IBM Cloud Pak for Data 版本 4.8 升级到 IBM Software Hub 版本 5.1

分析数据并使用模型

您可以使用 Cloud Pak for Data 中的数据分析和模型构建工具及服务来查找见解,以及训练或求解 AI 模型。

可以在项目中使用的工具取决于安装的服务:

使用 Watson Studio、Watson Machine Learning 和其他补充服务来分析数据并构建模型

可以使用 Watson Studio 服务来分析数据并构建模型。 Watson Studio的补充服务 (例如 Watson Machine Learning) 向项目添加工具和计算资源。

服务 缺省情况下,Watson Studio、Watson Machine Learning 和其他补充服务不可用。 管理员必须在 IBM Cloud Pak for Data 平台上安装这些服务。 要确定某个服务是否已安装,请打开“服务”目录,并检查是否已启用该服务。

Watson Studio 用法

要开始使用 Watson Studio 来分析数据,请完成下列步骤:

  1. 创建或打开项目:

    • 要创建项目,请从主菜单中选择 项目> 所有项目 ,然后在 " 项目 " 页面上单击 新建项目 。 请参阅创建项目
    • 要打开现有项目,请从主菜单中选择 项目> 所有项目 ,然后单击项目的名称。
  2. 将数据添加到项目中。 此外,您也可以从工具中添加数据。

  3. 分析数据或构建模型。 请了解如何在 Watson Studio 中选择正确的工具

    你可以通过Watson Studio以及其他列出的服务,使用下表列出的数据分析和模型构建方法。

Watson Studio 和补充服务的数据分析和模型构建方法
方法 Watson Studio 的补充服务
通过在 Jupyter Notebook 或脚本中编写代码来分析数据
在与 Git 集成的 JupyterLab IDE 中编码 Notebook 和 Python 脚本
在 Data Refinery 中可视化和准备数据
Prompt Lab watsonx.ai
Watson Machine Learning
Tuning Studio watsonx.ai
Watson Machine Learning
在 RStudio IDE 中开发 Shiny 应用程序 RStudio Server with R 3.6
使用 Cognos Dashboards 将数据可视化,而不进行编码 Cognos Dashboards
使用 Spark 环境Spark API 运行分析工作负载 Analytics Engine powered by Apache Spark
在 Apache Hadoop 集群上分析数据 Execution Engine for Apache Hadoop
在 Hadoop 集群或云对象存储器上使用 SQL 查询来分析数据 Db2 Big SQL
使用 AutoAI 来构建模型 Watson Machine Learning
使用 Federated Learning 来训练模型 Watson Machine Learning
在 Notebook 中构建模型 Watson Machine Learning
运行深度学习试验 Watson Machine Learning
Watson Machine Learning Accelerator
求解 Decision Optimization 模型 Watson Machine Learning
Decision Optimization
使用 SPSS Modeler 来构建模型 SPSS Modeler

使用其他服务分析数据

如果未安装 Watson Studio 服务,那么可以将数据分析方法与下表中列出的服务配合使用。

表 2. 数据分析方法和所需服务
方法 服务
使用 Spark API 运行分析工作负载 Analytics Engine powered by Apache Spark
在 Hadoop 集群或云对象存储器上使用 SQL 查询来分析数据 Db2 Big SQL

了解更多