快速入门教程

获取快速入门教程以了解如何执行特定任务,例如优化数据或构建模型。 这些教程帮助您快速了解如何执行特定任务或一组相关任务。

注:

如果要了解如何实现特定用例,请考虑采用 用例教程。 用例教程可帮助您试用数据结构用例 (例如,数据集成) 或构建和管理 AI 用例 (例如,数据科学和 MLOps)。

正在寻找视频? 访问视频库 ,观看 Cloud Pak for Data as a Service 中的许多常见任务。

完成这些教程后,请参阅 其他学习资源 部分以继续学习。

快速入门教程按任务分类:

每个教程都需要一个或多个服务实例。 某些服务包含在多个教程中。 教程按任务分组。 您可以从任何任务开始。 其中每个教程都提供了工具的描述,视频,指示信息和其他学习资源。

每个教程的标记都描述了专业知识级别 () 以及所需的编码量 ()。

先决条件

所有教程的前提条件是注册或加入 Cloud Pak for Data as a Service 账户

准备数据

要开始准备,转换和集成数据,请了解整个工作流程,选择教程,并查看其他学习资源以在平台上工作。

数据准备工作流程涉及以下以下基本步骤:

  1. 创建项目。

  2. 如果需要,请创建可提供要使用工具的服务实例,并将其与项目相关联。

  3. 将数据添加到项目。 您可以添加本地系统中的数据文件,连接到的远程数据源中的数据,目录中的数据或资源中心中的样本数据。

  4. 选择用于分析数据的工具。 每个教程都描述了一个工具。

  5. 运行或调度用于准备数据的作业。

准备数据的教程

在这些教程中,每一个都提供了工具描述、视频、指示信息和其他学习资源:

教程 描述 教程的专业知识
使用 Data Refinery优化和可视化数据 使用图形流编辑器来准备和可视化表格数据。 选择操作以处理数据。
使用 DataStage 变换数据 设计数据集成流以使用图形流编辑器对表进行过滤和排序。 将数据和操作节点放在画布上并选择属性。
数据虚拟化 通过连接两个表来创建虚拟化表。 选择表并连接主键列。

分析和可视化数据

要开始分析和可视化数据,请了解整个工作流程,选择教程,并查看其他学习资源以使用其他工具。

分析和可视化数据工作流程涉及以下以下基本步骤:

  1. 创建项目。

  2. 如果需要,请创建可提供要使用工具的服务实例,并将其与项目相关联。

  3. 将数据添加到项目。 您可以添加本地系统中的数据文件,连接到的远程数据源中的数据,目录中的数据或资源中心中的样本数据。

  4. 选择用于分析数据的工具。 每个教程都描述了一个工具。

分析和可视化数据的教程

在这些教程中,每一个都提供了工具描述、视频、指示信息和其他学习资源:

教程 描述 教程的专业知识
分析 Jupyter Notebook 中的数据 装入数据,运行和共享 Notebook。 了解生成的 Python 代码。
使用 Data Refinery优化和可视化数据 使用图形流编辑器来准备和可视化表格数据。 选择操作以处理数据。

构建,部署和信任模型

要开始构建,部署和信任模型,请了解整个工作流程,选择教程,并查看其他学习资源以在平台上工作。

AI 生命周期中涉及的不同阶段如下:

  1. 定义作用域: 首先通过确定关键目标和需求来定义项目作用域。
  2. 准备数据: 收集和准备数据以用于机器学习算法。
  3. 构建模型: 通过使用准备好的数据训练模型,开发和优化 AI 模型以解决定义的问题。
  4. 部署模型: 在构建过程完成后将模型部署到生产环境。
  5. 自动管道: 通过自动执行 AI 生命周期的某些部分来自动执行生产路径。
  6. 监视性能: 评估模型的性能以实现公平性,质量,漂移和可解释性。

下图显示了 AI 生命周期的各个阶段:

AI 生命周期的各个阶段

构建、部署和信任模型的工作流程包含以下基本步骤:

  1. 创建项目。

  2. 如果需要,请创建可提供要使用工具的服务实例,并将其与项目相关联。

  3. 选择一个工具来构建、部署和信任模型。 每个教程都描述了一个工具。

有关构建,部署和信任模型的教程

每个教程都提供了工具的描述,视频,指示信息和其他学习资源:

教程 描述 教程的专业知识
使用 AutoAI构建和部署机器学习模型 使用 AutoAI 工具自动构建模型候选项。 无需编码即可构建,部署和测试模型。
在 Notebook 中构建和部署机器学习模型 通过更新和运行使用Python代码和watsonx.aiRuntime API 的笔记本来构建模型。 构建,部署和测试使用 Python 代码的 scikit-learn 模型。
使用 SPSS Modeler构建和部署机器学习模型 构建使用 SPSS Modeler 工具的 C5.0 模型。 将数据和操作节点放在画布上并选择属性。
构建和部署 Decision Optimization 模型 使用 Modeling Assistant自动构建方案。 求解和探索方案,然后部署和测试模型而不进行编码。
评估机器学习模型 部署模型,配置已部署模型的监视器,并评估模型。 运行 Notebook 以配置模型并使用 Watson OpenScale 进行评估。

管理人工智能

要开始使用治理人工智能,首先要了解整个工作流程,选择一个教程,并查看在该平台上工作的其他学习资源。

人工智能治理工作流程有以下基本步骤:

  1. 创建项目。

  2. 如有必要,请创建提供所需工具的实例,并将其关联到项目中。

  3. 选择管理人工智能的工具。 每个教程都描述了一个管理人工智能资产的示例。

管理人工智能的教程

每个教程都提供了工具的描述,视频,指示信息和其他学习资源:

教程 描述 教程的专业知识
评估机器学习模型 部署模型,为部署的模型配置监控器,并评估模型Watson OpenScale。 运行笔记本配置监视器,并使用Watson OpenScale进行评估。
评估空间部署 部署模型,为已部署模型配置监控器,并在部署空间中对模型进行评估。 配置监视器并评估部署空间中的模型。

整理和管理数据

要开始组织和管理数据,请了解整个工作流程,选择教程,并查看其他学习资源,以在 Cloud Pak for Data 即服务中工作。

如果您使用自己的 IBM watsonx.data intelligence Lite 计划,您可以创建两个目录,其中包含 50 个资产、5 个业务术语和 1 个数据保护规则。 您也是用于组织监管工件(例如数据类和业务术语)的唯一类别的所有者。

如果您在组织的 IBM watsonx.data intelligence 标准、企业或专业计划账户中工作,您必须有特定的角色和权限来管理数据和创建数据类和业务术语等治理工件。

数据组织工作流程涉及以下基本步骤:

  1. 将数据资产添加到目录:
    • 在项目中一次添加一个数据资产,然后将其发布到某个目录。
    • 通过导入元数据在项目中添加来自连接的所有数据资产,然后将其发布到某个目录。
    • 从目录中一次添加一个数据资产。
  2. 通过分配监管工件(例如业务术语)增补数据资产。

管理数据工作流程涉及以下基本步骤:

  1. 对于数据保护规则,指定如何识别要屏蔽的数据类型和屏蔽方法。 这样会立即强制执行规则。
  2. 对于所有其他类型的监管工件:
    1. 在类别中创建监管工件草稿。
    2. 发布监管工件。

用于组织和管理数据的教程

在数据智能用例中选择数据结构教程

其他学习资源

指导式教程

访问 "资源中心 "中的 "构建人工智能模型 "示例项目,按照指导教程进行操作。 创建样本项目后,自述文件会提供指示信息:

  • 选择 探索并准备数据 以使用 Data Refinery来除去数据中的异常。
  • 选择在 Notebook 中构建模型以使用 Python 代码构建模型。
  • 选择构建并部署模型以使用 AutoAI 工具自动构建模型。

观看此视频系列以了解如何使用样本项目中的资产。

总则

准备数据

分析和可视化数据

构建,部署和信任模型

整理和管理数据

管理人工智能

视频

样本

  • 资源中心 提供可导入的样本 Notebook ,数据集和项目。

  • 行业加速器提供使用可解决特定业务问题的端到端解决方案的样本项目。

  • Knowledge Accelerators 提供了特定于行业且现成可用的监管工件集合。

培训