安装 IBM Cloud Pak for Data

重要信息: IBM Cloud Pak® for Data 4.6 版本将于 2025 年 7 月 31 日结束支持 (EOS)。 如需了解更多信息,请参阅 IBM Cloud Pak for Data 版本 4.X 的停止服务公告

IBM Cloud Pak for Data 4.6 版本支持结束之前,升级到 IBM Software Hub 5.1 版本。 更多信息,请参阅 IBM Software Hub 版本 5.1 文档中的升级 IBM Software Hub。

Red Hat® OpenShift® Container Platform 集群管理员和项目管理员可以一起工作以准备集群并安装 IBM Cloud Pak for Data

开始之前

在安装 Cloud Pak for Data 之前,请查看规划部分的信息。

具体而言,请确保查看 系统需求。 必须在具有足够资源且符合 系统需求中的指导的集群上安装软件。 例如,如果不遵循指定的 磁盘需求,那么可能会迂到内存不足错误。

1. 设置客户机工作站

要安装 IBM Cloud Pak for Data,必须具有可连接到 Red Hat OpenShift Container Platform 集群的客户机工作站。

提示: 如果要使多个人员能够处理安装,那么可以设置多个客户机工作站。
客户工作站必须是 Windows、 Mac OS 或 Linux® 机器,并安装了以下软件:
  • Cloud Pak for Data 命令行界面 (cpd-cli) V 12.0.6 或更高版本。
  • 与集群兼容的版本的 OpenShift 命令行界面 (oc)。
选项 要执行的操作
您已设置客户机工作站
  1. 转至 2. 正在收集必需的信息
您未设置客户机工作站
  1. 查看 " 设置客户工作站 "中的指导。
  2. 完成以下任务以在客户机工作站上安装所需软件:
    1. 安装 IBM Cloud Pak for Data 命令行界面
    2. 安装 OpenShift 命令行界面
  3. 转至 2. 正在收集必需的信息

2. 收集所需信息

要成功安装 IBM Cloud Pak for Data,必须具有有关环境的特定信息。

a. 获取 IBM 授权 API 密钥
可从 IBM® Entitled Registry访问所有 IBM Cloud Pak for Data 映像。 IBM 权利 API 密钥使您能够从 IBM Entitled Registry中提取软件映像,以用于安装或镜像到专用容器注册表。
选项 要执行的操作
您已具有 API 密钥
  1. 转至 b。 确定计划安装的组件的列表。
您没有 API 密钥
  1. 完成获取 IBM 权限 API 密钥
  2. 转至 b。 确定计划安装的组件的列表。
b. 确定计划安装的组件的列表
IBM Cloud Pak for Data 由许多组件组成,以便您可以安装支持您需求的特定服务。 在安装 Cloud Pak for Data之前,请确定需要安装哪些组件。
要执行的操作
  1. 审查确定要安装的组件 ,以确保您:
    • 安装所有必需的组件
    • 了解必须完成哪些任务才能准备集群 (某些服务具有额外的安装前配置)
  2. 转至 c。 收集有关可用于设置环境变量的集群的信息。
c. 收集有关可用于设置环境变量的集群的信息
用于安装和升级 IBM Cloud Pak for Data 的命令使用格式为 ${VARIABLE_NAME}的变量。 您可以创建脚本以在运行安装命令之前自动将相应的值导出为环境变量。 在确定脚本的来源之后,您将能够从文档中复制大多数安装和升级命令并运行这些命令,而无需进行任何更改。
要执行的操作
  1. 完成设置安装环境变量
  2. 转至 3。 正在准备集群

3. 准备集群

在安装 Cloud Pak for Data之前,必须准备集群。

a. 是否有现有 Red Hat OpenShift Container Platform 集群?

受支持的 Red Hat OpenShift Container Platform 版本

Cloud Pak for Data 可以安装在以下版本的 Red Hat OpenShift Container Platform上:

  • V 4.8.0 或更高版本的修订

    4.6.0 -仅限 4.6.2

  • V 4.10.0 或更高版本修订

    4.6.x

  • V 4.12.0 或更高版本的修订

    4.6.4 或更高版本


选项 要执行的操作
您正在运行受支持的 OpenShift 版本
  1. 转至 b。 是否需要在受限环境中运行安装?
您具有较低版本的 OpenShift
  1. 升级集群。
  2. 转至 b。 是否需要在受限环境中运行安装?
您没有 OpenShift 集群
  1. 完成安装 Red Hat OpenShift Container Platform。
  2. 转至 b。 是否需要在受限环境中运行安装?
b. 是否需要在受限环境中运行安装?
如果需要对受限网络中的集群运行 cpd-cli manage 命令,那么必须使 olm-utils 映像在集群网络中可用。
选项 要执行的操作
您的集群不在受限网络中
  1. 转至 c。 集群上是否有受支持的持久存储器?
您的集群位于受限网络中
  1. 查看 " 在受限网络中运行 cpd-cli manage 命令 "中的指导,以确定使用哪种方法将所需映像提供给群集中的一个或多个工作站。
  2. 转至 c。 集群上是否有受支持的持久存储器?
c. 集群上是否有受支持的持久存储器?

Cloud Pak for Data 平台支持的存储器

Cloud Pak for Data 平台支持以下存储器:

存储选项 版本 注释
OpenShift Data Foundation
  • V 4.8 或更高版本的修订

    4.6.0 -仅限 4.6.2

  • V 4.10 或更高版本的修订

    4.6.x

  • V 4.12 或更高版本的修订

    4.6.4 或更高版本

以下任一项中提供:
  • IBM Storage Fusion
  • Red Hat OpenShift Platform Plus

确保安装与正在运行的 Red Hat OpenShift Container Platform 版本兼容的 OpenShift Data Foundation 版本。 详情请参见 https://access.redhat.com/articles/4731161.

IBM Storage Fusion
  • V 2.4.0 或更高版本的修订
  • V 2.5.2 或更高版本修订 (建议)
IBM Storage Fusion中提供。
IBM Storage Scale Container Native (带有 IBM Storage Scale Container Storage Interface) V 5.1.5 或更高版本的修订

CSI V 2.6.x 或更高版本的修订

以下任一项中提供:
  • IBM Storage Fusion
  • IBM Storage Suite for IBM Cloud® Paks
Portworx
  • V 2.9.1.3 或更高版本的修订
  • V 2.12.2 或更高版本的修订
 
NFS V 3 或 4 如果您正在使用以下任何服务,那么建议使用 V 3:
  • Db2®
  • Db2 Big SQL
  • Db2 Warehouse
  • Watson Knowledge Catalog
  • Watson Query

如果使用 V 4 ,请确保存储类使用 NFS V 3 作为安装选项。 有关详细信息,请参阅 设置动态供应

Amazon Elastic Block Store (EBS) 不适用 除了 EBS 存储器外,您的环境还必须包含 EFS 存储器。
Amazon Elastic File System (EFS) 不适用 建议您同时使用 EBSEFS 存储器。
IBM Cloud Block Storage 不适用 IBM Cloud Block Storage外,您的环境还必须包含 IBM Cloud File Storage
IBM Cloud File Storage 不适用 建议您同时使用 IBM Cloud Block StorageIBM Cloud File Storage 存储器。
NetApp Trident V 22.4.0 或更高版本的修订  

选项 要执行的操作
您已支持存储器
  1. 确保您具有与计划安装的 服务 配合使用的存储器。
  2. 请查看设置持久存储 ,以确定是否需要完成任何其他任务来为 Cloud Pak for Data 配置存储。
  3. 转至 d。 您是否在集群上具有必需的 OpenShift 项目?
您没有受支持存储器
  1. 确定要使用的存储器。 确保选择与计划安装的 服务 配合使用的存储器。
  2. 按照设置持久存储中的指导安装和配置存储。
  3. 转至 d。 您是否在集群上具有必需的 OpenShift 项目?
d. 集群上是否有必需的 OpenShift 项目?
至少,您必须具有将安装 Cloud Pak for Data 操作程序的项目和将安装 Cloud Pak for Data实例的项目。 如果要执行以下操作,您将需要其他项目:
  • Cloud Pak for Data 运算符与 IBM Cloud Pak foundational services 运算符分隔开
  • 安装 Cloud Pak for Data 的多个实例
  • 在系留项目中部署服务实例或工作负载

有关详情,请参阅支持的项目(命名空间)配置

选项 要执行的操作
您知道在安装软件时计划使用哪些项目
  1. 查看 Red Hat OpenShift Container Platform 上的 "设置项目(命名空间) "指南:
    • 确保集群上具有必需的项目
    • 确定是否需要标注任何项目
    • 设置系留项目 (如果适用)
  2. 转至 。 是否计划安装任何需要定制 SCC 的服务?
您不知道在安装软件时计划使用哪些项目
  1. 查看 Red Hat OpenShift Container Platform 上设置项目(命名空间) 中的指导,确定需要在群集上创建哪些项目,然后创建相应的项目。
  2. 转至 。 是否计划安装任何需要定制 SCC 的服务?
e. 是否计划安装任何需要定制 SCC 的服务?

需要定制 SCC 的服务

如果计划安装以下任何 Cloud Pak for Data 服务,那么必须创建相应的定制 SCC:

服务 必需的 SCC
Db2
Db2 需要定制 SCC。

缺省情况下,将自动创建 SCC; 但是,您可以选择手动创建 SCC。

有关详细信息,请参阅为 Db2 创建自定义安全上下文约束

Db2 Big SQL
Db2 Big SQL 嵌入了需要定制 SCC 的 Db2实例。 此 SCC 仅由嵌入 Db2 数据库的 Db2 Big SQL 实例使用。

将自动创建所需的 SCC。

有关详情,请参阅为嵌入式 Db2 数据库创建自定义安全上下文约束

Db2 Warehouse
Db2 Warehouse 需要定制 SCC。

缺省情况下,将自动创建 SCC; 但是,您可以选择手动创建 SCC。

有关详细信息,请参阅为 Db2 Warehouse 创建自定义安全上下文约束

Informix®

Informix 需要定制 SCC。

必须手动创建此 SCC。

有关详细信息,请参阅为 Informix 创建自定义安全上下文约束

OpenPages®
OpenPages 服务可以选择性地嵌入 Db2的实例。

如果选择使用 Db2的嵌入式实例,那么 OpenPages 需要 Db2 数据库的定制 SCC。 此 SCC 仅由嵌入 Db2 数据库的 OpenPages 实例使用。

将自动创建所需的 SCC。

有关详情,请参阅为嵌入式 Db2 数据库创建自定义安全上下文约束

如果选择使用外部数据库,那么不需要定制 SCC。

Watson Knowledge Catalog Watson Knowledge Catalog 需要两个定制 SCC:

如果安装 Data Privacy,那么服务将使用 Watson Knowledge Catalog SCC。

Watson Query
Watson Query 嵌入了需要定制 SCC 的 Db2实例。 此 SCC 仅由嵌入 Db2 数据库的 Watson Query 实例使用。

将自动创建所需的 SCC。

有关详情,请参阅为嵌入式 Db2 数据库创建自定义安全上下文约束


选项 要执行的操作
您计划安装这些服务中的一个或多个
  1. 创建适用于您的环境的 SCC。 有关详情,请参阅为服务创建自定义安全上下文限制
  2. 转至 f。 您是否计划安装任何需要特定节点设置的服务?
您不打算安装这些服务中的任何一个
  1. 转至 f。 您是否计划安装任何需要特定节点设置的服务?
f. 是否计划安装任何需要特定节点设置的服务?

需要节点设置的服务
节点设置 需要对设置进行更改的服务
负载均衡器超时设置
  • Db2
  • Db2 Data Gate
  • Db2 Warehouse
  • OpenPages
  • Watson Discovery
  • Watson Knowledge Catalog
  • Watson Query
  • Watson Speech services
  • Watson Studio
CRI-O 容器设置
  • Cognos® Analytics
  • Db2
  • Db2 Big SQL
  • Db2 Warehouse
  • Watson Discovery
  • Watson Knowledge Catalog
  • Watson Query
  • Watson Studio
  • Watson Machine Learning Accelerator
内核参数设置
  • Db2
  • Db2 Big SQL
  • Db2 Warehouse
  • Watson Knowledge Catalog
  • Watson Query
GPU 设置
  • Runtime 22.1 with Python 3.9 for GPU
  • Runtime 22.2 with Python 3.10 for GPU
  • Watson Machine Learning Accelerator

选项 要执行的操作
您计划安装这些服务中的一个或多个
  1. 更新节点设置。 有关详细信息,请参阅更改所需的节点设置
  2. 转至 g。 您将如何访问软件映像?
您不打算安装这些服务中的任何一个
  1. 转至 g。 您将如何访问软件映像?
(例如, 您将如何访问软件映像?
可从 IBM Entitled Registry访问 Cloud Pak for Data 映像。 在大多数情况下,强烈建议您将必需的软件映像从 IBM Entitled Registry 镜像到专用容器注册表。
您应该从何处提取图像?
重要说明:
在下列情况下,必须将必需的映像镜像到专用容器注册表:
  • 您的集群气郄 (也称为脱机或断开连接的集群)。
  • 集群使用 允许列表 来允许特定站点直接访问,并且允许列表不包含 IBM Entitled Registry
  • 集群使用 阻止列表 来阻止特定站点直接访问,并且阻止列表包含 IBM Entitled Registry
即使这些情况不适用于您的环境,如果要执行以下操作,您也应考虑使用专用容器注册表:
  • 在集群上安装软件映像之前对其运行安全性扫描
  • 确保您具有可用于多个部署 (例如,开发或测试环境和生产环境) 的相同映像

您可能考虑直接从 IBM Entitled Registry 中拉取映像的 唯一 情况是,集群未气郄,网络极其可靠,并且不需要等待时间。 但是,为实现可预测且可靠的性能,您应该将映像镜像到专用容器注册表。


选项 要执行的操作
您正在从 IBM Entitled Registry 中拉取映像
  1. 完成更新全局图像提取密码
  2. 转至 4. 安装 Cloud Pak for Data 平台和服务
您正在从专用容器注册表中拉取映像
  1. 完成更新全局图像提取密码
  2. 完成镜像到私有容器注册表
  3. 转至 4. 安装 Cloud Pak for Data 平台和服务

4. 安装 Cloud Pak for Data 平台和服务

准备集群后,可以安装 Cloud Pak for Data 平台和服务。

要执行的操作
  1. 安装 IBM Cloud Pak for Data 平台和服务中完成适合您环境的任务。
  2. 转至 5. 完成安装后任务

5. 完成安装后任务

安装 Cloud Pak for Data后,请确保集群安全,并完成将影响用户与 Cloud Pak for Data交互方式的任务,例如配置 SSO 或更改到平台的路径。

要执行的操作
在 " 安装后设置(第 1 天操作) "中完成适合您环境的任务。

6. 安装服务

选项 要执行的操作
安装平台时安装了服务 最佳实践回顾开始使用 Cloud Pak for Data.
安装平台时未安装服务 安装要使用的服务。 请参阅 服务中有关单独安装每个服务的指示信息。