升级 Red Hat OpenShift AI (从 5.1 版本升级至 5.3 版本)

如果您的环境中包含依赖于 Red Hat OpenShift AI的服务,您可能需要在升级 之前 Red Hat OpenShift AI Operator 先升级 IBM® Software Hub

升级阶段
  • 你不在这里。 更新您的客户端工作站
  • 你不在这里。 收集所需信息
  • 你不在这里。 在受限网络中准备执行升级
  • 你不在这里。 准备从私有容器注册表执行升级
  • 您当前所在位置图标。 准备集群
  • 你不在这里。 准备升级实例
  • 你不在这里。 升级实例
谁需要完成这项任务?

集群管理员 此任务必须由集群管理员完成。

你需要在什么时候完成这项任务?

一次性设置 如果以下两项陈述均成立,请完成此任务:

  • 集群上已安装或即将安装以下一项或多项服务:
    服务 Red Hat OpenShift AI
    IBM Knowledge Catalog Premium
    • 如果在 GPU 上运行模型,则必须指定此选项。
    • 如果您在以下环境中运行模型,则无需此操作:
      • CPU
      • 一个远程实例 watsonx.ai™
    IBM Knowledge Catalog Standard
    • 如果在 GPU 上运行模型,则必须指定此选项。
    • 如果您在以下环境中运行模型,则无需此操作:
      • CPU
      • 一个远程实例 watsonx.ai
    Watson Speech services

    仅当您希望启用增强功能时才需要此项。

    watsonx.ai

    必须填写。

    watsonx Assistant

    仅当您需要使用依赖 GPU 的功能时才需要。

    watsonx™ BI

    必须填写。

    watsonx Code Assistant™

    必须填写。

    watsonx Code Assistant for Red Hat Ansible® Lightspeed

    必须填写。

    watsonx Code Assistant for Z

    必须填写。

    watsonx Code Assistant for Z Agentic

    必须填写。

    watsonx Code Assistant for Z Code Explanation

    必须填写。

    watsonx Code Assistant for Z Code Generation

    必须填写。

    watsonx.data™ Premium

    必须填写。

    watsonx.data intelligence

    必须填写。

    watsonx Orchestrate
    • 如果您在本地运行模型,则必须提供此项。
    • 如果您使用 AI 网关访问第三方模型,则无需此操作。
  • 您要升级 IBM Software Hub 到的版本需要更新版的 Red Hat OpenShift AI
    解除 Red Hat OpenShift AI 版本
    5.3.12026年2月 2.25.1
    5.3.02025年12月 2.25

关于本任务

此任务中的命令将 Red Hat OpenShift AI 系统升级至支持 IBM Software Hub 各项服务所需的最低配置。

过程

  1. 以集群管理员身份 Red Hat OpenShift Container Platform 登录。
    ${OC_LOGIN}
    请记住: OC_LOGIN 是 命令 oc login 的别名。
  2. ODS_OPERATOR_NS 环境变量设置为安装了 Red Hat OpenShift AI Operator的项目名称。

    以下命令使用推荐的项目: redhat-ods-operator.

    export ODS_OPERATOR_NS=redhat-ods-operator
  3. 请根据您正在安装的 Red Hat OpenShift AI 版本设置 CHANNEL_VERSION 环境变量:

    版本 2.25
    export CHANNEL_VERSION=stable-2.25

  4. 更新 rhods-operator 运营商订阅:
    cat << EOF | oc apply -f -
    apiVersion: operators.coreos.com/v1alpha1
    kind: Subscription
    metadata:
      name: rhods-operator
      namespace: ${ODS_OPERATOR_NS}
    spec:
      name: rhods-operator
      channel: ${CHANNEL_VERSION}
      source: redhat-operators
      sourceNamespace: openshift-marketplace
      config:
         env:
            - name: "DISABLE_DSC_CONFIG"
    EOF

    创建订阅时,该命令会返回以下消息:

    subscription.operators.coreos.com/rhods-operator configured
  5. DSC_INIT_NAME 环境变量设置为 DSC Initialization (DSCInitialization) 对象的名称。

    以下命令使用默认名称: default-dsci.

    export DSC_INIT_NAME=default-dsci
    提示: 运行以下命令以获取 DSC Initialization (DSCInitialization) 对象的名称:
    oc get dscinitialization
  6. 更新 DSCInitialization(DSCInitialization) 对象:
    cat << EOF | oc apply -f -
    apiVersion: dscinitialization.opendatahub.io/v1
    kind: DSCInitialization
    metadata:
     name: ${DSC_INIT_NAME}
    spec:
     applicationsNamespace: redhat-ods-applications
     monitoring:
      managementState: Managed
      namespace: redhat-ods-monitoring
     serviceMesh:
      managementState: Removed
     trustedCABundle:
      managementState: Managed
      customCABundle: ""
    EOF
  7. 等待 DSC 初始化对象就绪 Ready

    要查看对象的状态,请运行:

    oc get dscinitialization
  8. DS_CLUSTER_NAME 环境变量设置为数据科学集群 (DataScienceCluster) 对象的名称。

    以下命令使用默认名称: default-dsc.

    export DS_CLUSTER_NAME=default-dsc
    提示: 运行以下命令以获取数据科学集群 (DataScienceCluster) 对象的名称:
    oc get datasciencecluster
  9. 更新数据科学集群 (DataScienceCluster) 对象:
    cat << EOF | oc apply -f -
    apiVersion: datasciencecluster.opendatahub.io/v1
    kind: DataScienceCluster
    metadata:
      name: default-dsc
    spec:
      components:
        codeflare:
          managementState: Removed
        dashboard:
          managementState: Removed
        datasciencepipelines:
          managementState: Removed
        kserve:
          managementState: Managed
          defaultDeploymentMode: RawDeployment
          serving:
            managementState: Removed
            name: knative-serving
        kueue:
          managementState: Removed
        modelmeshserving:
          managementState: Removed
        ray:
          managementState: Removed
        trainingoperator:
          managementState: Managed
        trustyai:
          managementState: Removed
        workbenches:
          managementState: Removed
    EOF

    该工具 Red Hat OpenShift AI Operator 负责管理列为 的服务 Managed ,并在可能的情况下对这些服务进行升级。

  10. 请等待“数据科学集群”对象就绪 Ready

    要查看对象的状态,请运行:

    oc get datasciencecluster ${DS_CLUSTER_NAME} -o jsonpath='"{.status.phase}" {"\n"}'
  11. 查看项目 redhat-ods-applications 中 Pod 的状态:
    oc get pods -n redhat-ods-applications

    请确保以下 Pod 正在运行:

    • kserve-controller-manager
    • kubeflow-training-operator
    • odh-model-controller
  12. 重启该 Red Hat OpenShift AI Operator Pod:
    oc delete pod -n ${ODS_OPERATOR_NS} -l name=rhods-operator
  13. 编辑项目 redhat-ods-applications 中的配置 inferenceservice-config 映射:
    1. 以集群管理员身份登录 Red Hat OpenShift Container Platform Web 控制台。
    2. 在导航菜单中,选择 工作量 > ConfigMaps
    3. “项目 ”列表中,选择 redhat-ods-applications
    4. 点击该 inferenceservice-config 资源。 然后,打开 “YAML ”选项卡。
    5. 在文件的 metadata.annotations 部分中,添加 opendatahub.io/managed: 'false'. 例如:
      metadata:
        annotations:
          internal.config.kubernetes.io/previousKinds: ConfigMap
          internal.config.kubernetes.io/previousNames: inferenceservice-config
          internal.config.kubernetes.io/previousNamespaces: opendatahub
          opendatahub.io/managed: 'false'
    6. 在文件中查找以下条目:
      "domainTemplate": "{{ .Name }}-{{ .Namespace }}.{{ .IngressDomain }}",
    7. 将该 domainTemplate 字段的值更新为 "example.com"
      "domainTemplate": "example.com",
    8. 单击保存

下一步操作

现在您已完成升级 Red Hat OpenShift AI,接下来可以开始执行“升级 IBM 的多云对象网关” Software Hub (从版本 5.1 升级至版本 5.3 )