Watson Studio 及补充服务的已知问题和限制

以下已知问题和限制适用于 Watson Studio。

已知问题

限制

Anaconda Repository for IBM Cloud Pak for Data 的已知问题

Anaconda Repository for IBM Cloud Pak for Data 的频道名称不支持双字节字符

在 Anaconda Team Edition 中创建频道时,您不能使用双字节字符或大多数特殊字符。 只能使用下列字符:a-z 0-9 - _

Hadoop 集成的已知问题

Cloudera 数据平台(CDP) 7.3.1 在执行 DSXHI REST 状态检查时可能会返回错误 500

适用范围 : 5.3.0

在 CDP 7.3.1 上运行 ./status.py 该命令时,DSXHI REST 状态检查可能会返回错误 500 。 此错误不会影响 Execution Engine for Apache Hadoop 的功能。

在 Notebook 中执行 hi_core_utils 中的某个方法时发生错误

适用范围 : 5.3.0

在笔记本中使用推送的 imageId 创建 Livy Spark 会话后,执行 中的某个方法时,可能会 hi_core_utils看到以下错误:

An error was encountered:
<class 'RuntimeError'> —- OpenSSL 3.0's legacy provider failed to load. This is a fatal error by default, but cryptography supports running without legacy algorithms by setting the environment variable CRYPTOGRAPHY_OPENSSL_NO_LEGACY. If you did not expect this error, you have likely made a mistake with your OpenSSL configuration.

解决方法 :在同一单元格中插入以下代码,以在笔记本中 CRYPTOGRAPHY_OPENSSL_NO_LEGACY 设置环境变量:

import os
os.environ["CRYPTOGRAPHY_OPENSSL_NO_LEGACY"] = "1"

支持的 Spark 版本

适用范围 : 5.3.0

  • Apache Spark 3.1 因为不支持 Power。

  • 要在 Cloud Pak for Data 5.1.0 上运行 Jupyter Enterprise Gateway (JEG),您必须在内核启动后,将以下命令作为第一个单元格执行:

    from pyspark.sql import SparkSession
    from pyspark import SparkContext
    spark = SparkSession.builder.getOrCreate()
    sc = SparkContext.getOrCreate()
    

笔记本电脑已知问题

在 Jupyter Notebook 编辑器中无法将笔记本导出为HTML

适用版本 : 5.3.0 及更高版本

当您处理的 Jupyter 笔记本并非在 Watson Studio 上创建时,可能无法将该笔记本导出为 HTML。 当单元格输出内容被显示出来时,就会出现此问题。

变通方法

  1. 在 Jupyter Notebook 用户界面中,转到 “编辑”选项卡 ,然后单击 “编辑笔记本元数据 ”。

  2. 删除以下元数据:

    "widgets": {
       "state": {},
       "version": "1.1.2"
    }
    
  3. 单击编辑

  4. 保存该 Notebook。

尝试访问 Oracle 数据库中的数据时发生错误

如果您尝试访问 Oracle 数据库中的数据,如果模式或表名中包含句点等 . 特殊字符, DatabaseError 可能会收到错误提示。 这是因为 Oracle 在模式、表和列之间使用句点作为分隔符。 如果出现此问题,请考虑从数据库的表名或模式中删除所有句点,或者修改代码,将表名或模式标识符用双引号括起来, my_schema."table.with.dots"例如:

5.3.1 版本的补丁 2 中证书变更将影响笔记本工作负载

适用版本:5.3.1 补丁2

5.3.1 版本的第 2 个补丁将进行证书变更,这将影响所有内部通信中对 SSL 的验证。 这会影响用户发起的工作负载,包括:

  • 笔记本电脑的续航时间
  • 笔记本电脑相关职位

建议采取的措施

  • 升级前 :关闭所有可能受影响的工作负载(笔记本运行时和作业)
  • 升级后 :如果升级前未关闭工作负载,请重启任何出现问题的工作负载

项目的已知问题

从 GIT 仓库中删除某些资产并不会清理所有相关文件。

适用范围:5.3.0

例如,删除一个 AutoAI 实验可能会在存储库中留下管道文件。 如果您发现残留文件,可以手动从 Git 存储库中将其删除。

在导入的项目中使用 AutoAI 从存储卷连接添加数据时发生错误

适用范围:5.3.0

在导入的项目中使用 AutoAI 模型构建器时,从存储卷连接中添加数据资产可能会导致意外错误。 在导入项目时,系统会自动创建一个存储卷连接资源。 如果导入的项目连接到环境中已存在的存储卷,且该存储卷的名称与所连接的存储连接名称相同,则会出现此问题。

变通方法:

将连接资源导入项目后:

  1. 删除在导入项目时自动创建的存储卷连接。
  2. 创建新的存储卷连接。

从 Git -集成项目中删除的文档文件,在删除后仍显示在“资源”中

适用范围:5.3.0

如果您使用文档编辑器为已集成 Git 的项目创建了一个文档文件,随后又将其删除,该文件在“资源”下仍然可见。

变通方法:

使用 API 通过向以下地址发送请求 DELETE 来删除该资源:

<cluster>/userfs/v2/assets/<asset_id>?project_id=<project_id>

尽管显示成功消息,但将项目中的资源发布到目录失败

适用范围:5.3.0

将项目中的资产发布到目录时,系统会显示一条成功通知,但该资产并未如预期般出现在目录中。

变通方法:

请检查网络控制台是否有任何错误。

在项目中使用默认的 Git 集成创建深度学习实验时,因错误而失败

适用范围:5.3.0

如果您在启用了默认的 Git 集成的项目中创建了一个使用 IBM Cloud Object Storage 连接数据的深度学习实验,该实验将因以下错误而失败:

Error: Got 403 getting repository resource

变通方法:

  1. 请从 IBM Cloud Object Storage 将数据集下载到本地计算机上。
  2. 将数据集作为数据资产导入项目。
  3. 使用导入的数据资产创建深度学习实验。

可视化功能已知问题

对于包含 DATE 类型列的已连接数据资产,其列级概况信息中未显示任何行

适用版本:5.3.0 及更高版本

对于包含类型为 的列的已连接数据 DATE资产,在 “数据类 ”、 “格式 ”或 “类型 ”选项卡中点击 “显示行 ”时,不会显示任何行。

运行时已知问题

升级 RStudio 可能会失败

适用版本:5.3.0 及更高版本

在将 RStudio 运行时升级至 5.3 版本时,升级可能会失败,且 和 delete-rstudio-runtime-251 delete-rstudio-runtime-241 Pod无法被调度。

该错误的输出示例:

oc get rstudio rstudio-cr -oyaml
----
  progress: 80%
  progressMessage: Wait for runtime install/delete
  reconcileHistory:
  - '2025-12-01T17:33:53.80944Z The failed task is : Wait until ibm-cpd-rstudio-251
    RStudioAddon CR status is Completed and the error message is: No message available'
  - '2025-12-01T16:44:18.72515Z The failed task is : Wait until ibm-cpd-rstudio-251
    RStudioAddon CR status is Completed and the error message is: No message available'
  - '2025-12-01T15:55:29.52077Z The failed task is : Wait until ibm-cpd-rstudio-251
    RStudioAddon CR status is Completed and the error message is: No message available'
  rstudioBuildNumber: "160"
  rstudioStatus: Failed
  versions:
    reconciled: 10.2.0
bash-5.1$ oc get RStudioAddon -n zen
NAME                  VERSION   RECONCILED   STATUS      PERCENT   AGE
ibm-cpd-rstudio-241   12.0.0    10.2.0       Completed   100%      4d22h
ibm-cpd-rstudio-251   12.0.0                                       4d5h
rstudio-cr            12.0.0    10.2.0       Failed      80%       4d22h

变通方法:

要解决此问题以便完成升级,请执行以下步骤:

  1. 搜索 RStudio 的Pod以及 RStudio 的任务,以检查这些Pod是否处于以下 Pending 状态:
    oc -n <cpd-instance-namespace> get pods  | grep rstudio
    oc get pods | grep studio
    delete-rstudio-runtime-241-jxztb                               0/1     Pending     0               51s
    delete-rstudio-runtime-251-82z4j                               0/1     Pending     0               52s
    oc -n <cpd-instance-namespace> get jobs | grep rstudio
    oc get jobs | grep studio
    delete-rstudio-runtime-241                               Running    0/1           31s        31s
    delete-rstudio-runtime-251                               Running    0/1           32s        32s
    
  2. 删除卡在 状态 Pending 的作业,并删除 RStudio 运行时自定义资源 (CR):
    oc -n <cpd-instance-namespace> delete job delete-rstudio-runtime-241 delete-rstudio-runtime-251
    oc -n <cpd-instance-namespace> delete rstudio ibm-cpd-rstudio-241 ibm-cpd-rstudio-251
    
  3. 通过删除 RStudio 操作员Pod来重启 RStudio 操作员:
    oc -n <cpd-operator-namespace> get po | grep rstudio
    oc -n <cpd-operator-namespace>  delete po <rstudio-operator-pod-name>
    
  4. 删除后, RStudio CR (rstudio-cr) 会进行数据核对并重新开始。 然后升级就完成了。 例如:
    oc  -n <cpd-instance-namespace> get rstudio
    NAMESPACE   NAME                  VERSION   RECONCILED   STATUS      PERCENT   AGE
    zen         ibm-cpd-rstudio-241   12.0.0    12.0.0       Completed   100%      20m
    zen         ibm-cpd-rstudio-251   12.0.0    12.0.0       Completed   100%      20m
    zen         rstudio-cr            12.0.0    12.0.0       Completed   100%      4d20h
    

将 RStudio 升级至 5.3 的进程无法完成

适用版本:5.3.0 及更高版本

错误示例:

message: |-
      unknown playbook failure
      The playbook has failed at task 'Fetch ibm-cpd-rstudio-251 RStudioAddon CR to check if status is Completed"'
      The error was: 'Consult the ibm-cpd-rstudio-operator logs for details.'
    reason: Failed
    status: "True"
    type: Failure
  - lastTransitionTime: "2026-01-28T23:13:06Z"
    message: Running reconciliation
    reason: Running
    status: "True"
    type: Running
  operand:
    available:
      versions:
      - 11.2.0
  progress: 15%
  progressMessage: Starting install of rstudio role
  reconcileHistory:
  - '2026-01-28T23:12:47.14545Z The failed task is : Fetch ibm-cpd-rstudio-251 RStudioAddon
    CR to check if status is Completed" and the error message is: No message available'
  - '2026-01-28T22:33:09.23834Z The failed task is : Fetch ibm-cpd-rstudio-251 RStudioAddon
    CR to check if status is Completed" and the error message is: No message available'
  - '2026-01-28T21:56:34.45631Z The failed task is : Fetch ibm-cpd-rstudio-251 RStudioAddon
    CR to check if status is Completed" and the error message is: No message available'
  rstudioBuildNumber: "103"
  rstudioStatus: InProgress
  versions:
    reconciled: 11.2.0

变通方法:

要修订此问题,请执行以下操作:

  1. 请验证该条目 rstudio 是否存在于操作符命名空间中的该组 subscriptions.operators.coreos.com 中:

    oc -n <operator-namespace> get subscriptions.operators.coreos.com | grep rstudio
    
  2. 如果该 rstudio 条目存在,请使用以下命令手动将其删除:

    oc -n <operator-namespace> delete subscriptions.operators.coreos.com ibm-cpd-rstudio-operator-catalog-subscription
    
  3. 请尝试更新 RStudio 中的 Helm 图表。 参见示例:

    cpd-cli manage case-download --release=5.3.0 --components=rstudio --cluster_resources=true --operator_ns=<operator-namespace>
    helm upgrade --install --namespace zen rstudio cpd-cli-workspace/olm-utils-workspace/work/offline/5.3.0/.ibm-pak/data/cases/ibm-rstudio/12.0.0/charts/rstudio-12.0.0+20251121.171719.160.tgz --debug -f cpd-cli-workspace/olm-utils-workspace/work/olm-utils-ansible-log/override_file_1770151662.9664164.yaml
    
  4. 删除 RStudio 操作员Pod以重启它:

    oc -n <operator-namespace>  get po | grep rstudio
    oc -n <operator-namespace>  delete po ibm-cpd-rstudio-operator-xxx-xxx
    oc -n <operator-namespace>  get po | grep rstudio
    

    此命令将启动:

    • 位于 running 州的一个新 rstudio 操作员舱
    • rstudio-cr 过程
  5. 验证 RStudio 的CR是否已成功升级:

    oc -n <cpd-instance-namespace> get rstudio
    

    以下是升级成功的示例输出:

    NAME                  VERSION   RECONCILED   STATUS      PERCENT   AGE
    ibm-cpd-rstudio-241   12.0.0    12.0.0       Completed   100%      17m
    ibm-cpd-rstudio-251   12.0.0    12.0.0       Completed   100%      18m
    rstudio-cr            12.0.0    12.0.0       Completed   100%      90d
    

资产限制

文件上传的安全性

适用范围:5.3.0

通过 Watson Studio 或 Watson Machine Learning 用户界面上传的文件不会经过验证,也不会被扫描以检测潜在的恶意内容。 强烈建议您在上传文件前,先使用安全软件(例如杀毒软件)对所有文件进行扫描,以确保内容的安全。

无法将 CSV 文件加载到大于20 GB的项目中

在 Cloud Pak for Data 中,您无法将大于 20 GB 的 CSV 文件加载到项目中。

资产预览限制

您无法预览以下类型的资源:

  • 与使用个人凭证的连接相关联的文件夹资产。 系统会提示您输入个人凭证,以开始该连接资产的预览或概要分析。
  • 项目中图像文件的已连接数据资产。
  • 文本文件和 JSON 文件的使用共享凭证的已连接资产不正确地显示在网格中。
  • 项目中 PDF 文件的已连接数据资产。

Hadoop 集成的限制

Cloud Pak for Data 集群和 Hadoop 集群必须部署在同一网络中

要使 Cloud Pak for Data 与 Hadoop 集群之间的连接正常工作,它们必须位于同一网络环境中。

当集群重启时, Livy 服务不会自动重启

如果 HDFS 的 NameNode 未处于活动状态, Livy 服务在系统重启后不会自动重启。

解决方法: 重新启动 Livy 服务。

职位的限制

设置为重复执行的任务也会在整点时运行

设置为重复运行的任务将在预定时间执行,并在下一分钟(:00)开始时再次执行。

如果使用了特殊字符,作业运行时的环境变量值将不正确

如果环境变量的值包含特殊字符,则在作业配置中定义的环境变量无法正确传递给作业运行。 这可能会导致作业运行失败,或作业运行出现异常。 要解决此问题,请参阅 《若使用特殊字符,作业运行时的环境变量值将出现错误 》。

在升级 Cloud Pak for Data 版本后删除环境会导致作业运行失败

如果作业使用的环境不再安全,且在升级至 Cloud Pak for Data 版本后已被删除,则该作业在部署空间或项目中的运行将失败。

解决方法: 为防止作业因升级而失败:

  • 请检查升级前将被移除的环境。
  • 编辑该作业,使其指向一个不会被删除的备用环境。
  • 如果您的作业无法在任何替代环境中运行,请基于现有环境创建一个自定义环境,并将作业指向该自定义环境。 有关详细信息,请参阅 “自定义环境”

在调度作业时排除某些天导致意外结果

如果您选择调度作业,使其在一周中给定日子以外的每一天运行,那么您可能会注意到调度的作业没有按预期运行。 这是因为,创建该调度的用户在一个时区,运行该作业所在的主节点在另一个时区。

只有在调度作业运行时间时排除掉一周中某几天的情况下,才会出现此问题。

项目的限制

Git 集成项目中的资源未显示在智能搜索中

使用智能搜索栏跨工作区搜索时,来自使用 Git 集成的项目的数据资产不会显示在搜索结果中。

变通方法:

转到“ Git ”集成项目,并在 “Assets ”下查找该资源。

无法在一个项目中同时运行多个 RStudio 会话

适用范围:5.3.0

在一个项目中,任何时刻都只能有一个 RStudio 会话处于活动状态。 如果您想同时打开多个会话,必须创建一个单独的项目。

当所有资源已被删除时,无法同步已弃用的 Git 项目

如果您从一个已弃用的 Git 项目中删除了所有资源,该项目将无法再与 Git 存储库同步。

解决方法: 在已弃用的 Git 项目中保留至少一个资源。

在基于 Git 的项目中,无法预览从目录导入的、带有受管附件的资源

在基于 Git 的项目中,当您尝试预览从目录导入的、带有受管附件的资源时,会出现错误。 在基于 Git 的项目中不支持预览这些资源。

在默认使用 Git 集成的项目中,请勿使用来自已弃用的 Git 集成项目的 Git 仓库

在默认使用 Git 集成的项目中,不应从使用已弃用的 Git 集成的项目中使用 Git 仓库,否则可能会导致错误。 例如,在 Bitbucket 中,你会看到一条错误提示,指出该仓库包含来自已弃用的 Git 项目的内容,尽管所选分支包含默认的 Git 项目内容。

在具有默认 Git 集成的项目中,您可以使用一个全新的、已清理的 Git 仓库,或者链接到一个曾在具有默认 Git 集成的项目中使用过的仓库。

在 Watson Studio 中导入大小超过 1 GB 的项目失败

如果在 Watson Studio 中创建空项目,然后尝试导入大小超过 1 GB 的项目,那么该操作可能会失败,具体取决于 Cloud Pak for Data 集群的大小和计算能力。

在 Watson Studio 中导出大型项目时因超时而失败

如果您尝试导出包含大量资源(例如超过 7000 个)的项目,导出过程可能会超时并失败。 在这种情况下,虽然您可以分批导出资源,但建议使用 CPDCTL 命令行界面进行导出。

无法导出 Tuning Studio 实验或提示会话

如果您在某个项目中运行 Tuning Studio 实验,则无法导出这些实验或提示符会话。 导出项目时,它们不会出现在候选列表中。

将项目导出到桌面时无法包含 Cognos 仪表板

目前,在将项目导出到桌面时,无法选择 Cognos 仪表板。

变通方法

虽然您无法将仪表板添加到项目导出中,但可以将仪表板从一个项目移动到另一个项目。

要将仪表板移动到另一个项目中:

  1. 从原始项目中下载仪表盘的 JSON 文件。 将仪表板下载到桌面
  2. 点击项目工具栏中的 “导出到桌面 alt="" ”图标,将原始项目导出到桌面。
  3. 通过导入包含所需数据源的项目 ZIP 文件来创建一个新项目。
  4. 点击 “从文件 ”选项卡,并添加从原始项目下载的 JSON 文件,以创建一个新的仪表板。 从文件创建仪表板
  5. 将弹出一个对话框,询问您是否要重新链接每个数据源。 点击“重新链接”按钮,并在新项目中选择与该数据源对应的资源。

无法在 Git 存储库中使用那些需要 JDBC 驱动程序且在另一个集群上的项目中创建的连接

如果您的项目关联了一个 Git 存储库,且该存储库曾用于另一个集群中的项目,并且包含需要 JDBC 驱动程序的连接,那么这些连接在您的项目中将无法正常工作。 如果您上传了所需的 JDBC JAR文件,将会看到一条错误提示,指出无法初始化 JDBC 驱动程序。

此错误是由作为预签名 URI 添加到连接中的 JDBC JAR 文件引起的。 此 URI 在其他集群中的项目中无效。 即使该 JAR 文件确实存在于集群中,也无法再找到它,连接将无法建立。

变通方法

要使用这些连接中的任何一个,您需要在项目中创建新的连接。 以下连接需要 JDBC 驱动程序,且会受到此错误情况的影响:

  • Db2 for i
  • Db2 for z/OS
  • 通用 JDBC
  • Hive 来源: Execution Engine for Apache Hadoop
  • Impala 来源: Execution Engine for Apache Hadoop
  • SAP HANA
  • Exasol

最多显示 10000 个项目

适用范围:5.3.0

出于性能考虑,列表 All active projects 中显示的项目数量上限为 10000 个。

笔记本电脑的限制

无法在 Spark 环境中的 JupyterLab 中打开终端窗口

适用范围:5.3.0

在 Spark 环境中使用 ` JupyterLab ` 时,所有终端选项均会被禁用。

在使用来自 watsonx.data 的 Spark 环境的笔记本中,自动代码插入功能已被禁用

适用范围:5.3.0

当您使用来自 watsonx.data 的 Spark 环境的 Jupyter Notebook 时 ,“代码片段 ”图标将被禁用。 您仍然可以手动插入代码。

可视化功能的限制

无法在可视化中使用从 4.8 或更早版本导入的数据资产中的匿名化数据

适用版本:5.3.0 及更高版本

如果您将版本为 4.8 或更早版本的、包含屏蔽数据的数据资产导入项目,则无法使用这些资产创建可视化内容。

如果您尝试在数据资产的“可视化”选项卡中,基于包含屏蔽数据的导入资产生成图表,将会收到以下错误信息: Bad Request: Failed to retrieve data from server. Masked data is not supported.

解决方法: 要在可视化中使用导入的数据资产对数据进行正确屏蔽,您必须将 Data Virtualization 配置为平台的保护解决方案。 有关详细信息,请参阅 “数据源定义的保护方案 ”主题中“将 Data Virtualization 用作保护方案”一节。