重要说明:

IBM Cloud Pak® for Data 4.6 版本将于 2025 年 7 月 31 日结束支持(EOS)。 欲了解更多信息,请参阅 IBM Cloud Pak for Data 版本 4.X 的停止服务公告

在 IBM Cloud Pak for Data 4.6 版本支持结束之前,升级到 IBM Software Hub 5.1 版本。 更多信息,请参阅 IBM Software Hub 版本 5.1 文档中的升级 IBM Software Hub。

创建环境模板 (Watson Studio)

如果您不希望使用 Watson Studio提供的缺省值,那么可以创建定制环境模板。

要创建环境模板,您必须在项目中具有 管理员编辑者 角色。

您可以在 Watson Studio 中创建环境模板以运行以下资产:

  • Notebook 编辑器中的 Notebook
  • JupyterLab 中的 Notebook
  • RStudio 中的 Notebook
  • 在模型构建器中创建的模型
  • 流编辑器中的模型流
  • Data Refinery 流
  • 运行操作资产(例如,项目中的 Data Refinery 流程、SPSS Modeler 流程或 Notebook)的作业

要创建环境模板:

  1. 在项目的 管理 选项卡上,选择 " 环境 " 页面,然后单击 模板下的 新建模板

  2. 输入名称和描述。

  3. 选择类型。 该类型指定的是运行时引擎类型。

    • 缺省:对于 Python 或 R、RStudio 或 JupyterLab 运行时,请选择此值。
    • Spark:对于使用 Python、R 或 Scala 运行时的 Spark,选择此值。
    • GPU:选择此值以获取更多计算能力来提高模型训练性能。
    • 远程系统:选择此值可实现下列目标:
      • 运行 Data Refinery 作业,以优化存储在 HDFS 中、存储在 Hive 仓库内的表中或者存储在 Hadoop 集群上 Impala 的表中的数据
      • 在 Hadoop 或 Spectrum Conductor(仅限 JEG)之类的远程系统上运行作业或 Jupyter Enterprise Gateway (JEG) 会话。
  4. 对于缺省GPU,请选择硬件配置和软件版本。

    • 指定要保留的 CPU , GPU 和 RAM 的大小。

      该环境将在提供有所需资源的计算节点上启动,而且,只要该环境在运行中,这些资源就会保留给它使用。 您应该注意根据计划的工作负载指定足够的资源,尤其是指定足够的内存。 这在您运行 Notebook 时很重要。 缺省值为 2 GB RAM。

      虽然指定资源量可以提供更可预测的体验,但很难预测合理的限制是什么,这可能会导致所有资源都由活动环境保留但未被积极使用的情况。

    • 指定软件版本,例如 Python, R, RStudio 或 JupyterLab 与 Python。

  5. 对于 Spark,请选择驱动程序和执行程序大小、执行程序数目以及软件版本。

    • 驱动程序硬件配置。 驱动程序会创建 SparkContext,后者会在 Spark 集群中分布作业的执行。 选择自:
      • 1 个 vCPU 和 4 GB RAM
      • 2 个 vCPU 和 8 GB RAM
    • 执行程序硬件配置。 执行程序是一个进程,它负责运行给定 Spark 作业中的任务。 选择自:
      • 1 个 vCPU 和 4 GB RAM
      • 2 个 vCPU 和 8 GB RAM
    • 执行程序数目。 从 1 选择到 50 个执行程序。
    • 软件版本,例如 Spark 和 Python 版本。
  6. 对于 远程系统,请选择 Hadoop 或系统配置。

新环境模板将列示在项目的 环境 页面上的 "环境模板" 下。 在此页面中,您可以更新环境模板并查看哪些运行时处于活动状态。您还可以从此处停止运行时。

限制

Notebook 环境 (Anaconda Python 或 R 分发版):

  • 无法将软件定制添加到 Watson Studio中包含的 Python 和 R 环境模板。 只能将定制添加到您创建的环境模板。
  • 要使用 GPU 环境创建 Python ,必须安装 Jupyter Notebooks with Python for GPU 服务。
  • 如果使用 conda 或 mamba 添加软件定制,那么您的环境必须至少具有 2 GB RAM。
  • 在 Watson Studio 环境中启动 Notebook 后,无法从该 Notebook 中创建其他 conda 环境并使用该 Notebook。 Watson Studio 环境的行为有别于 conda 环境管理器。

JupyterLab 环境:

  • 如果要将软件定制添加到 JupyterLab 中的环境模板,并且要在作业中使用同一环境,那么必须创建定制环境模板并仅选择 Python 版本作为软件版本。 请勿选择具有 Python 版本的 JupyterLab 作为软件版本,因为在创建作业时, JuypterLab 环境模板不可选择。

Spark 环境:

  • 无法定制 Spark 环境模板的软件配置。

GPU 环境:

  • 您可以随时处于活动状态的 GPU 运行时数不能超过集群中的 GPU 单元数。

后续步骤

了解更多

父主题: 环境