IBM Cloud Pak® for Data 4.6 版本将于 2025 年 7 月 31 日结束支持(EOS)。 欲了解更多信息,请参阅 IBM Cloud Pak for Data 版本 4.X 的停止服务公告。
在 IBM Cloud Pak for Data 4.6 版本支持结束之前,升级到 IBM Software Hub 5.1 版本。 更多信息,请参阅 IBM Software Hub 版本 5.1 文档中的升级 IBM Software Hub。
创建环境模板 (Watson Studio)
如果您不希望使用 Watson Studio提供的缺省值,那么可以创建定制环境模板。
要创建环境模板,您必须在项目中具有 管理员 或 编辑者 角色。
您可以在 Watson Studio 中创建环境模板以运行以下资产:
- Notebook 编辑器中的 Notebook
- JupyterLab 中的 Notebook
- RStudio 中的 Notebook
- 在模型构建器中创建的模型
- 流编辑器中的模型流
- Data Refinery 流
- 运行操作资产(例如,项目中的 Data Refinery 流程、SPSS Modeler 流程或 Notebook)的作业
要创建环境模板:
在项目的 管理 选项卡上,选择 " 环境 " 页面,然后单击 模板下的 新建模板 。
输入名称和描述。
选择类型。 该类型指定的是运行时引擎类型。
- 缺省:对于 Python 或 R、RStudio 或 JupyterLab 运行时,请选择此值。
- Spark:对于使用 Python、R 或 Scala 运行时的 Spark,选择此值。
- GPU:选择此值以获取更多计算能力来提高模型训练性能。
- 远程系统:选择此值可实现下列目标:
- 运行 Data Refinery 作业,以优化存储在 HDFS 中、存储在 Hive 仓库内的表中或者存储在 Hadoop 集群上 Impala 的表中的数据
- 在 Hadoop 或 Spectrum Conductor(仅限 JEG)之类的远程系统上运行作业或 Jupyter Enterprise Gateway (JEG) 会话。
对于缺省或 GPU,请选择硬件配置和软件版本。
指定要保留的 CPU , GPU 和 RAM 的大小。
该环境将在提供有所需资源的计算节点上启动,而且,只要该环境在运行中,这些资源就会保留给它使用。 您应该注意根据计划的工作负载指定足够的资源,尤其是指定足够的内存。 这在您运行 Notebook 时很重要。 缺省值为 2 GB RAM。
虽然指定资源量可以提供更可预测的体验,但很难预测合理的限制是什么,这可能会导致所有资源都由活动环境保留但未被积极使用的情况。
指定软件版本,例如 Python, R, RStudio 或 JupyterLab 与 Python。
对于 Spark,请选择驱动程序和执行程序大小、执行程序数目以及软件版本。
- 驱动程序硬件配置。 驱动程序会创建 SparkContext,后者会在 Spark 集群中分布作业的执行。 选择自:
- 1 个 vCPU 和 4 GB RAM
- 2 个 vCPU 和 8 GB RAM
- 执行程序硬件配置。 执行程序是一个进程,它负责运行给定 Spark 作业中的任务。 选择自:
- 1 个 vCPU 和 4 GB RAM
- 2 个 vCPU 和 8 GB RAM
- 执行程序数目。 从 1 选择到 50 个执行程序。
- 软件版本,例如 Spark 和 Python 版本。
- 驱动程序硬件配置。 驱动程序会创建 SparkContext,后者会在 Spark 集群中分布作业的执行。 选择自:
对于 远程系统,请选择 Hadoop 或系统配置。
新环境模板将列示在项目的 环境 页面上的 "环境模板" 下。 在此页面中,您可以更新环境模板并查看哪些运行时处于活动状态。您还可以从此处停止运行时。
限制
Notebook 环境 (Anaconda Python 或 R 分发版):
- 无法将软件定制添加到 Watson Studio中包含的 Python 和 R 环境模板。 只能将定制添加到您创建的环境模板。
- 要使用 GPU 环境创建 Python ,必须安装 Jupyter Notebooks with Python for GPU 服务。
- 如果使用 conda 或 mamba 添加软件定制,那么您的环境必须至少具有 2 GB RAM。
- 在 Watson Studio 环境中启动 Notebook 后,无法从该 Notebook 中创建其他 conda 环境并使用该 Notebook。 Watson Studio 环境的行为有别于 conda 环境管理器。
JupyterLab 环境:
- 如果要将软件定制添加到 JupyterLab 中的环境模板,并且要在作业中使用同一环境,那么必须创建定制环境模板并仅选择 Python 版本作为软件版本。 请勿选择具有 Python 版本的 JupyterLab 作为软件版本,因为在创建作业时, JuypterLab 环境模板不可选择。
Spark 环境:
- 无法定制 Spark 环境模板的软件配置。
GPU 环境:
- 您可以随时处于活动状态的 GPU 运行时数不能超过集群中的 GPU 单元数。
后续步骤
了解更多
父主题: 环境