IBM Cloud Pak® for Data 4.8 版本将于 2025 年 7 月 31 日结束支持(EOS)。 欲了解更多信息,请参阅 IBM Cloud Pak for Data 版本 4.X 的停止服务公告。
在 版本支持结束之前,升级到 版本。 IBM Cloud Pak for Data 4.8 IBM Software Hub 5.1 有关更多信息,请参阅从 IBM Cloud Pak for Data 版本 4.8 升级到 IBM Software Hub 版本 5.1。
Notebook 环境 (Watson Studio)
在项目中的 Notebook 编辑器中运行 Notebook 时,请选择环境模板,该模板定义运行时环境的计算资源。 环境模板指定硬件配置以及软件配置的类型,大小和功能。 对于 Notebook ,环境定义包含受支持的 Python 或 R 语言。
有关更多信息,请参阅:
包含的环境模板
Watson Studio随附了以下 Python 环境。 包含的环境在项目的 管理 选项卡上的 " 环境 " 页面上的 模板 下列出。
| 名称 | 硬件配置 | 描述 |
|---|---|---|
Runtime 23.1 on Python 3.10 |
1 个 vCPU 和 2 GB RAM | |
Runtime 22.2 on Python 3.10 |
1 个 vCPU 和 2 GB RAM |
如果安装了带有 R4.2 服务的运行时 22.2 ,那么将列出以下缺省 R 环境。
| 名称 | 硬件配置 |
|---|---|
Runtime 23.1 on R 4.2 |
1 个 vCPU 和 2 GB RAM |
Runtime 22.2 on R 4.2 |
1 个 vCPU 和 2 GB RAM |
任何基于 R 的 Notebook 环境都不符合 FIPS 标准。
有关 FIPS 的更多信息,请参阅 支持 FIPS 的服务。
Notebook 和 CPU 环境
在 CPU 运行时环境中以编辑方式打开 Notebook 时,对于您选择的 Notebook 语言和环境运行时,只有一个交互式会话连接到 Jupyter 内核。 该运行时是按用户而非按 Notebook 启动。 这意味着,如果在同一项目中打开具有相同环境模板的第二个 Notebook ,那么将在同一运行时中启动第二个内核。 它们共享运行时资源。 有关更多信息,请参阅 运行时作用域。
如有必要,您可以重新启动或重新连接内核。 重新启动内核时,内核将停止,然后再次在同一会话中启动,但所有执行结果将丢失。 在连接中断后重新连接到内核时,该 Notebook 会连接到同一内核会话,所有已保存的先前执行结果都可用。
Notebook 的其他环境选项
您可以创建 Notebook 环境模板并定制软件配置。 请参阅 创建环境模板。
如果您是在 JupyterLab IDE 中编码 Python Notebook 或脚本,那么可以使用 JupyterLab 环境。 请参阅 JupyterLab 环境模板。
如果已安装 Execution Engine for Apache Hadoop ,那么可以创建 Hadoop 环境模板以在 Hadoop 集群上运行 Notebook。 请参阅 Hadoop 环境。
如果安装了 Analytics Engine powered by Apache Spark 服务,则可以从默认的 Spark 环境模板中选择多种硬件配置,用于 Python 和 R。请参见 Spark 环境。
如果安装了带有 GPU 服务的 Jupyter Notebooks with Python ,那么可以创建环境模板以在 GPU 集群上运行 Notebook。 请参阅 GPU 环境。
Jupyter Notebook 环境中的文件系统
您必须注意装入到 Notebook 中的数据文件的大小。 非常大的文件可能需要比在其上启动运行时的节点上可用的存储器 (磁盘空间) 更多。
请注意,每个运行时的文件系统都是非持久的,无法在环境之间共享。
注:
- 请勿混淆存储空间和环境的内存大小。 选择更大的环境会给你更多的内存和 CPU ,但不会更多的存储空间。
- 可用存储空间量取决于分配给运行 Cloud Pak for Data 的 OpenShift 集群中节点的存储量。 要增加该限制,您需要更改为具有更多存储空间的另一个 OpenShift 集群。 无法从 Watson Studio中增加存储空间。
- 如果数据文件的大小很大,请考虑切换到使用 Spark 或 Hadoop 来处理这些文件。 通过 Spark 或 Hadoop,处理工作负载分布在多个节点上。
- 当环境停止时,仅会破坏分配给 Notebook 的临时空间。 停止环境时,不会破坏您在 Notebook 中引用的持久文件系统。
运行时作用域
环境运行时的作用域始终限定为环境模板和项目中的用户。
例如,如果将每个 Notebook 与其自己的环境相关联,那么每个 Notebook 都会有自己的运行时。 但是,如果您在为另一个 Notebook 选择的环境中打开 Notebook ,并且该 Notebook 具有活动运行时,那么这两个 Notebook 内核将在同一运行时中处于活动状态。 在此情况下,这两个 Notebook 将使用它们所共享的运行时中可用的计算和数据资源。
如果要避免共享运行时,但要对项目中的多个 Notebook 使用相同的运行时配置,那么可以创建具有相同规范的定制环境模板。 请参阅 创建环境模板。
后续步骤
父主题: 环境