Notebook 环境

在项目中的笔记本编辑器中运行笔记本时,您需要选择一个环境模板,该模板定义了运行时环境的计算资源。 环境模板规定了硬件配置的类型、尺寸和功率,以及软件配置。 对于笔记本,环境定义包含支持的语言为 Python R。

有关更多信息,请参阅:

注:

所有基于运行时 24.1 的环境模板现已弃用,并将从未来版本中移除。

若您使用的笔记本基于运行时环境( 24.1 ),请将其更新为最新版本的运行时环境(适用版本为运行时环境 25.1 或 GenAI 25-A)。

有关详细信息,请参阅更改笔记本环境

若您拥有基于运行时环境模板( 24.1 )且 conda使用自定义环境模板,则必须在运行时环境模板( 24.1 )被移除前完成迁移。 有关详细信息,请参阅《 将自定义环境模板从运行时 24.1 迁移至运行时 25.1 》。

包含的环境模板

以下 Python 环境包含在 Watson Studio. 中。 包含的环境在项目 “管理” 选项卡的 “环境 ”页面下 “模板 ”部分列出。

运行时类型

Python 提供两种运行时环境:

  • 运行时 :专注于传统机器学习,以稳定性为首要考量。 包含全面的机器学习框架( TensorFlow,PyTorch, XGBoost)和可视化工具包( Matplotlib、Seaborn、Bokeh)。
  • GenAI 运行时 :专注于生成式人工智能工作负载。 包含 GenAI 框架和工具(例如 LangChain )。 此运行时类型旨在用于在平台内开发和部署人工智能服务。

两种运行时类型均包含Pandas、 NumPy, 和scikit-learn等基础包,但两者之间的包版本可能存在差异。 运行时类型遵循独立的发布和弃用周期,这体现在它们不同的版本方案中(例如25-A和 25.1 )。

主要区别:

  • Watson NLP和 Decision Optimization :仅在运行时环境中可用,不适用于 GenAI 运行时环境。
  • 语言支持 : GenAI 运行时仅限于 Python。 R 编程语言仅可在运行时环境中使用。
  • GenAI 运行时的用例
    • 开发人工智能服务,使笔记本代码在与部署服务相同的环境中运行
    • 使用生成式人工智能模型执行模型推理调用
    • 使用 LangChain 及其他 GenAI 框架
注:

Z ( s390x ) 平台支持 3.11Python 运行 24.1 时环境

默认环境模板用于 Python
名称 硬件配置
Runtime 25.1 on Python 3.12 1 个 vCPU 和 2 GB RAM
GenAI 25-A on Python 3.12 1 个 vCPU 和 2 GB RAM
Runtime 24.1 on Python 3.11 1 个 vCPU 和 2 GB RAM

若您已安装 Runtime 24.1 with R4.3Runtime 25.1 on R 4.4 服务,则会列出以下默认 R 环境:

注:

基于R的笔记本编辑器运行时在以下平台无法运行:

  • IBM Power® ( ppc64le ) (除非已安装 Analytics Engine )
  • IBM Z (s390x)

表 2. R语言的默认环境模板
名称 硬件配置
Runtime 25.1 on R 4.4 1 个 vCPU 和 2 GB RAM
Runtime 24.1 on R 4.3 1 个 vCPU 和 2 GB RAM
重要说明:

所有基于R的笔记本环境均不符合FIPS标准。

有关FIPS的更多信息,请参阅支持FIPS的服务

Notebook 和 CPU 环境

在 CPU 运行时环境中以编辑方式打开 Notebook 时,对于您选择的 Notebook 语言和环境运行时,只有一个交互式会话连接到 Jupyter 内核。 该运行时是按用户而非按 Notebook 启动。 这意味着,若在同一项目中使用相同的环境模板打开第二个笔记本,则会在同一运行时环境中启动第二个内核。 它们共享运行时资源。 有关更多信息,请参阅运行时作用域

如有必要,您可以重新启动或重新连接内核。 重新启动内核时,内核将停止,然后再次在同一会话中启动,但所有执行结果将丢失。 在连接中断后重新连接到内核时,该 Notebook 会连接到同一内核会话,所有已保存的先前执行结果都可用。

Notebook 的其他环境选项

您可以创建笔记本环境模板并自定义软件配置。 参见创建环境模板

如果您是在 JupyterLab IDE 中编码 Python Notebook 或脚本,那么可以使用 JupyterLab 环境。 参见 JupyterLab 环境模板

若已安装 Execution Engine for Apache Hadoop ,您可创建 Hadoop 环境模板,在 Hadoop 集群上运行笔记本。 请参阅 Hadoop 环境

若已安装该 Jupyter Notebooks with Python with GPU 服务,您可创建环境模板,在GPU集群上运行笔记本。 请参阅 GPU 环境

若已安装该 Analytics Engine powered by Apache Spark 服务,您可从默认的 Spark 环境模板中选择,这些模板提供多种硬件配置 Python 供 R 使用。详见 Spark 环境

Jupyter Notebook 环境中的文件系统

运行时环境按用户启动,但挂载在运行时环境中的标准数据存储与其他项目成员共享。 这意味着其他项目成员可以访问您上传到笔记本环境的文件。 如果您的团队正在处理大型数据集,这或许能帮助您避免重复劳动并节省额外资源。

请务必注意上传至笔记本环境的数据文件大小。 非常大的文件可能需要比运行时启动节点上可用存储空间(磁盘空间)更大的存储空间。

请勿将存储空间与环境的内存容量混为一谈。 选择更大的环境可获得更多内存和CPU资源,但不会增加存储空间。

如果您的数据文件较大,请考虑切换到使用Spark或其他 Hadoop 工具来处理这些文件。 使用Spark或 Hadoop ,处理工作负载将分布在多个节点上。

默认文件存储限制为 100Gi 每个 Cloud Pak for Data 实例。 根据集群使用的存储类,可能可以提高此限制。 若需更多数据存储空间,请联系集群管理员。

每个运行时的文件系统都是非持久性的。 若停止运行时环境,您上传的文件将被删除。 为确保您的数据不被删除,请使用外部持久化存储。 在笔记本中引用的持久文件系统在环境停止时不会被销毁。

运行时作用域

环境运行时始终限定在项目内的环境模板和用户范围内。

例如,如果将每个 Notebook 与其自己的环境相关联,那么每个 Notebook 都会有自己的运行时。 然而,若您在已为另一笔记本选定环境的场景下打开新笔记本,且该环境中已有笔记本处于活动运行时状态,则两个笔记本内核都将处于同一运行时环境中。 在此情况下,这两个 Notebook 将使用它们所共享的运行时中可用的计算和数据资源。

若需避免共享运行时环境,同时希望在项目中为多个笔记本使用相同的运行时配置,可创建具有相同规格的自定义环境模板。 参见创建环境模板

后续步骤