笔记本和脚本

您可以在代码编辑器(如笔记本编辑器)或集成开发环境(如 RStudio )中使用 Jupyter 笔记本和脚本创建、编辑和执行 Python 和 R 代码。

Notebook
Jupyter Notebook 是基于 Web 的交互式计算环境。 您可以使用 Notebook 来运行用于处理数据的小代码片段,并且可以立即查看计算结果。 笔记本包括处理数据所需的所有构件,即数据、处理数据的代码计算、结果的可视化,以及用于加深理解的文本和富媒体。
脚本
脚本是一个包含一系列命令和注释的文件。 可以保存该脚本,稍后将其用于重新执行已保存的命令。 与笔记本不同,脚本中的命令只能以线性方式执行。

Notebook

所需服务
Watson Studio

服务该服务默认不可用。 必须由管理员安装该服务。 要确定服务是否已安装,请打开服务目录。 如果服务已安装并准备就绪,目录中的磁贴将显示 "Ready to use

必需许可权
项目中的 编辑者管理员 角色
工具
笔记本编辑器
JupyterLab
Visual Studio Code
编程语言
笔记本编辑器: Python 和 R
JupyterLab: Python
Visual Studio Code: Python
数据格式
所有类型
代码支持可用于从以下对象的项目资产装入和访问数据:
数据资产,例如 CSV , JSON 和 .xlsx 和 .xls 文件
数据库连接和已连接的数据资产

请参阅 数据装入支持 以了解受支持的文件和数据库类型。

数据大小
5 GB。 如果文件较大,那么必须分多个部分加载数据。

脚本

所需的服务
Watson Studio
RStudio Server Runtimes

服务 缺省情况下,这些服务不可用。 必须由管理员安装服务。 要确定服务是否已安装,请打开服务目录。 如果服务已安装并准备就绪,目录中的磁贴将显示 "Ready to use

必需许可权
项目中的 编辑者管理员 角色
工具
JupyterLab
Visual Studio Code
RStudio
编程语言
JupyterLab: Python
Visual Studio Code: Python
RStudio: R
数据格式
所有类型
代码支持可用于从以下对象的项目资产装入和访问数据:
数据资产,例如 CSV , JSON 和 .xlsx 和 .xls 文件
数据库连接和已连接的数据资产

请参阅 数据装入支持 以了解受支持的文件和数据库类型。

数据大小
5 GB。 如果文件较大,那么必须分多个部分加载数据。

在笔记本编辑器中工作

笔记本编辑器主要用于交互式,探索性的数据分析编程和数据可视化。 一次只能有一个人编辑笔记本。 所有其他用户只能在锁定时以视图方式访问已打开的 Notebook。

您可以使用这些类型的图书馆:

  • 笔记本运行环境中预装的开放源代码库
  • IBM免费提供的笔记本运行环境库
  • 您自己的图书馆

当 Notebook 就绪时,您可以创建作业以直接从 Notebook 编辑器运行 Notebook。 作业配置可以使用在 Notebook 运行时传递到具有不同值的 Notebook 的环境变量。

在 RStudio

RStudio 是一个集成开发环境,用于处理 R 脚本或 Shiny 应用程序。 虽然 RStudio IDE 无法在 Spark with R 环境运行时启动,但你可以通过编程访问 Spark 内核,在 R 脚本和 Shiny 应用程序中使用 Spark。

为加强协作并支持文件共享,可考虑建立一个与Git集成的项目。

在 JupyterLab 中工作

JupyterLab 提供了类似 IDE 的开发接口,其中包括 Notebook。 该接口的模块化结构可扩展且对开发人员开放,允许在同一窗口中的选项卡中使用多个打开的笔记本或文件。

要在JupyterLab,中工作,必须将项目与Git仓库关联,并选择使用JuypterLabIDE 编辑笔记本。 与 GIT 的集成支持协作和文件共享。

在 Visual Studio Code 中工作

Visual Studio Code 的 Watson Studio 扩展允许您直接从 VS 代码编辑器连接到 watsonx 实例。 您可以直接从 VS Code 启动和停止运行时,通过 SSH 安全地连接到watsonx实例上的运行时,并通过 SSH 编辑Watson Studio Git 项目中的文件。

要使用 Visual Studio Code的 Watson Studio 扩展,必须将项目与 Git 存储库相关联。 与 GIT 的集成支持协作和文件共享。

了解更多

母主题: 分析数据和建立模型