笔记本和脚本 (Watson Studio)

您可以使用Jupyter笔记本和代码编辑器中的脚本(例如笔记本编辑器或集成开发环境(IDE),如 RStudio )创建、编辑和执行 Python 和R代码。

Notebook
Jupyter Notebook 是基于 Web 的交互式计算环境。 您可以使用 Notebook 来运行用于处理数据的小代码片段,并且可以立即查看计算结果。 笔记本包含处理数据所需的所有构建块,即数据,处理数据的代码计算,结果的可视化以及文本和富媒体,以增强理解。
脚本
脚本是包含一组命令和注释的文件。 可以保存该脚本,稍后将其用于重新执行已保存的命令。 与笔记本不同,脚本中的命令只能以线性方式执行。

Notebook

所需服务
Watson Studio

服务 缺省情况下, Watson Studio 服务不可用。 管理员必须在 IBM Cloud Pak for Data 平台上安装此服务。 要确定该服务是否已安装,请打开服务目录并检查该服务是否已启用。

所需权限
项目中的 编辑者管理员 角色
工具
笔记本编辑器
JupyterLab
Visual Studio Code
编程语言
笔记本编辑器: Python 和 R
JupyterLab: Python
Visual Studio Code: Python
数据格式
所有类型
代码支持可用于从以下对象的项目资产装入和访问数据:
数据资产,例如 CSV , JSON 和 .xlsx 和 .xls 文件
数据库连接和已连接的数据资产

请参阅 数据装入支持 以了解受支持的文件和数据库类型。

数据大小
5 GB。 如果文件较大,那么必须分多个部分加载数据。

脚本

所需的服务
Watson Studio
RStudio 带R的服务器 4.2

服务 缺省情况下,这些服务不可用。 管理员必须在 IBM Cloud Pak for Data 平台上安装服务。 要确定是否已安装这些服务,请打开 "服务" 目录并检查是否已启用这些服务。

所需权限
项目中的 编辑者管理员 角色
工具
JupyterLab
Visual Studio Code
RStudio
编程语言
JupyterLab: Python
Visual Studio Code: Python
RStudio: R
数据格式
所有类型
代码支持可用于从以下对象的项目资产装入和访问数据:
数据资产,例如 CSV , JSON 和 .xlsx 和 .xls 文件
数据库连接和已连接的数据资产

请参阅 数据装入支持 以了解受支持的文件和数据库类型。

数据大小
5 GB。 如果文件较大,那么必须分多个部分加载数据。

在笔记本编辑器中工作

笔记本编辑器主要用于交互式,探索性的数据分析编程和数据可视化。 一次只能有一个人编辑笔记本。 所有其他用户只能在锁定时以视图方式访问已打开的 Notebook。

您可以使用以下类型的库:

  • 随 Notebook 运行时环境一起提供的预安装开放式源代码库
  • 随 Notebook 运行时环境一起提供的免费 IBM 库
  • 您自己的库

当 Notebook 就绪时,您可以创建作业以直接从 Notebook 编辑器运行 Notebook。 作业配置可以使用在 Notebook 运行时传递到具有不同值的 Notebook 的环境变量。

工作于 RStudio

RStudio 是一个用于处理R脚本或Shiny应用程序的集成开发环境。 尽管 RStudio 集成开发环境无法在Spark with R环境运行时启动,但您仍可通过编程方式访问Spark内核,在R脚本和Shiny应用程序中使用Spark功能。

要增强协作和支持文件共享,请考虑设置具有 Git 集成的项目。

在 JupyterLab 工作

JupyterLab 提供了类似 IDE 的开发接口,其中包括 Notebook。 该界面的模块化结构具有可扩展性且对开发者开放,支持在同一窗口的标签页中同时处理多个开放笔记本或文件。

要在 JupyterLab, 中工作,您必须将项目关联到 Git 仓库,并选择使用 JuypterLab 集成开发环境编辑笔记本。 与 GIT 的集成支持协作和文件共享。

在 Visual Studio Code 中工作

Visual Studio Code 的 Watson Studio 扩展允许您直接从 VS Code 编辑器连接到 Cloud Pak for Data 集群。 您可以直接从 VS Code 启动和停止运行时,通过 SSH 安全地连接到 Cloud Pak for Data 集群上的运行时,并通过 SSH 编辑基于 Watson Studio Git的项目中的文件。

要使用 Visual Studio Code的 Watson Studio 扩展,必须将项目与 Git 存储库相关联。 与 GIT 的集成支持协作和文件共享。

了解更多

父主题: 分析数据和构建模型