IBM Cloud Pak® for Data 4.7 版本将于 2025 年 7 月 31 日结束支持(EOS)。 欲了解更多信息,请参阅 IBM Cloud Pak for Data 版本 4.X 的停止服务公告。
在 IBM Cloud Pak for Data 4.7 版本支持结束之前,升级到 IBM Software Hub 5.1 版本。 更多信息,请参阅 IBM Software Hub 版本 5.1 文档中的升级 IBM Software Hub。
笔记本和脚本 (Watson Studio)
您可以在代码编辑器(如笔记本编辑器或集成开发环境(IDE),如 RStudio )中使用 Jupyter 笔记本和脚本创建、编辑和执行 Python 和 R 代码。
- Notebook
- Jupyter Notebook 是基于 Web 的交互式计算环境。 您可以使用 Notebook 来运行用于处理数据的小代码片段,并且可以立即查看计算结果。 笔记本包含处理数据所需的所有构建块,即数据,处理数据的代码计算,结果的可视化以及文本和富媒体,以增强理解。
- 脚本
- 脚本是包含一组命令和注释的文件。 可以保存该脚本,稍后将其用于重新执行已保存的命令。 与笔记本不同,脚本中的命令只能以线性方式执行。
Notebook
- 必需服务
- Watson Studio
服务 缺省情况下, Watson Studio 服务不可用。 管理员必须在 IBM Cloud Pak for Data 平台上安装该服务。 要确定是否已安装此服务,请打开“服务目录”并检查是否已启用此服务。
- 所需许可权
- 项目中的 编辑者 或 管理员 角色
- 工具
- 笔记本编辑器
- JupyterLab
- Visual Studio Code
- 编程语言
- 笔记本编辑器: Python 和 R
- JupyterLab: Python
- Visual Studio Code: Python
- 数据格式
- 全部类型
- 代码支持可用于从以下对象的项目资产装入和访问数据:
- 数据资产,例如 CSV , JSON 和 .xlsx 和 .xls 文件
- 数据库连接和已连接的数据资产
请参阅 数据装入支持 以了解受支持的文件和数据库类型。
- 数据大小
- 5 GB。 对于更大的文件,必须分多个部分装入数据。
脚本
- 必需的服务
- Watson Studio
- RStudio 使用 R 的服务器 或 使用 R 的服务器 4.2 RStudio 3.6
服务 缺省情况下,这些服务不可用。 管理员必须在 IBM Cloud Pak for Data 平台上安装服务。 要确定是否已安装这些服务,请打开 "服务" 目录并检查是否已启用这些服务。
- 所需许可权
- 项目中的 编辑者 或 管理员 角色
- 工具
- JupyterLab
- Visual Studio Code
- RStudio
- 编程语言
- JupyterLab: Python
- Visual Studio Code: Python
- RStudio: R
- 数据格式
- 全部类型
- 代码支持可用于从以下对象的项目资产装入和访问数据:
- 数据资产,例如 CSV , JSON 和 .xlsx 和 .xls 文件
- 数据库连接和已连接的数据资产
请参阅 数据装入支持 以了解受支持的文件和数据库类型。
- 数据大小
- 5 GB。 对于更大的文件,必须分多个部分装入数据。
在 Notebook 编辑器中工作
笔记本编辑器主要用于交互式,探索性的数据分析编程和数据可视化。 一次只能有一个人编辑笔记本。 所有其他用户只能在锁定时以视图方式访问已打开的 Notebook。
您可以使用随 Notebook 运行时环境一起提供的预安装开放式源代码库,添加您自己的库,并从免费提供的 IBM 库中获益。
当 Notebook 就绪时,您可以创建作业以直接从 Notebook 编辑器运行 Notebook。 作业配置可以使用在 Notebook 运行时传递到具有不同值的 Notebook 的环境变量。
在 RStudio
RStudio 是一个集成开发环境,用于处理 R 脚本或 Shiny 应用程序。 尽管 RStudio IDE 无法在 Spark with R 环境运行时中启动,但您可以编程方式访问 Spark 内核,以在 R 脚本和 Shiny 应用程序中使用 Spark。
要增强协作和支持文件共享,您应该在具有 Git 集成的项目中工作。
在 JupyterLab 中工作
JupyterLab 提供了类似 IDE 的开发接口,其中包括 Notebook。 该界面的模块化结构可扩展并向开发者开放,支持在同一窗口的选项卡中处理多个打开的 Notebook 或文件。
要在 JupyterLab 中工作,必须将项目与 Git 存储库相关联,并选择使用 JupyterLab IDE 来编辑 Notebook。 与 GIT 的集成支持协作和文件共享。
在 Visual Studio Code 中工作
Visual Studio Code 的 Watson Studio 扩展允许您直接从 VS Code 编辑器连接到 Cloud Pak for Data 集群。 您可以直接从 VS Code 启动和停止运行时,通过 SSH 安全地连接到 Cloud Pak for Data 集群上的运行时,并通过 SSH 编辑基于 Watson Studio Git的项目中的文件。
要使用 Visual Studio Code的 Watson Studio 扩展,必须将项目与 Git 存储库相关联。 与 GIT 的集成支持协作和文件共享。
了解更多
父主题: 分析数据和构建模型