RStudio

R 是一种流行的统计分析和机器学习软件包,可用于数据管理,包括测试、模型、分析和图形。RStudio 包含在 IBM watsonx.ai Studio 中,为使用 R 脚本提供了一个集成开发环境。

使用信息和限制

  • RStudio 仅适用于 watsonx 部署的 IBM Cloud。 watsonx AWS 上的部署不能使用。 RStudio
  • RStudio 已集成到 IBM watsonx.ai Studio 项目中。 您可以在创建项目后启动它。
  • 您可以访问和使用存储在与项目相关联的 IBM Cloud Object Storage 存储桶中的数据文件。
  • 您可以使用 RStudio IDE 创建 Shiny 应用程序,但不能在 IBM watsonx 中部署它们。

启动 RStudio 集成开发环境

在项目中启动 RStudio IDE:

  1. 从项目操作栏上的 " 启动 IDE "菜单中单击 RStudio

  2. 选择环境。

  3. 单击启动

    这会启动环境运行时,开发环境随即打开。

    如果在启动 RStudio 时遇到问题,请参阅故障排除与启动 RStudio 有关的问题

启动 RStudio IDE 时的故障排除问题

启动 RStudio 时可能会遇到以下问题:

前一个会话中损坏的 RStudio 状态

问题:
有时,当您启动 RStudio 会话时,可能会遇到前一个会话的 RStudio 状态已损坏的情况,导致会话无法启动。
解决方案: 启动
RStudio IDE 后,在选择 RStudio 环境的阶段,选择重置工作区。 启动 RStudio 时使用的是默认设置和干净的 RStudio 工作区。

处理数据文件

在 RStudio 中,您可以处理来自不同源的数据文件:

  • RStudio 服务器文件结构中的文件,可以通过单击 RStudio 右下方的文件来进行查看。 您可以在其中创建文件夹,从本地系统上载文件以及删除文件。

    要以 R 形式访问这些文件,需要将工作目录设置为包含这些文件的目录。 您可以通过使用文件浏览到目录并单击 更多> 设置为工作目录来执行此操作。

    请注意,存储在 RStudio 实例的 Home 目录中的文件仅在实例中持久存储,无法在环境中和项目中共享。

    视频免责声明: 此页面上的视频中的一些次要步骤和图形元素可能与您的部署不同。

    观看此视频以了解如何将数据加载到 RStudio。

    此视频提供了一种可视方法来学习本文档中的概念和任务。

  • 存储在与项目关联的 IBM Cloud Object Storage 存储区中的项目数据资产。 启动 RStudio 后,IBM Cloud Object Storage 存储区内容将安装到 RStudio Home 目录中的 project-objectstorage 目录。

    如果希望数据文件显示在 project-objectstorage 目录中,那么必须将其作为资产添加到项目。 请参阅将文件添加为项目资产

    如果在您处于 RStudio 中时将新数据资产添加到项目,并且您要访问这些数据资产,那么需要刷新 project-objectstorage 文件夹。

    请参阅如何在 Cloud Object Storage 中读取和写入数据

  • 存储在数据库系统中的数据

    观看此视频以了解如何在 RStudio 中连接到外部数据源。

    此视频提供了一种可视方法来学习本文档中的概念和任务。

  • 安装到 /home/rstudio存储在本地存储器中的文件home 目录的存储限制为 2 GB,用于存储 RStudio 会话工作区。 请注意,无论您是否在每个项目中使用 RStudio ,都会为所有项目分配 2 GB 的 home 目录存储空间。 因此,您只应该将 R 脚本文件和小数据文件存储在 home 目录中。 它不适用于大型数据文件或大型生成的输出。 应将所有大型数据文件作为项目资产上载,这些资产将安装到 project-objectstorage 目录中,您可以从该目录访问这些数据文件。

将文件添加为项目资产

如果希望数据文件出现在 project-objectstorage 目录中,必须将它们作为数据资产添加到项目中。 要将这些文件作为数据资产添加到项目中,请执行以下操作:

  1. 在项目的 "资产 "页面,单击 " 上传资产到项目 "图标 "将资产上载到项目" 图标 ,然后选择 " 文件 "选项卡。
  2. 选择要作为资产添加到项目中的文件。
  3. 从“操作”列表中,选择添加为数据资产并应用更改。

容量使用情况和运行时作用域

RStudio 环境运行时的作用域总是环境模板和 RStudio 会话用户。 每个 watsonx.ai Studio 用户一次只能激活一个 RStudio 会话。 如果您在另一个项目中启动了 RStudio ,系统会询问您是否要停止该会话,并在当前项目的上下文中启动一个新的 RStudio 会话。

运行时使用情况根据活动环境运行时使用的容量单位小时数 (CUH) 进行计算。 项目中的活动 RStudio 运行时使用的 CUH 会计入项目创建者的帐户。 请参阅 RStudio 的每小时容量单位计费

您可以在项目的 "环 "页面上查看哪些 RStudio 环境运行时处于活动状态。 您可以从此页面停止运行时。

切记: 当运行时处于激活状态时,CUH 计数器会继续增加,因此如果您不使用 RStudio ,请停止运行时。 如果您没有明确停止运行时间,则运行时间会在闲置 2 小时后自动停止。 在此空闲时间内,您将继续使用您所付费的 CUH。 长时间计算密集型作业会在 24 小时后硬停止。

观看此视频以领会对 RStudio IDE 的概述。

视频免责声明: 此视频中的一些次要步骤和图形元素可能与您的平台不同。

此视频提供了一种可视方法来学习本文档中的概念和任务。

  • 视频脚本
    时间 脚本
    00:00 这段视频将快速介绍一个项目中的 RStudio 集成开发环境。
    00:07 您可以从任何项目启动 RStudio IDE。
    00:12 RStudio 是用于统计计算和图形的编程语言 R 的免费开源集成开发环境。
    00:22 RStudio 有四个窗格:源窗格、控制台窗格、环境窗格和文件窗格。
    00:32 这些窗格可帮助您组织工作,并将使用 R 执行的不同任务分开。
    00:39 您可以拖动以调整窗格大小,也可以使用图标将窗格最小化和最大化。
    00:47 您还可以在全局选项中重新排列窗格。
    00:53 控制台窗格是 R 的接口。
    00:56 这正是您在与 R 捆绑在一起的终端窗口或用户界面中看到的内容。
    01:01 控制台窗格中确实有一些添加的功能,您会发现这些功能很有用。
    01:06 要从控制台运行代码,只需输入命令。
    01:11 开始输入命令以查看以您开始输入的字母开头的命令列表。
    01:17 突出显示列表中的命令,然后按 "Enter" 以插入该命令。
    01:24 使用向上箭头来滚动浏览先前输入的命令。
    01:31 当您发出更多命令时,可以滚动浏览结果。
    01:36 使用菜单选项来清除控制台。
    01:39 您还可以使用制表符补全来查看以该文本开头的函数,对象和数据集的列表。
    01:47 然后使用箭头突出显示命令以查看该命令的帮助。
    01:51 准备好后,只需按 "Enter" 键即可插入。
    01:55 接下来,您将在当前上下文中看到该命令的选项列表。
    01:59 例如, read.csv 函数的第一个自变量是文件。
    02:05 RStudio 将显示工作目录中的文件夹和文件列表,以便您轻松找到要包含在参数中的文件。
    02:16 最后,如果使用带有期望包名 (例如库) 的函数的选项卡完成,那么您将看到所有已安装的包的列表。
    02:28 接下来,我们来看一下源窗格,它只是一个文本编辑器,供您编写 R 代码。
    02:34 文本编辑器支持 R 命令文件和纯文本以及其他几种语言,并在上下文中包含特定于语言的突出显示。
    02:47 您会注意到在文本编辑器中也提供了选项卡完成。
    02:53 从文本编辑器中,您可以运行单行代码,或者选择要运行的几行代码,您将在控制台窗格中看到结果。
    03:08 您可以将代码保存为 R 脚本,以便稍后共享或再次运行。
    03:15 视图函数将打开一个新选项卡,该选项卡以电子表格格式显示数据帧。
    03:22 或者可以在它自己的窗口中显示它。
    03:25 现在,您可以滚动数据,对列进行排序,搜索特定值或使用滑块和下拉菜单对行进行过滤。
    03:41 环境窗格包含 "环境" 选项卡, "历史记录" 选项卡和 "连接" 选项卡,并跟踪此 R 会话中发生的情况。
    03:51 "环境" 选项卡包含在会话期间创建的全局环境中存在的 R 对象。
    03:58 因此,当您在控制台窗格中创建新对象时,它会自动显示在环境窗格中。
    04:04 您还可以查看与特定包相关的对象,甚至可以查看特定函数的源代码。
    04:12 您还可以查看数据集列表,展开数据集以检查其各个元素,并在源窗格中查看这些元素。
    04:22 您可以将环境内容保存为 .RData 文件,以便稍后可以装入该 .RData 文件。
    04:29 从此处,您还可以清除工作空间中的对象。
    04:33 如果要删除特定项,请使用网格视图。
    04:38 例如,您可以轻松找到要删除的大项以释放 R 会话中的内存。
    04:45 "环境" 选项卡还允许您导入数据集。
    04:50 您可以在完成导入之前查看数据集和更改选项的预览。
    04:55 导入的数据将显示在源窗格中。
    05:00 "历史记录" 选项卡显示在命令行上运行的每个命令的历史记录。
    05:05 就像 "环境" 选项卡一样,您可以将历史记录另存为 .Rhistory 文件,以便稍后可以将其打开。
    05:11 此选项卡具有相同的选项,用于清除历史记录中的所有历史记录和个别条目。
    05:17 选择命令并将其发送到控制台以重新运行该命令。
    05:23 您还可以将命令复制到源窗格以将其包含在脚本中。
    05:31 在 "连接" 选项卡上,可以创建与数据源的新连接。
    05:36 此对话框中的选项取决于您已安装的软件包。
    05:41 例如, "BLUDB" 连接允许您连接到 Db2 Warehouse on Cloud 服务。
    05:49 "文件" 窗格包含 "文件" , "图" , "包" , "帮助" 和 "查看器" 选项卡。
    05:55 "文件" 选项卡显示工作目录的内容。
    05:59 RStudio 将从该目录加载文件并将文件保存到该目录。
    06:04 浏览至文件,然后单击该文件以在源窗格中查看该文件。
    06:09 从此处,您可以通过选择要上载的单个文件或选择包含要上载的所有文件的 .zip 文件来创建新文件夹和上载文件。
    06:25 从此处,您还可以删除和重命名文件和文件夹。
    06:30 为了访问 R 中的文件,需要将数据文件夹设置为工作目录。
    06:36 您将看到 setwd 命令已在控制台中执行。
    06:43 您可以通过打开项目文件夹来访问项目中的数据资产。
    06:50 "图" 选项卡显示 R 的图函数的结果,例如: 图, hist , ggplot 和 xyplot
    07:00 您可以使用箭头或缩放来浏览不同图以查看图形全屏。
    07:09 您还可以从此处删除个别图或所有图。
    07:13 使用 "导出" 选项将图另存为指定分辨率的图形或打印文件。
    07:21 "软件包" 选项卡显示您当前已安装在系统库中的软件包。
    07:26 搜索栏让您快速找到特定数据包。
    07:30 选中的程序包是在当前会话中已使用库命令装入的程序包。
    07:38 您可以从此处检查其他软件包以将其装入,或者取消检查软件包以将其从当前会话中拆离。
    07:45 控制台窗格将显示结果。
    07:48 使用软件包名称旁边的 "X" 将其从系统库中除去。
    07:54 您还可以找到新软件包以安装或更新到任何软件包的最新版本。
    08:03 单击任何软件包将打开 "帮助" 选项卡,其中包含该软件包的其他信息。
    08:09 从这里,您可以搜索函数以获取更多帮助。
    08:13 在控制台中,您可以使用 help 命令,或者只需输入后跟该函数的问号,即可获取有关该函数的帮助。
    08:21 "查看器" 选项卡显示 HTML 输出。
    08:25 某些 R 函数生成 HTML 以显示报告和交互式图形。
    08:31 R Markdown 数据包创建可在 "查看器" 选项卡中查看的报表。
    08:38 Shiny 包将创建可以在 "查看器" 选项卡中查看的 Web 应用程序。
    08:44 其他包基于 htmlwidget 框架构建,包含基于 Java 的交互式可视化。
    08:54 您还可以将可视化发布到名为 "RPubs.com" 的免费站点。
    09:01 以上是 RStudio 集成开发环境的简要概述。
    09:05 在 Cloud Pak for Data as a Service 文档中查找更多关于 RStudio 的视频。