将 R 代码从 RStudio 脚本迁移到 Jupyter 笔记本

若要将代码从 RStudio 脚本迁移到Jupyter笔记本,请先创建一个使用受支持的R运行时环境的新Jupyter笔记本,然后在其运行时环境中安装任何额外的R包。 最后,将文件从 RStudio 迁移到新的 Jupyter 笔记本中,并运行代码。

准备工作

迁移前,请检查您的 R 脚本,以确定:

  • 依赖项 :列出所有必需的包
  • 数据源 :文件路径、数据库连接、API
  • 环境变量 :配置设置
  • 自定义函数 :用户定义的函数
  • 输出格式 :图表、表格、文件

要将代码从 RStudio 脚本迁移到Jupyter笔记本:

  1. 启动 RStudio 集成开发环境(IDE),并将您的R代码、自定义函数以及任何所需的数据文件导出到本地计算机。 请参阅 “从 RStudio 下载文件”

  2. 打开您的 watsonx.ai Studio项目,然后创建一个使用受支持的R运行时之一的新Jupyter笔记本。 请参阅 “创建和管理笔记本 ”以及 “默认 CPU 运行时模板 ”。

  3. 在笔记本的运行时环境中安装任何其他必需的 R 包。

    示例:

    # Core data manipulation packages
    install.packages(c(
    "tidyverse",    # Data manipulation and visualization
    "dplyr",        # Data manipulation
    "readr",        # Reading data
    "tidyr",        # Data tidying
    "lubridate"     # Date/time handling
    ))
    
    # Visualization packages
    install.packages(c(
    "plotly",       # Interactive plots
    "ggplot2",      # Plotting
    "ggraph",       # Network graphs
    "DT",           # Interactive tables
    "htmlwidgets"   # HTML widgets
    ))
    
    
    # Spark integration (if needed)
    install.packages(c(
    "sparklyr",     # Spark interface
    "arrow"         # Apache Arrow
    ))
    
    # Python integration
    install.packages(c(
    "reticulate",   # Python integration
    "keras",        # Deep learning
    "tensorflow"    # TensorFlow
    ))
    
  4. 将从 RStudio 导出的数据资产添加到项目中。 请参阅 “向项目中添加数据 ”。

  5. 将项目中的数据资产加载到笔记本中。 请参阅 “通过代码片段加载数据 ”。

  6. 将从 RStudio 导出的 R 代码添加到 Jupyter 笔记本中的单元格中,然后运行该笔记本。

代码转换示例

示例 1:基础数据分析

以下示例演示了如何将销售数据文件加载到 Jupyter 笔记本中,对其进行分析以生成月度销售摘要,并通过图表可视化结果。

单元格 1:加载 R 库

library(dplyr)
library(ggplot2)

单元格 2:加载数据

使用 “插入代码 ”工具生成代码片段,将数据加载到笔记本中。

单元格 3:根据数据集计算月度汇总统计量

monthly_sales <- sales %>%
  group_by(month) %>%
  summarise(
    total_sales = sum(amount),
    avg_sales = mean(amount),
    count = n()
  ) %>%
  arrange(month)
print(monthly_sales)

单元格 4:可视化数据

# Visualization
options(repr.plot.width = 12, repr.plot.height = 6)
ggplot(monthly_sales, aes(x = month, y = total_sales)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  geom_text(aes(label = scales::comma(total_sales)),
            vjust = -0.5, size = 3) +
  theme_minimal() +
  labs(title = "Monthly Sales Performance",
       x = "Month",
       y = "Total Sales ($)") +
  scale_y_continuous(labels = scales::comma)

示例 2:使用 ibm-watson-studio-lib 库将数据保存为项目资源

如需参考,请查看 R 语言的 ibm-watson-studio-lib 包

单元 1:为 ibm-watson-studio-lib 添加项目访问令牌

有关详细信息,请参阅 “手动添加项目访问令牌 ”。

单元格 2:检查当前项目及其资源

wslib$here$get_name()
wslib$show(wslib$list_stored_data())

单元格 3:将 CSV 文件保存为项目资源

wslib$save_data("testasset.csv", charToRaw("1,2,3"), overwrite=TRUE)
wslib$show(wslib$list_stored_data())

单元格 4:从 CSV 文件中获取数据

my_file <- wslib$load_data("testasset.csv")

单元格 5:将 CSV 数据文件读入数据框

df <-  read.csv(text = rawToChar(my_file))
head(df)