将 R 代码从 RStudio 脚本迁移到 Jupyter 笔记本
若要将代码从 RStudio 脚本迁移到Jupyter笔记本,请先创建一个使用受支持的R运行时环境的新Jupyter笔记本,然后在其运行时环境中安装任何额外的R包。 最后,将文件从 RStudio 迁移到新的 Jupyter 笔记本中,并运行代码。
准备工作:
迁移前,请检查您的 R 脚本,以确定:
- 依赖项 :列出所有必需的包
- 数据源 :文件路径、数据库连接、API
- 环境变量 :配置设置
- 自定义函数 :用户定义的函数
- 输出格式 :图表、表格、文件
要将代码从 RStudio 脚本迁移到Jupyter笔记本:
启动 RStudio 集成开发环境(IDE),并将您的R代码、自定义函数以及任何所需的数据文件导出到本地计算机。 请参阅 “从 RStudio 下载文件”
打开您的 watsonx.ai Studio项目,然后创建一个使用受支持的R运行时之一的新Jupyter笔记本。 请参阅 “创建和管理笔记本 ”以及 “默认 CPU 运行时模板 ”。
在笔记本的运行时环境中安装任何其他必需的 R 包。
示例:
# Core data manipulation packages install.packages(c( "tidyverse", # Data manipulation and visualization "dplyr", # Data manipulation "readr", # Reading data "tidyr", # Data tidying "lubridate" # Date/time handling )) # Visualization packages install.packages(c( "plotly", # Interactive plots "ggplot2", # Plotting "ggraph", # Network graphs "DT", # Interactive tables "htmlwidgets" # HTML widgets )) # Spark integration (if needed) install.packages(c( "sparklyr", # Spark interface "arrow" # Apache Arrow )) # Python integration install.packages(c( "reticulate", # Python integration "keras", # Deep learning "tensorflow" # TensorFlow ))将从 RStudio 导出的数据资产添加到项目中。 请参阅 “向项目中添加数据 ”。
将项目中的数据资产加载到笔记本中。 请参阅 “通过代码片段加载数据 ”。
将从 RStudio 导出的 R 代码添加到 Jupyter 笔记本中的单元格中,然后运行该笔记本。
代码转换示例
示例 1:基础数据分析
以下示例演示了如何将销售数据文件加载到 Jupyter 笔记本中,对其进行分析以生成月度销售摘要,并通过图表可视化结果。
单元格 1:加载 R 库
library(dplyr)
library(ggplot2)
单元格 2:加载数据
使用 “插入代码 ”工具生成代码片段,将数据加载到笔记本中。
单元格 3:根据数据集计算月度汇总统计量
monthly_sales <- sales %>%
group_by(month) %>%
summarise(
total_sales = sum(amount),
avg_sales = mean(amount),
count = n()
) %>%
arrange(month)
print(monthly_sales)
单元格 4:可视化数据
# Visualization
options(repr.plot.width = 12, repr.plot.height = 6)
ggplot(monthly_sales, aes(x = month, y = total_sales)) +
geom_bar(stat = "identity", fill = "steelblue") +
geom_text(aes(label = scales::comma(total_sales)),
vjust = -0.5, size = 3) +
theme_minimal() +
labs(title = "Monthly Sales Performance",
x = "Month",
y = "Total Sales ($)") +
scale_y_continuous(labels = scales::comma)
示例 2:使用 ibm-watson-studio-lib 库将数据保存为项目资源
如需参考,请查看 R 语言的 ibm-watson-studio-lib 包。
单元 1:为 ibm-watson-studio-lib 添加项目访问令牌
有关详细信息,请参阅 “手动添加项目访问令牌 ”。
单元格 2:检查当前项目及其资源
wslib$here$get_name()
wslib$show(wslib$list_stored_data())
单元格 3:将 CSV 文件保存为项目资源
wslib$save_data("testasset.csv", charToRaw("1,2,3"), overwrite=TRUE)
wslib$show(wslib$list_stored_data())
单元格 4:从 CSV 文件中获取数据
my_file <- wslib$load_data("testasset.csv")
单元格 5:将 CSV 数据文件读入数据框
df <- read.csv(text = rawToChar(my_file))
head(df)