Migrazione del codice R dagli script di RStudio ai notebook Jupyter

Per migrare il codice dagli script di RStudio ai notebook Jupyter, crea innanzitutto un nuovo notebook Jupyter che utilizzi uno dei runtime R supportati, quindi installa eventuali pacchetti R aggiuntivi nel relativo runtime. Infine, trasferisci i tuoi file da RStudio al tuo nuovo notebook Jupyter ed esegui il codice.

Prima di iniziare :

Prima della migrazione, controlla i tuoi script R per individuare:

  • Dipendenze : Elenca tutti i pacchetti necessari
  • Fonti dei dati : percorsi dei file, connessioni ai database, API
  • Variabili d'ambiente : Impostazioni di configurazione
  • Funzioni personalizzate : funzioni definite dall'utente
  • Formati di output : grafici, tabelle, file

Per migrare il codice dagli script di RStudio ai notebook Jupyter:

  1. Avvia l'IDE d RStudio e ed esporta il codice R, le funzioni personalizzate e tutti i file di dati necessari sul tuo computer locale. Vedi "Come scaricare un file da RStudio "

  2. Apri il tuo progetto di Studio su watsonx.ai, quindi crea un nuovo notebook Jupyter che utilizzi uno dei runtime R supportati. Vedi Creazione e gestione dei notebook e Modelli predefiniti di runtime della CPU.

  3. Installa eventuali pacchetti R aggiuntivi necessari nell'ambiente di esecuzione del notebook.

    Esempio:

    # Core data manipulation packages
    install.packages(c(
    "tidyverse",    # Data manipulation and visualization
    "dplyr",        # Data manipulation
    "readr",        # Reading data
    "tidyr",        # Data tidying
    "lubridate"     # Date/time handling
    ))
    
    # Visualization packages
    install.packages(c(
    "plotly",       # Interactive plots
    "ggplot2",      # Plotting
    "ggraph",       # Network graphs
    "DT",           # Interactive tables
    "htmlwidgets"   # HTML widgets
    ))
    
    
    # Spark integration (if needed)
    install.packages(c(
    "sparklyr",     # Spark interface
    "arrow"         # Apache Arrow
    ))
    
    # Python integration
    install.packages(c(
    "reticulate",   # Python integration
    "keras",        # Deep learning
    "tensorflow"    # TensorFlow
    ))
    
  4. Aggiungi al tuo progetto i dati che hai esportato da RStudio. Vedi la sezione "Aggiunta di dati al progetto".

  5. Carica i dati dal tuo progetto sul tuo notebook. Vedi "Caricamento dei dati tramite frammenti di codice".

  6. Inserisci il codice R che hai esportato da RStudio nelle celle del tuo notebook Jupyter, quindi esegui il notebook.

Esempi di conversione di codice

Esempio 1: Analisi di base dei dati

L'esempio seguente mostra come caricare un file contenente i dati di vendita in un notebook Jupyter, analizzarlo per generare un riepilogo mensile delle vendite e visualizzare i risultati in un grafico.

Cella 1: carica le librerie R

library(dplyr)
library(ggplot2)

Cella 2: carica dati

Utilizza lo strumento "Inserisci codice" per generare un frammento di codice che ti consenta di caricare i dati nel tuo notebook.

Cella 3: calcolare le statistiche riassuntive mensili da un set di dati

monthly_sales <- sales %>%
  group_by(month) %>%
  summarise(
    total_sales = sum(amount),
    avg_sales = mean(amount),
    count = n()
  ) %>%
  arrange(month)
print(monthly_sales)

Cella 4: visualizza i dati

# Visualization
options(repr.plot.width = 12, repr.plot.height = 6)
ggplot(monthly_sales, aes(x = month, y = total_sales)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  geom_text(aes(label = scales::comma(total_sales)),
            vjust = -0.5, size = 3) +
  theme_minimal() +
  labs(title = "Monthly Sales Performance",
       x = "Month",
       y = "Total Sales ($)") +
  scale_y_continuous(labels = scales::comma)

Esempio 2: salvare i dati come risorsa del progetto utilizzando la libreria ibm-watson-studio-lib

Per ulteriori informazioni, consultare ibm-watson-studio-lib per R.

Cella 1: Aggiungi un token di accesso al progetto per ibm-watson-studio-lib

Per ulteriori dettagli, consulta la sezione "Aggiunta manuale del token di accesso al progetto ".

Cella 2: Esaminare il progetto corrente e le sue risorse

wslib$here$get_name()
wslib$show(wslib$list_stored_data())

Cella 3: Salva un file « CSV » come risorsa del progetto

wslib$save_data("testasset.csv", charToRaw("1,2,3"), overwrite=TRUE)
wslib$show(wslib$list_stored_data())

Cella 4: Recupera i dati dal file CSV

my_file <- wslib$load_data("testasset.csv")

Cella 5: Importa il file di dati " CSV " in un data frame

df <-  read.csv(text = rawToChar(my_file))
head(df)