RStudio

R 是熱門的統計分析和機器學習套件,可啟用資料管理並包括測試、模型、分析和圖形。 RStudio (包含在 IBM Watson Studio中) 提供用於使用 R Script 的整合開發環境。

存取 RStudio

RStudio 已整合到 IBM Watson Studio 專案中,並且可以在您建立專案之後啟動。 藉由將 RStudio 整合在專案中,您可以在 RStudio 中存取及使用您專案相關聯之 IBM Cloud Object Storage 儲存區中儲存的資料檔。

若要在專案中啟動 RStudio,請採取下列動作:

  1. 從專案動作列上的 啟動 IDE 功能表中按一下 RStudio

  2. 選取環境。

  3. 按一下啟動

    即會起始環境執行時期,並開啟開發環境。

有時,當您啟動 RStudio 階段作業時,可能會遇到前一個階段作業的毀損 RStudio 狀態,且您的階段作業將不會啟動。 如果發生此情況,請選取在您選取 RStudio 環境時重設工作區,然後再次啟動 RStudio IDE。 透過重設工作區, RStudio 會使用全新 RStudio 工作區的預設值來啟動。

使用資料檔

在 RStudio 中,您可以使用不同來源的資料檔:

  • RStudio 伺服器檔案結構中的檔案,您可以透過按一下 RStudio 右下角的檔案進行檢視。 您可以在這裡建立資料夾、從本端系統上傳檔案,以及刪除檔案。

    若要在 R 中存取這些檔案,您需要將工作目錄設定為具有這些檔案的目錄。 您可以導覽至含有檔案的目錄,然後按一下 其他> 設為工作目錄來執行此動作。

    請注意,儲存在 RStudio 實例的 Home 目錄中的檔案僅在實例內持續保存,無法在環境之間或專案內共用。

    視訊免責聲明: 此頁面上視訊中的部分次要步驟和圖形元素可能與您的部署不同。

    觀看此視訊,以瞭解如何將資料載入至 RStudio。

    此視訊提供視覺化方法,以瞭解本文件中的概念及作業。

  • 儲存在與專案相關聯的 IBM Cloud Object Storage 儲存區中的專案資料資產。 啟動 RStudio 時, IBM Cloud Object Storage 儲存區內容會裝載至 RStudio Home 目錄中的 project-objectstorage 目錄。

    如果想要資料檔案顯示在 project-objectstorage 目錄中,必須將它們作為資產新增至專案。 請參閱將檔案新增為專案資產

    如果在您處於 RStudio 中時將新資料資產新增至專案,並且您想要存取這些資產,則需要重新整理 project-objectstorage 資料夾。

    瞭解如何針對 Cloud Object Storage 讀寫資料

  • 儲存在資料庫系統中的資料

    觀看此視訊,以瞭解如何在 RStudio 中連接至外部資料來源。

    此視訊提供視覺化方法,以瞭解本文件中的概念及作業。

  • 儲存在本端儲存體中的檔案 ,已裝載至 /home/rstudiohome 目錄的儲存體限制為 2 GB ,用來儲存 RStudio 階段作業工作區。 請注意,不論您是否在每一個專案中使用 RStudio ,都會在所有專案中為 home 目錄儲存體配置 2 GB。 因此,您應該只將 R Script 檔和小型資料檔儲存在 home 目錄中。 它不適用於大型資料檔或大型產生的輸出。 所有大型資料檔案都應該上傳為專案資產,這些檔案會裝載至您可以從中存取它們的 project-objectstorage 目錄。

將檔案新增為專案資產

如果您使用資料檔並想要其顯示在 project-objectstorage 目錄中,則必須將它們作為資料資產新增至專案。 若要將這些檔案作為資料資產新增至專案,請採取下列動作:

  1. 在專案的「資產」頁面上,按一下 上傳資產至專案 圖示 (顯示「將資產上傳至專案」圖示) ,然後選取 檔案 標籤。
  2. 選取您要作為資產新增至專案的檔案。
  3. 從「動作」清單中,選取新增為資料資產,並套用您的變更。

容量使用情況及執行時期範圍

RStudio 環境執行時期一律以環境範本和 RStudio 階段作業使用者為範圍。 每個 Watson Studio 使用者一次只能有一個 RStudio 階段作業處於作用中狀態。 如果您在另一個專案中啟動 RStudio ,則系統會詢問您是否要停止該階段作業,並在您正在使用之現行專案的環境定義中啟動新的 RStudio 階段作業。

執行時期用量是由作用中環境執行時期所耗用的容量單位小時數 (CUH) 計算得出。 專案中的作用中 RStudio 執行時期所耗用的 CUH 會計費至專案建立者的帳戶。 請參閱RStudio 的每小時容量單位計費

您可以在專案的 環境 頁面上查看哪些 RStudio 環境執行時期處於作用中。 您可以從此頁面停止執行時期。

記住: 在執行時期處於作用中狀態時, CUH 計數器會繼續增加,因此如果您未使用 RStudio ,請停止執行時期。 如果您未明確停止執行時期,它會在閒置時間 2 小時之後停止。 在此閒置時間內,您將繼續耗用付費 CUH。 長時間執行的計算密集型工作會在 24 小時後被強迫停止。

觀看此視訊,以查看 RStudio IDE 的概觀。

視訊免責聲明: 此視訊中的部分次要步驟和圖形元素可能與您的平台不同。

此視訊提供視覺化方法,以瞭解本文件中的概念及作業。

  • 影片文稿
    時間 記錄
    00:00 此視訊是 Watson Studio 專案內 RStudio 整合開發環境的快速導覽。
    00:07 從任何專案中,您都可以啟動 RStudio IDE。
    00:12 RStudio 是 R 的一個自由和開放原始碼的整合開發環境,它是一種用於統計計算和圖形的程式語言。
    00:22 在 RStudio 中,有四個窗格: 來源窗格、主控台窗格、環境窗格及檔案窗格。
    00:32 這些窗格可協助您組織工作,並區隔您將使用 R 執行的不同作業。
    00:39 您可以拖曳以調整窗格大小,或使用圖示將窗格縮至最小並放至最大。
    00:47 您也可以在廣域選項中重新排列窗格。
    00:53 主控台窗格是 R 的介面。
    00:56 這正是您在終端機視窗或與 R 組合的使用者介面中所看到的。
    01:01 主控台窗格確實有一些您會發現有用的新增特性。
    01:06 若要從主控台執行程式碼,只要鍵入指令即可。
    01:11 開始鍵入指令,以查看以您開始鍵入的字母開頭的指令清單。
    01:17 強調顯示清單中的指令,然後按 "Enter" 鍵插入它。
    01:24 使用向上箭頭來捲動您先前輸入的指令。
    01:31 當您發出更多指令時,您可以捲動瀏覽結果。
    01:36 使用功能表選項來清除主控台。
    01:39 您也可以使用 Tab 鍵完成來查看以該文字開頭的函數、物件及資料集的清單。
    01:47 然後使用箭頭來強調顯示指令,以查看該指令的說明。
    01:51 當您準備好時,只要按 "Enter" 鍵即可插入它。
    01:55 接下來,您會在現行環境定義中看到該指令的選項清單。
    01:59 例如, read.csv 函數的第一個引數是檔案。
    02:05 RStudio 會顯示工作目錄中的資料夾和檔案清單,因此您可以輕鬆找到要與引數一起併入的檔案。
    02:16 最後,如果您使用標籤完成搭配預期套件名稱的函數 (例如程式庫) ,則會看到所有已安裝套件的清單。
    02:28 接下來,讓我們查看來源窗格,它只是一個文字編輯器,可讓您撰寫 R 程式碼。
    02:34 文字編輯器支援 R 指令檔和純文字,以及數種其他語言,並在環境定義中包含特定語言的強調顯示。
    02:47 您會注意到標籤完成也可在文字編輯器中使用。
    02:53 從文字編輯器中,您可以執行單行程式碼,或選取數行程式碼來執行,您會在主控台窗格中看到結果。
    03:08 您可以將程式碼儲存為 R Script ,以在稍後共用或重新執行。
    03:15 視圖函數會開啟新的標籤,以試算表格式顯示資料框。
    03:22 或者您可以在它自己的視窗中顯示它。
    03:25 現在,您可以捲動資料、排序直欄、搜尋特定值,或使用滑塊及下拉功能表來過濾列。
    03:41 環境窗格包含「環境」標籤、「歷程」標籤及「連線」標籤,並追蹤此 R 階段作業中發生的情況。
    03:51 「環境」標籤包含在階段作業期間建立的廣域環境中存在的 R 物件。
    03:58 因此,當您在主控台窗格中建立新物件時,它會自動顯示在環境窗格中。
    04:04 您也可以檢視與特定套件相關的物件,甚至可以查看特定函數的原始碼。
    04:12 您也可以查看資料集清單,展開資料集以檢查其個別元素,並在來源窗格中檢視它們。
    04:22 您可以將環境的內容儲存為 .RData 檔案,以便稍後可以載入該 .RData 檔案。
    04:29 您也可以從這裡清除工作區中的物件。
    04:33 如果您要刪除特定項目,請使用網格視圖。
    04:38 例如,您可以輕鬆找到要刪除的大型項目,以釋放 R 階段作業中的記憶體。
    04:45 「環境」標籤也可讓您匯入資料集。
    04:50 在完成匯入之前,您可以查看資料集及變更選項的預覽。
    04:55 匯入的資料會顯示在來源窗格中。
    05:00 「歷程」標籤顯示您在指令行執行的每一個指令的歷程。
    05:05 就像「環境」標籤一樣,您可以將歷程儲存為 .Rhistory 檔案,以便稍後可以開啟它。
    05:11 此標籤具有相同的選項,可清除歷程中的所有歷程及個別項目。
    05:17 選取指令並將它傳送至主控台,以重新執行指令。
    05:23 您也可以將指令複製到來源窗格,以將它包含在 Script 中。
    05:31 在「連線」標籤上,您可以建立與資料來源的新連線。
    05:36 這個對話框中的選項取決於您已安裝哪些套件。
    05:41 例如, "BLUDB" 連線可讓您連接至 Db2 Warehouse on Cloud 服務。
    05:49 檔案窗格包含「檔案」、「圖形」、「套件」、「說明」及「檢視器」標籤。
    05:55 「檔案」標籤會顯示工作目錄的內容。
    05:59 RStudio 將從此目錄載入檔案,並將檔案儲存至此目錄。
    06:04 導覽至檔案並按一下檔案,以在來源窗格中檢視該檔案。
    06:09 從這裡,您可以建立新資料夾並上傳檔案,方法是選取要上傳的個別檔案,或選取包含所有要上傳的檔案的 .zip 檔案。
    06:25 從這裡,您也可以刪除及重新命名檔案和資料夾。
    06:30 若要存取 R 中的檔案,您需要將資料資料夾設為工作目錄。
    06:36 您會看到已在主控台中執行 setwd 指令。
    06:43 您可以開啟專案資料夾來存取專案中的資料資產。
    06:50 「圖形」標籤會顯示 R 圖形函數的結果,例如 :plot、hist、ggplot 及 xyplot
    07:00 您可以使用箭頭或縮放來導覽不同的圖形,以查看圖形全螢幕。
    07:09 您也可以從這裡刪除個別圖形或所有圖形。
    07:13 使用「匯出」選項,以指定解析度將圖形儲存為圖形或列印檔案。
    07:21 「套件」標籤會顯示您目前已安裝在系統檔案庫中的套件。
    07:26 搜尋列可讓您快速尋找特定的套件。
    07:30 已檢查的套件是已在現行階段作業中使用媒體庫指令載入的套件。
    07:38 您可以從這裡檢查其他套件以載入它們,或取消勾選套件以從現行階段作業分離它們。
    07:45 主控台窗格會顯示結果。
    07:48 請使用套件名稱旁的 "X" ,將它從系統檔案庫中移除。
    07:54 您也可以尋找新套件,以安裝或更新至任何套件的最新版本。
    08:03 按一下任何套件會開啟「說明」標籤,其中包含該套件的其他資訊。
    08:09 從這裡,您可以搜尋功能以取得更多說明。
    08:13 從主控台,您可以使用 help 指令,或只鍵入問號,後面接著函數,以取得該函數的說明。
    08:21 「檢視器」標籤會顯示 HTML 輸出。
    08:25 部分 R 函數會產生 HTML 以顯示報告及互動式圖形。
    08:31 R Markdown 套件會建立您可以在「檢視器」標籤中檢視的報告。
    08:38 Shiny 套件會建立您可以在「檢視器」標籤中檢視的 Web 應用程式。
    08:44 其他套件則建置在 htmlwidgets 架構上,並包含 Java 型互動式視覺化。
    08:54 您也可以將視覺化發佈至免費網站,稱為 "RPubs.com"。
    09:01 這是 RStudio IDE 的簡要概觀。
    09:05 在 Cloud Pak for Data as a Service 文件中尋找更多關於 RStudio 的視訊。

進一步瞭解

上層主題: 記事本和 Script