快速入門:在 Jupyter Notebook 中分析資料

您可以建立在其中執行程式碼的 Notebook,以準備、視覺化及分析資料,或建置及訓練模型。 閱讀 Jupyter Notebook 的相關資訊,然後觀看視訊並採取適用於具備 Python 程式碼部分知識的使用者的指導教學。

您的基本工作流程包括下列作業:

  1. 開啟沙盤推演專案。 專案是您可以與其他人協同作業以使用資料的地方。
  2. 將資料新增至專案。 您可以透過連線,從遠端資料來源新增 CSV 檔或資料。
  3. 在專案中建立 Notebook。
  4. 將程式碼新增至 Notebook,以載入及分析資料。
  5. 執行 Notebook,並與同事共用結果。

閱讀 Notebook 說明

Jupyter Notebook 是一個可用於互動式計算的 Web 型環境。 您可以執行小部分程式碼來處理資料,也可以立即檢視計算結果。 Notebook 中包含您處理資料所需的所有建置區塊:

  • 資料
  • 用於處理資料的程式碼計算
  • 結果的視覺化
  • 用於加強瞭解的文字及複合式多媒體

進一步瞭解 Notebook

觀看關於 Notebook 的視訊

觀賞影片 觀看此視訊以瞭解 Jupyter Notebook 的基本觀念。

此視訊提供視覺化方法,以瞭解本文件中的概念及作業。

嘗試用於建立 Notebook 的指導教學

在本指導教學中,您將完成下列作業:

完成本指導教學大約需要 15 分鐘。



  • 使用影片照片中的圖片

    提示: 開始視訊,然後當您捲動指導教學時,視訊會移至畫中畫模式。 關閉視訊目錄,以取得圖片中的最佳體驗。 您可以使用 picture-in-picture 模式,以便在完成本指導教學中的作業時可以遵循視訊。 按一下要遵循之每一項作業的時間戳記。

    下列動畫影像顯示如何使用視訊圖片中的 picture-picture 及目錄功能:

    如何使用畫中畫和章節

    在社群中取得協助

    如果您需要本指導教學的協助,可以在 Cloud Pak for Data 社群討論區中提出問題或尋找答案。

    設定瀏覽器視窗

    為了取得完成本指導教學的最佳體驗,請在一個瀏覽器視窗中開啟 Cloud Pak for Data ,並在另一個瀏覽器視窗中保持開啟本指導教學頁面,以輕鬆在兩個應用程式之間切換。 請考量並列排列兩個瀏覽器視窗,以便更容易遵循。

    並列指導教學和使用者介面

    提示: 如果您在使用者介面中完成本指導教學時遇到引導式導覽,請按一下 稍後可能

    回到頂端


  • 您需要專案來儲存 Notebook 和資料資產。 您可以使用沙盤推演專案或建立專案。 請遵循下列步驟來開啟專案,並將資料資產新增至專案:

    1. 從導覽功能表 「導覽」功能表中,選擇 專案> 檢視所有專案

    2. 開啟沙盤推演專案。 如果您要使用新專案:

      1. 按一下新建專案

      2. 選取建立空的專案

      3. 輸入專案的名稱和選用說明。

      4. 選擇現有的 Object Storage 服務實例或者建立新的服務實例。

      5. 按一下建立

    3. 從導覽功能表中,按一下 範例

    4. 搜尋相關資料集,並選取資料集。

    5. 按一下新增至專案

    6. 從清單中選取專案,然後按一下新增

    7. 新增資料集之後,按一下檢視專案

    8. 在專案中,按一下 資產 標籤以查看資料集。

    如需相關資訊,請參閱 建立專案

    檢查點圖示 檢查您的進度

    下列影像顯示專案中的「資產」標籤。

    下列影像顯示專案中的「資產」標籤。


    回到頂端


  • 預覽指導教學影片 若要預覽此作業,請從 00:06開始觀看影片。

    請遵循下列步驟,在專案中建立新的 Notebook。

    1. 在專案中的 資產 標籤上,按一下 新建作業> 在 Python 或 R Notebook 中使用資料和模型

    2. 輸入名稱和說明 (選用)。

    3. 選取此 Notebook 的執行時期環境。

    4. 按一下建立。 等待 Notebook 編輯器載入。

    檢查點圖示 檢查您的進度

    下列影像顯示空白 Notebook。

    下列影像顯示空白 Notebook。


    回到頂端


  • 預覽指導教學影片 若要預覽此作業,請從 00:23開始觀看影片。

    現在,您可以在 Notebook 中存取先前上傳至專案的資料資產。 請遵循下列步驟,將資料載入至資料框架:

    1. 按一下 Notebook 中的空程式碼單元。

    2. 按一下 程式碼 Snippet 圖示 (程式碼 Snippet 圖示)。

    3. 在側邊窗格中,按一下 讀取資料

    4. 按一下 從專案選取資料

    5. 從專案中尋找資料資產,然後按一下 選取

    6. 載入為 下拉清單中,選取您偏好的載入選項。

    7. 按一下 將程式碼插入儲存格。 用於讀取並載入資料資產的程式碼會插入儲存格中。

    8. 按一下執行以執行程式碼。 即會顯示資料集的前幾列。

    9. 若要儲存 Notebook 的版本,請按一下 檔案> 儲存版本。 您也可以只使用 檔案> 儲存來儲存 Notebook。

    檢查點圖示 檢查您的進度

    下列影像顯示含有 pandas DataFrame的 Notebook。

    下列影像顯示具有 pandas DataFrame的記事本。


    回到頂端


  • 預覽指導教學影片 若要預覽此作業,請從 01:19開始觀看影片。

    請遵循下列步驟,在「資產」標籤上尋找已儲存的記事本,並編輯記事本:

    1. 在專案導覽追蹤中,按一下您的專案名稱以回到您的專案。

    2. 按一下 資產 標籤,以尋找記事本。

    3. 當您按一下 Notebook 時,它會以 READ ONLY 模式開啟。

    4. 若要編輯記事本,請按一下 鉛筆 圖示 鉛筆圖示

    5. 按一下 資訊 圖示 資訊圖示 ,以開啟 資訊 畫面。

    6. 一般標籤上,編輯 Notebook 的名稱及說明。

    7. 按一下 環境 標籤,以查看您可以如何變更用來執行 Notebook 的環境,或將執行時期狀態更新為停止並重新啟動。

    檢查點圖示 檢查您的進度

    下列影像顯示記事本,並顯示「資訊」畫面。

    下列影像顯示記事本,並顯示「資訊」畫面。


    回到頂端


  • 預覽指導教學影片 若要預覽此作業,請從 01:52開始觀看影片。

    請遵循下列步驟來建立 Notebook 的鏈結,以與同事共用:

    1. 如果您想要共用 Notebook 的唯讀視圖,請按一下 共用 圖示 共用圖示

    2. 按一下以開啟與具有鏈結的任何人共用切換按鈕。

    3. 選取您想要透過鏈結或社交媒體共用的內容。

    4. 按一下 複製 圖示 複製圖示 ,以複製此記事本的直接鏈結。

    5. 按一下關閉

    檢查點圖示 檢查您的進度

    下列影像顯示「共用」對話框。

    下列影像顯示「共用」對話框。


    回到頂端


  • 預覽指導教學影片 若要預覽此作業,請從 02:08開始觀看影片。

    請遵循下列步驟來建立工作,以將 Notebook 排定在特定時間執行或根據排程重複:

    1. 按一下 工作 圖示,然後選取 建立工作
      建立工作

    2. 提供工作的名稱及說明,然後按下一步

    3. 選取 Notebook 版本及環境執行時期,然後按下一步

    4. (選用)按一下切換按鈕,以排定執行。 指定日期、時間以及您是否希望重複工作,然後按下一步

    5. (選用) 按一下切換按鈕以接收此工作的通知,然後按 下一步

    6. 檢閱詳細資料,然後按一下建立(以建立工作,但不立即執行工作)或建立並執行(以立即執行工作)。

    7. 該工作將顯示在專案的工作標籤中。

    檢查點圖示 檢查您的進度

    下列影像顯示「工作」標籤。

    下列影像顯示「工作」標籤。


    回到頂端

後續的步驟

現在,您可以使用此資料集進行進一步分析。 例如,您或其他使用者可以執行下列任何作業:

其他資源

  • 檢視更多視訊

  • 在「範例」中尋找範例資料集、專案、模型、提示及記事本,以獲得上機體驗:

    記事本圖示 記事本 ,您可以將其新增至專案,以開始分析資料及建置模型。

    專案圖示 專案 ,您可以匯入包含 Notebook、資料集、提示及其他資產的專案。

    您可以新增至專案以精簡、分析及建置模型的 資料集圖示 資料集

    提示圖示 提示 ,您可以在「提示實驗室」中用來提示基礎模型。

    您可以在「提示實驗室」中使用的 模型圖示 基礎模型

上層主題: 快速入門指導教學