深度學習實驗指導教學:使用 MNIST 資料集建置 TensorFlow 模型以辨識自行撰寫的數字 (Watson Machine Learning)

本指導教學引導您使用 NIST 電腦視覺資料集來訓練深度學習 TensorFlow 模型以辨識自行撰寫的數字。 在本指導教學中,您將使用實驗建置器訓練、部署及檢定模型。

必備項目

Watson Machine Learning Accelerator 的使用者存取權,且與 Watson Studio 所用的「使用者 ID」相同。 Watson Machine Learning Accelerator 是執行實驗的必需元件。

步驟概觀

本指導教學會呈現在 Watson Studio 中使用實驗建置器訓練深度學習模型的基本步驟:

  1. 設定資料檔
  2. 下載範例程式碼
  3. 訓練模型
  4. 監視訓練進度和結果
  5. 部署訓練模型
  6. 測試已部署模型

本指導教學不會示範分散式深度學習,也不會使用 Watson Machine Learning 超參數優化功能。

步驟 1:設定資料檔

使用 Watson Machine Learning 訓練深度學習模型依賴存取在本端儲存庫中儲存的訓練檔案,該儲存庫是系統管理者為執行實驗所需的外掛程式 Watson Machine Learning Accelerator 而設定的。

  1. 建立新專案,或開啟現有專案。
  2. 從這裡將 MNIST 範例資料檔案下載至本端電腦: MNIST sample files <alt="external link"></alt="external>
    附註: 部分瀏覽器會自動解壓縮範例資料檔案,這會在本指導教學稍後導致錯誤。 遵循 MNIST 下載頁面上的指示,來驗證您的瀏覽器如何處理檔案。
  3. 將資料檔複製或移動至 Watson Machine Learning Accelerator 安裝所在的資料夾。

步驟 2:下載範例程式碼

從這裡下載範例 TensorFlow 模型建置 Python 程式碼:tf_model_with_metrics_2_1.zip外部鏈結 (external link)

tf-model.zip 包含三個檔案:

步驟 3:訓練模型

本指導教學示範在 Watson Studio 中使用實驗建置器來訓練模型。

  1. 開啟專案。
  2. 按一下 新建資產 ,然後選擇 深度學習實驗
  3. 指定實驗的名稱和選用說明。
  4. 指定相對於 Watson Machine Learning Accelerator 裝載點的訓練資料儲存路徑。 比方說,如果您將檔案儲存至 wmla-nfs/wmla-data/mnist-tutorial,且您知道 Watson Machine Learning Accelerator 會安裝至 wmla-nfs,請輸入 /wmla-data/mnist-tutorial 作為資料的路徑。
  5. 按一下 新增模型定義 ,以建立您將用來執行實驗的模型定義。

    1. Click the New tab.
    2. Give the model definition a name.
    3. Upload the sample code, tf_model_with_metrics_2_1.zip, where prompted.
    4. Specify the framework that is used in the model-building code: tensorflow_2.1-py3.7 or higher.
    5. In the Execution command box, specify this command for running the model-building code:
      convolutional_network.py --trainImagesFile train-images-idx3-ubyte.gz --trainLabelsFile train-labels-idx1-ubyte.gz --testImagesFile t10k-images-idx3-ubyte.gz --testLabelsFile t10k-labels-idx1-ubyte.gz --learningRate 0.001 --trainingIters 3000
      
  6. 選取 "1 x NVIDIA Tesla V100(1GPU)" 作為運算方案。

  7. 按一下建立

步驟 4:監視訓練進度和結果

步驟 5:部署訓練模型

您僅在部署模型之後才能使用訓練模型分類新影像。

  1. 在實驗建置器的「訓練執行」標籤中,從動作功能表中選取儲存模型。 為模型提供名稱,然後按一下儲存。 這會將模型儲存在 Watson Machine Learning 儲存庫中,並將它儲存至專案。
  2. 在專案的「資產」標籤中,您現在可以看到已儲存的模型。 若要部署模型,您必須先將它調升至部署空間。 從模型的動作功能表中選擇調升
  3. 在升級模型之後,系統會顯示您導覽至「部署空間」。
  4. 在導覽至部署空間之後,按一下模型名稱。
  5. 按一下部署
  6. 選擇線上,然後輸入部署的名稱。

步驟 6:測試已部署模型

您可以從部署詳細資料頁面快速測試已部署模型。

  1. 在本端電腦上,下載此範例有效負載 JSON 檔,其中的輸入資料對應於自行撰寫的數字 "5" 及 "4" :MNIST_sample_payload_V4.json 外部鏈結 (external link)

  2. 在 Watson Studio 中部署詳細資料頁面的測試區域中,貼上 tf-mnist-test-payload.json 中 payload 欄位的值。 然後按一下預測

    範例輸出:

    {
      "values": [
        7,
        4
      ]
    }
    
    此輸出顯示:第一個輸入資料已正確地分類為屬於類別 "7",而第二個輸入資料則正確地分類為屬於類別 "4"。

上層主題: 深度學習實驗建置器