管理特性群組 (測試版)
建立特性群組,以保留資料資產的一組直欄,以及與 Machine Learning 模型搭配使用的相關聯 meta 資料。
- 必要的許可權
- 若要檢視此頁面,您可以在專案中具有任何角色。
- 若要在此頁面上編輯或更新資訊,您必須在專案中具有 編輯者 或 管理者 角色。
- 工作區
- 您可以在下列工作區中檢視資產特性群組:
- 專案
- 資產類型
- 這些類型的資產可以具有特性群組:
- 表狀 :CSV、TSV、Parquet、xls、xslx、avro、text、json 檔案
- Watson Studio中結構化且受支援的 已連接資料類型 。
- 資料大小
- 無限制
特性群組 (測試版)
建立 特性群組 ,以保留特定資料資產的一組直欄,以及用於 Machine Learning的 meta 資料。 例如,如果您具有信用核准模型的一組特性,則可以保留用於訓練模型的特性,以及部分 meta 資料,包括哪個直欄用作預測目標,以及哪些直欄用於偏誤偵測。 特性群組可讓您輕鬆保留用來訓練機器學習模型之特性的 meta 資料,以便其他資料科學家可以使用相同的特性。 當您預覽特定資產時,可以看到特性群組標籤。
在專案中建立特性群組
開始之前
如果您在建立特性群組之前為資料資產建立 設定檔 ,則可以選取設定檔 meta 資料以將值新增至特性。
建立特性群組
您可以選取資料資產的特定直欄來形成特性群組。
在專案 資產 標籤中,按一下相關資產的名稱以開啟預覽,然後選取 特性群組 標籤。 在這裡,您可以建立特性群組或檢視及編輯現有的特性群組。 資產只能有一個特性群組。 按一下 新增特性群組。
選取您要在特性群組中使用的直欄。 選取 名稱 勾選框,以將所有直欄併入為特性。

編輯特性群組
當您選取要在特性群組中使用之資料資產的直欄時,您可以檢視每一個特性並編輯它,以指定它在 Machine Learning 模型中的角色。
按一下特性名稱,然後按一下 編輯此特性。 即會開啟一個視窗,其中顯示下列標籤:
詳細資料 -提供特性的下列相關資訊。 選取要指派給特性的 角色 :
Input: 此特性可以用作輸入,以訓練 Machine Learning 模型。Target: 使用資料來訓練 Machine Learning 模型時要用作預測目標的特性。Identifier: 用來識別輸入資料的主要索引鍵,例如客戶 ID。
輸入 說明、 秘訣 (用來建立特性值的任何方法或公式) ,以及任何 標籤。
值說明 值說明可讓您釐清特定值的意義。 例如,考量具有值 -1、 0 及 1的直欄「信用評估」。 您可以使用值說明來提供這些值的意義。 例如, -1 可能表示「拒絕評估」。 您可以輸入特定值的說明。 對於數值,您也可以指定範圍。 若要指定數值範圍,請輸入下列文字 [n , m] ,其中 n 是開始, m 是範圍的結束,並以方括弧括住,然後按一下 新增。 例如,若要將 18 到 24 之間的所有年齡值說明為「等寬」,請輸入 [18,24] 作為值,並輸入 等寬 作為說明。 如果您已定義 設定檔 ,則設定檔值會顯示在值說明清單中。 從這裡,您可以選取一個值或多個值。

公平性資訊 您可以定義
Monitor或Reference值群組來監視偏誤。 更有偏誤結果風險的值可以放置在「監視」群組中。 然後會將這些值與「參照」群組中的值進行比較。 若要指定數值範圍,請輸入下列文字 [n , m] ,其中 n 是開始, m 是範圍的結束,並以方括弧括住。 例如,若要監視 18 到 35 之間的所有經歷時間值,請輸入 [18,35]。 然後選取 Monitor 或 Reference ,並按一下 新增。 您也可以指定 有利輸出結果。 如需公平性的相關資訊,請參閱 AutoAI 實驗中的公平性 。
當您已編輯特性時,請按一下 儲存。 您現在可以在「 特性詳細資料 」視窗中看到您的變更。 關閉此視窗以回到特性群組。
從群組中移除特性
如果要從群組中移除特性,請執行下列動作:
- 預覽專案中的資產,並選取 特性群組 標籤。
- 在顯示的 特性 表格中,選取您要移除的一或多個特性。
- 在出現的工具列中,選取 從群組中移除。
即會移除特性或特性群組 (如果您已選取所有特性)。
搜尋特性群組
您可以 在所有專案中搜尋資產或直欄。 若要過濾搜尋結果以尋找具有特性群組的資產,請選取 資料 以查看過濾器選項,然後選取 特性群組。 然後,包含特性群組的資產會列在搜尋結果中。
使用 Python API 來建立及使用特性群組
您也可以在 Notebook 中使用 assetframe-lib Python 程式庫 來建立及編輯特性群組。 此程式庫也可讓您在建立機器學習模型時使用諸如公平性資訊之類的特性 meta 資料。
進一步瞭解
如需如何在 Notebook 中建立及使用特性群組的範例:
- 在範例中 建立及使用特性儲存庫資料 範例專案