建模節點欄位選項
所有建模節點都有一個「欄位」標籤,您可以在其中指定要用於建置模型的欄位。
您必須先指定要用做目標與輸入的欄位,然後才能建置模型。在某些例外狀況下,所有建模節點會使用來自上游「類型」節點的欄位資訊。若您使用「類型」節點來選取輸入和目標欄位,則無須變更此標籤的任何內容。(特殊情況包含「序列」節點和「文字擷取」節點,這兩個節點需要在建模節點中指定欄位設定。)
使用類型節點設定。此選項會告知節點使用來自上游「類型」節點的欄位資訊。此為預設值。
使用自訂設定。此選項會告知節點使用此處指定的欄位資訊,而不使用任何上游「類型」節點的指定欄位資訊。選取此選項後,請視需要於下方指定欄位。
註:並非所有欄位都對所有節點顯示。
-
使用交易格式(僅限 Apriori、CARMA、MS 關聯規則和 Oracle Apriori 節點)。如果來源資料為交易格式,那麼選中此勾選框。此格式的記錄具有兩個欄位,一個為 ID 欄位,一個為內容欄位。每條記錄代形式個交易或單個項目,關聯的項目通過相同的 ID 得以鏈結。如果資料為表格式,請取消勾選此方框,表格式中項目由獨立旗標代表,其中每個旗標欄位代表某個特定項目是否出現,且每個記錄代表關聯的項目的完整集合。請參閱表格資料與交易資料主題,以取得更多資訊。
- ID。 對於交易處理資料,請從清單中選取 ID 欄位。可以將數值或符號欄位用作 ID 欄位。此欄位的每一個唯一值都應指出一個特定的分析單位。例如,在購物籃應用程式中,每一個 ID 都可能代表一個客戶。對於 Web 日誌分析應用程式,每一個 ID 都可能代表一部電腦(依 IP 位址)或一位使用者(依登入資料)。
- ID 是連續的。
(僅限 Apriori 和 CARMA 節點)如果您的資料進行了預先排序,以便所有 ID 相同的記錄在資料串流中群組在一起,那麼選取此選項可以加快處理速度。如果您的資料未經預先排序(或者您不確定),請將此選項保持未選取狀態,那麼該節點將自動對資料進行排序。註: 如果您的資料未經過排序而您選取了此選項,那麼可能會在模型中得到無效結果。
- 內容。 指定模型的內容欄位。這些欄位包含與關聯建模有關的項目。您可以指定多個旗標欄位(如果資料為表格式)或者一個列名欄位(如果資料為交易格式)。
- 目標。 針對需要使用一或多個目標欄位的模式,請選取一個或多個目標欄位。這與在「類型」節點中將欄位角色設為目標類似。
-
評估。
(僅適合自動叢集模型。)不為叢集模型指定目標,但可選取一個評估欄位以確定其重要性等級。此外,還可評估叢集區分此欄位值的程度,從而指示是否可使用叢集來預測此欄位。附註:評估欄位必須是具有多個值的字串。
- 輸入。選取一個或多個輸入欄位。這與在「類型」節點中將欄位角色設為輸入類似。
- 分割區。此欄位容許您指定一個欄位,以用來將資料分割為不同樣本以用於模型建置的訓練、檢定和驗證階段。透過使用一個樣本來產生模型,並使用另一個樣本來測試模型,您可以很好地指出模型將概化為與現行資料相似的更大型資料集的程度。如果已使用「類型」或「分割區」節點來定義多個分割區欄位,則必須在使用分割的每一個建模節點中的「欄位」標籤上選取單一分割區欄位。(如果僅存在一個分割區,則每當啟用分割時,都會自動使用該分割區。) 另請注意,若要在您的分析中套用選取的分割區,則還必須在節點的「模型選項」標籤中啟用分割。(取消選取此選項可能會停用分割而不變更欄位設定。)
- 分割。 針對分割模型,選取一或多個分割欄位。這與在「類型」節點中將欄位角色設為分割類似。您可以只將測量層次為旗標、標稱、序數或連續的欄位指定為分割欄位。選擇作為分割欄位的欄位無法用作目標、輸入、分割區、頻率或加權欄位。請參閱建立分割模型主題,以取得更多資訊。
- 使用頻率欄位。 此選項可讓您選取某個欄位作為一個頻率加權。如果訓練資料中的每條記錄代表多個單元(例如,您正在使用聚合的資料),那麼可採用此項。欄位值應該為每筆記錄代表的單位數。請參閱使用頻率和加權欄位主題,以取得更多資訊。
附註:如果您看到錯誤訊息meta 資料(在輸入/輸出欄位上)無效,請確保已指定所有必填欄位,例如「頻率」欄位。
- 使用加權欄位。 此選項可讓您選取某個欄位作為一個觀察值加權。觀察值加權是用來說明輸出欄位不同等級間的變異差異。請參閱使用頻率和加權欄位主題,以取得更多資訊。
- 後繼。 對於規則歸納節點 (Apriori),請選取在生成的規則集中用作結果的欄位。(這對應於「類型」節點中角色為目標或兩者的欄位。)
- 先行。 對於規則歸納節點 (Apriori),請選取在生成的規則集中用作前提條件的欄位。(這對應於「類型」節點中角色為輸入或兩者的欄位。)
某些模型的「欄位」標籤與本節所述「欄位」標籤不同。
- 請參閱序列節點欄位選項主題,以取得更多資訊。
- 請參閱CARMA 節點欄位選項主題,以取得更多資訊。