分割區節點
「分割區」節點用於產生分割區欄位,將資料分割為個別的子集或樣本,以供模型建置的訓練、正在測試和驗證階段使用。通過用某個樣本產生模型並用另一個樣本對模型進行測試,可以預判此模型對類似於現行資料的大型資料集的擬合優劣。
分割區節點會產生列名欄位,其角色設定為分割區。此外,如果資料中已經存在適當的欄位,可以使用「類型」節點將其指定為分割區。在這種情況下,不需要個別的「分割區」節點。可以將任何具有兩個或三個值的實例化列名欄位用作分割區,但不能使用旗標欄位。請參閱設定欄位角色主題,以取得更多資訊。
可以在一個串流中定義多個分割區欄位,但如果這麼做,那麼必須在每個用於分區的建模節點的「欄位」標籤中選取一個分割區欄位。(如果僅存在一個分割區,則每當啟用分割時,都會自動使用該分割區。)
啟用分區。要在分析中使用分區,必須在適當的模型建立或分析節點的「模型選項」標籤中啟用分區。取消選取此選項可以在不刪除欄位的條件下取消分區功能。
若要基於其他準則(如日期範圍或位置)建立分割區欄位,還可以使用「衍生」節點。請參閱衍生節點主題,以取得更多資訊。
範例。 建立 RFM 串流以識別積極回應以往營銷活動的最新客戶時,銷售公司的市場行銷處可以使用「分割區」節點將資料分割到訓練分割區和測試分割區。