自動分類器節點
「自動分類器」節點使用多種不同的方法來估計和比較名義(集合)或二元(是/否)目標的模型,這使您可以在一次建模執行中嘗試多種方法。您可以選取要使用的演算法,且可以試用多個選項的組合。例如,您無需在徑向基底函數、多項式、sigmoid 或線性方法中選擇一種來用於 SVM,您可以全部都嘗試一下。該節點將探究每種可能的選項組合,並根據您指定的測量對每個候選模型進行排等級,然後儲存最佳模型以用於評分或進行進一步分析。如需相關資訊,請參閱自動建模節點。
- 範例
- 某零售公司具有歷程資料,可用於追蹤過去行銷活動中針對特定客戶的報價。公司現在希望通過向每個客戶提供合適的報價來獲取更多的利潤。
- 需求
- 一個測量層次為名義或旗標的目標欄位(角色設定為目標)和至少一個輸入欄位(角色設定為輸入)。對於「旗標」欄位,假定為目標欄位定義的true值代表計算利潤、提升和相關統計資料時的命中數。輸入欄位的測量層次可以是連續或種類,但具有限制,即某些輸入可能不適合一些模型類型。例如,在 C&R 樹狀結構、CHAID 和 QUEST 模型中用作輸入的序數欄位必須是數值儲存類型(而不是字串),如果指定了其他類型,將被這些模型忽略。類似地,在某些情況下可對連續輸入欄位進行分組。這和使用單個建模節點時的要求一樣;例如,不管是從貝葉斯網路節點還是自動分類器節點產生,貝葉斯網路模型都以同樣的方式工作。
- 頻率和加權欄位
- 頻率與加權用來向部分記錄提供高於其他記錄的額外重要性,例如,使用者知道建置資料集未充分代表一部分母體(加權),或者因為一筆記錄代表數個相同的觀察值(頻率)。如果指定了頻率欄位,那麼 C&R 樹狀結構、CHAID、QUEST、決策清單和貝葉斯網路模型可以使用此欄位。C&RT、CHAID 和 C5.0 模型可以使用加權欄位。其他模型類型將忽略這些欄位並且無論如何都會建置模型。頻率和加權欄位僅用於模型建置,並且在評估和評分模型時不予以考慮。如需相關資訊,請參閱使用頻率和加權欄位。
- 字首
- 如果您將表格節點附加到自動分類器節點塊,那麼表格中存在多個名稱以字首 $ 開頭的新變數。
受支援的模型類型
受支援模型類型包括神經網路、C&R 樹狀結構、QUEST、CHAID、C5.0、邏輯迴歸、決策清單、Bayes 網路、區別、最近鄰接項、SVM、XGBoost 樹狀結構及 XGBoost-AS。請參閱自動分類器節點專家選項主題,以取得更多資訊。
連續機器學習
建模的不便之處在於隨著時間的推移資料發生變更,因此模型變得過時。這通常稱為模型漂移或概念漂移。為了協助有效克服模型漂移,SPSS Modeler 提供了連續自動化機器學習。此功能可用於「自動分類器」節點和「自動數值」節點模型塊。有關進一步資訊,請參閱連續機器學習。