模型選擇(線性模型)
模型選擇方法。選擇其中一種模式選擇方法 (詳細資訊如下) 或「包含所有預測值」,以僅將所有可用的預測值輸入為主效應模式項目。依預設,系統會使用「向前逐步」。
轉遞逐步選擇。此方法一啟動並不會對模式產生任何效果,但會根據逐步條件一步一步新增或移除效果,直至無法再新增或移除任何效果為止。
- 進入/移除準則。此統計量決定是否應在模式中新增或移除效果。資訊準則 (AICC) 是以指定模式訓練集的概似為基礎,且會經過調整以懲罰過於複雜的模式。F 統計量是以模式錯誤改善的統計測試為基礎。已調整 R 平方是以訓練集的配適度為基礎,且會經過調整以懲罰過於複雜的模式。過適預防準則 (ASE) 過適預防準則 (平均平方誤,或 ASE) 為基礎。過適預防集是原始資料集 30% 左右的隨機子樣本,不用來訓練模式。
若選擇任何非「F 統計量」的條件,則系統會將每個步驟中對應至最大正向增加條件的效果新增至模式。系統會移除模式中任何對應至減少條件的效果。
若選擇「F 統計量」作為條件,則系統會在每個步驟中,將最小 p 值小於指定臨界值 (「包含 p 值小於此值的效果」) 的效果新增至模式。預設值為 0.05。系統會移除任何 p 值大於指定臨界值(「移除 p 值大於此值的效果」)之模式中的效果。預設值是 0.10。
- 自訂最終模型中的效果最大數目。依預設,系統會將所有可用的效果輸入至模式。或者,若逐步演算法以指定的最大效果數目來結束步驟,則演算法在停止時會保有目前的效果集。
- 自訂步驟的最大數目。 逐步演算法在經過特定步驟數目後即會停止。依預設,此為可用效果數目的 3 倍。或者,請指定正整數的步驟最大數目。
最佳子集選擇。這會檢查「所有可能」模式或是大於向前逐步的可能模式子集,以根據最佳子集條件來選擇最佳子集。 資訊準則 (AICC) 是以指定模式訓練集的概似為基礎,且會經過調整以懲罰過於複雜的模式。已調整 R 平方是以訓練集的配適度為基礎,且會經過調整以懲罰過於複雜的模式。過適預防準則 (ASE) 過適預防準則 (平均平方誤,或 ASE) 為基礎。過適預防集是原始資料集 30% 左右的隨機子樣本,不用來訓練模式。
系統會將具有最大條件值的模式選作最佳模式。
註: 最佳子集選擇較向前逐步選擇更需要大量計算。搭配推升法、自助重抽總合法或極大資料集執行最佳子集時,其建立時間會長於使用向前逐步選擇建立的標準模式。