PARTITION 次指令 (LINEAR_LASSO 延伸指令)

PARTITION 次指令提供一種方法來建立輸入資料的保留或檢定子集,以估計所指定或所選模型的樣本外效能。 請注意,對於交叉驗證,會在 Python中建立訓練資料的摺疊或分割區。 不論有效模式為何, PARTITION 所建立的保留資料都不會用於估計。

  • 可以透過指定隨機指派給每個樣本 (訓練及保留) 的觀察值比例,或透過將每個觀察值指派給訓練或保留樣本的變數來定義分割。
  • 如果未指定 PARTITION 次指令,則會建立大約 30% 輸入資料的保留樣本。
  • 透過指定 TRAININGHOLDOUT 關鍵字的其他值,可以指派不同的分割。 如果指定其中一個關鍵字,則也必須指定另一個關鍵字。
  • 在每個關鍵字上指定的值會提供作用中資料集內要指派給每個樣本的相對觀察值數目。 例如, /PARTITION TRAINING = 50 HOLDOUT = 50 相當於 /PARTITION TRAINING = 5 HOLDOUT = 5; 這兩個次指令都會隨機將 50% 的觀察值指派給訓練樣本,並將 50% 指派給保留樣本。
  • 若要使用所有資料進行訓練而不建立保留樣本,請為 TRAINING 指定正值,並為 HOLDOUT 指定 0。
  • 如果您希望稍後能夠根據 TRAININGHOLDOUT 關鍵字來重新產生結果,請在執行 LINEAR_LASSO extension 程序之前,使用 SET指令來設定亂數產生器的起始設定值。
  • 對於程序所使用的任何變數,在成批刪除具有無效資料的任何觀察值之後,會執行所有分割。
  • 同時指定 TRAININGVARIABLE是無效的。
訓練關鍵字
TRAINING 關鍵字指定作用中資料集內要隨機指派給訓練樣本的觀察值相對數目。

值必須是大於 0 的整數。 預設值 (如果指定不含關鍵字的 PARTITION 次指令) 為 70。

HOLDOUT 關鍵字
HOLDOUT 關鍵字指定作用中資料集內要隨機指派給保留樣本的相對觀察值數目。

該值必須是大於或等於 0 的整數。 預設值 (如果指定不含關鍵字的 PARTITION 次指令) 為 30。

VARIABLE 關鍵字
VARIABLE 關鍵字指定將作用中資料集中的每個觀察值指派給訓練或保留樣本的變數。 變數上具有正值的觀察值會指派給訓練樣本,而具有非正數值的觀察值會指派給保留樣本。 含有系統遺漏值的觀察值會從分析中排除。 (分割區變數的任何使用者遺漏值一律視為有效。)

變數可能不是應變數或指令行因數或共變數清單上指定的任何變數。 變數必須是數值。