PARTITION 次指令 (KNN 指令)

PARTITION 次指令指定將作用中資料集分割成訓練及保留樣本的方法。 訓練樣本包含用於訓練模型的資料記錄。 保留樣本是一組獨立的資料記錄,用來評量最終模型。

  • 可以透過指定隨機指派給每個樣本 (訓練及保留) 的觀察值比例,或透過將每個觀察值指派給訓練或保留樣本的變數來定義分割。
  • 如果未指定 PARTITION 次指令,則預設分割會隨機將 70% 的觀察值指派給訓練樣本,並將 30% 指派給保留樣本。 如果您要指定不同的隨機指派,則必須為 TRAININGHOLDOUT 關鍵字指定新值。 在每個關鍵字上指定的值會提供作用中資料集內要指派給每個樣本的相對觀察值數目。 例如, /PARTITION TRAINING = 50 HOLDOUT = 50 相當於 /PARTITION TRAINING = 5 HOLDOUT = 5; 這兩個次指令都會隨機將 50% 的觀察值指派給訓練樣本,並將 50% 指派給保留樣本。
  • 如果您希望稍後能夠根據 TRAININGHOLDOUT 關鍵字來重新產生結果,請在執行 KNN 程序之前,使用 SET 指令來設定亂數產生器的起始設定值。
  • 請參閱 RESCALE 次指令區段中重新調整與分割之間關係的討論。
  • 對於程序所使用的任何變數,在成批刪除具有無效資料的任何觀察值之後,會執行所有分割。 如需有效及無效資料的詳細資料,請參閱 MISSING 次指令。
  • 同時指定 TRAININGVARIABLE是無效的。

訓練關鍵字

TRAINING 關鍵字指定作用中資料集內要隨機指派給訓練樣本的觀察值相對數目。

值必須是大於 0 的整數。 預設值 (如果未指定 PARTITION 次指令) 為 70。

HOLDOUT 關鍵字

HOLDOUT 關鍵字指定作用中資料集內要隨機指派給保留樣本的相對觀察值數目。

該值必須是大於或等於 0 的整數。 預設值 (如果未指定 PARTITION 次指令) 為 30。

VARIABLE 關鍵字

VARIABLE 關鍵字指定將作用中資料集中的每個觀察值指派給訓練或保留樣本的變數。 變數上具有正值的觀察值會指派給訓練樣本,而具有非正數值的觀察值會指派給保留樣本。 含有系統遺漏值的觀察值會從分析中排除。 (分割區變數的任何使用者遺漏值一律視為有效。)

變數不能是應變數,也不能是指令行因素或共變數清單上指定的任何變數。 變數必須是數值。