MODEL 次指令 (KNN 指令)

MODEL 次指令用來指定最近鄰接項 "model"。 依預設,此程序會使用變數清單上指定的所有特徵,以及「近性」的歐基里得距離量數,根據 3 個最近鄰接項來建置模型。

度量關鍵字

METRIC 關鍵字可讓您指定用於測量觀察值相似性的距離度量。

Euclid. 歐基里得直線距離。 這是 METRIC的預設規格。 兩個觀察值 x 和 y 之間的距離就是觀察值之間平方差的所有維度總和平方根。

CITYBLOCK. 城市街區或曼哈頓距離。 兩個觀察值之間的距離就是觀察值數值之間差異的所有維度總和。

NEURTS 關鍵字

NEIGHBORS 關鍵字指示是否使用自動選取的最近鄰接項數目。

如果未指定任何應變數,則會忽略 NEIGHBORS=FIXED 以外的任何規格,並產生警告。

FIXED. 使用固定數目的鄰接項。 這是預設值。 FIXED 關鍵字後面可以接著括弧,其中包含 K 選項,用來指定鄰接項數目。 K 必須是正整數。 預設值為 3。 如果指定 NEIGHBORS=FIXED ,則任何 CROSSVALIDATION 次指令規格都會被忽略並出現警告。

自動. 使用自動選擇來決定「最佳」鄰接項數目。 AUTO 關鍵字可以用括弧來括住,其中包含 KMIN KMAX 選項,可分別指定自動選取鄰接項的數目在決定鄰接項的「最佳」數目時所考量的鄰接項數目下限和上限。 僅指定一個選項無效; 您必須同時指定這兩個選項或都不指定。 選項可以任何順序指定,且必須以逗點或空格字元區隔。 這兩個數字都必須是大於 0 的整數,且 KMIN 小於 KMAX。 預設值為 KMIN=3KMAX=5。 如果指定 NEIGHBORS=AUTOFEATURES=ALL ,則會使用 V摺疊交叉驗證來選取鄰接項的「最佳」數目。 CROSSVALIDATION 次指令指定 V摺疊交叉驗證的設定。

FEATURES 關鍵字

FEATURES 關鍵字指出是否使用自動選取功能 (預測值)。

如果未指定任何應變數,則會忽略 FEATURES=ALL 以外的任何規格,並產生警告。

全部. 使用指令行變數清單上的所有預測值。 這是預設值。

自動 . 使用正向選擇來決定「最佳」特性集。 AUTO 關鍵字後面可以接著括弧,其中包含 FORCE 選項,該選項指定必須包含在模型中的一組起始預測值。 FORCE 選項上沒有預設變數清單。

  • 如果指定 FEATURES=AUTO ,則任何 CROSSVALIDATION 次指令規格都會被忽略並出現警告。
  • FORCE 選項上的變數清單包含所有可能的預測值是無效的; 也就是說,如果指定 FEATURES=AUTO ,則必須至少有一個預測值可用於功能選擇。

結合鄰接項和功能選項

NEIGHBORS=AUTOFEATURES=AUTO時,會使用下列方法來選取結合的鄰接項和特性:

  1. 對於每一個 K,請使用向前選取方法來選取特性。
  2. 選取具有最低錯誤率或最低平方和誤差的 K及隨附特性集。