MODEL 次指令 (KNN 指令)
MODEL 次指令用來指定最近鄰接項 "model"。 依預設,此程序會使用變數清單上指定的所有特徵,以及「近性」的歐基里得距離量數,根據 3 個最近鄰接項來建置模型。
度量關鍵字
METRIC 關鍵字可讓您指定用於測量觀察值相似性的距離度量。
Euclid. 歐基里得直線距離。 這是 METRIC的預設規格。 兩個觀察值 x 和 y 之間的距離就是觀察值之間平方差的所有維度總和平方根。
CITYBLOCK. 城市街區或曼哈頓距離。 兩個觀察值之間的距離就是觀察值數值之間差異的所有維度總和。
NEURTS 關鍵字
NEIGHBORS 關鍵字指示是否使用自動選取的最近鄰接項數目。
如果未指定任何應變數,則會忽略 NEIGHBORS=FIXED 以外的任何規格,並產生警告。
FIXED. 使用固定數目的鄰接項。 這是預設值。 FIXED 關鍵字後面可以接著括弧,其中包含 K 選項,用來指定鄰接項數目。 K 必須是正整數。 預設值為 3。 如果指定 NEIGHBORS=FIXED ,則任何 CROSSVALIDATION 次指令規格都會被忽略並出現警告。
自動. 使用自動選擇來決定「最佳」鄰接項數目。 AUTO 關鍵字可以用括弧來括住,其中包含 KMIN 和 KMAX 選項,可分別指定自動選取鄰接項的數目在決定鄰接項的「最佳」數目時所考量的鄰接項數目下限和上限。 僅指定一個選項無效; 您必須同時指定這兩個選項或都不指定。 選項可以任何順序指定,且必須以逗點或空格字元區隔。 這兩個數字都必須是大於 0 的整數,且 KMIN 小於 KMAX。 預設值為 KMIN=3, KMAX=5。 如果指定 NEIGHBORS=AUTO 和 FEATURES=ALL ,則會使用 V摺疊交叉驗證來選取鄰接項的「最佳」數目。 CROSSVALIDATION 次指令指定 V摺疊交叉驗證的設定。
FEATURES 關鍵字
FEATURES 關鍵字指出是否使用自動選取功能 (預測值)。
如果未指定任何應變數,則會忽略 FEATURES=ALL 以外的任何規格,並產生警告。
全部. 使用指令行變數清單上的所有預測值。 這是預設值。
自動 . 使用正向選擇來決定「最佳」特性集。 AUTO 關鍵字後面可以接著括弧,其中包含 FORCE 選項,該選項指定必須包含在模型中的一組起始預測值。 FORCE 選項上沒有預設變數清單。
- 如果指定
FEATURES=AUTO,則任何CROSSVALIDATION次指令規格都會被忽略並出現警告。 FORCE選項上的變數清單包含所有可能的預測值是無效的; 也就是說,如果指定FEATURES=AUTO,則必須至少有一個預測值可用於功能選擇。
結合鄰接項和功能選項
當 NEIGHBORS=AUTO 和 FEATURES=AUTO時,會使用下列方法來選取結合的鄰接項和特性:
- 對於每一個 K,請使用向前選取方法來選取特性。
- 選取具有最低錯誤率或最低平方和誤差的 K及隨附特性集。