分位顯示(相等計數或總和)

分位顯示「分組」方法用於建立名義欄位,這些欄位可用於將掃描到的記錄分割為百分位數(或四分位數、十分位數等)群組,使每個群組包含相同數量的記錄,或使每個群組中值的總和相等。記錄根據指定的分級欄位值按升冪排列,因此所選分級變數的值最低的記錄將獲得等級 1,下一組記錄等級為 2,依此類推。每個分級的臨界值將根據所用的資料和分位方法自動產生。

分位延伸名。指定用於使用標準 p 分位顯示產生的欄位的副檔名。預設副檔名是 _TILE 加上 N,其中 N 是分位號。您還可以指定是否將副檔名新增至欄位名稱的開頭(字首)或結尾(字尾)。例如,可以產生名為 income_BIN4 的新欄位。

自訂分位延伸名。指定用於自訂分位顯示範圍的副檔名。預設值是 _TILEN 。請注意,此處的 N不會被自訂數字取代。

可用的 p 分位顯示如下:

  • 四分位數。產生 4 個「分組」,每個包含 25% 的觀察值。
  • 五分位數。產生 5 個「分組」,每個包含 20% 的觀察值。
  • 十分位數。產生 10 個「分組」,每個包含 10% 的觀察值。
  • 二十分位數。產生 20 個「分組」,每個包含 5% 的觀察值。
  • 百分位數。 產生 100 個「分組」,每個包含 1% 的觀察值。
  • 自訂 N。選取此選項可指定「分組」個數。例如,值為 3 將產生 3 個劃分種類(2 個割點),每個包含 33.3% 的觀察值。

請注意,如果資料中的離散值少於指定的分位顯示,那麼不會使用任何分位顯示。在這種情況下,新的分佈很可能反映資料的原始分佈。

分位方法。指定用於為「分組」分配記錄的方法。

  • 記錄計數。盡量為每個分級分配相等號碼的記錄。
  • 值總和。 為「分組」分配記錄時,盡量使每個「分組」中值的總和相等。例如,以銷售業績為目標時,此方法可用於根據每條記錄的值為十分位數群組分配預期業績,最高分級獲得價值最高的預期業績。例如,某制藥公司可根據所開啟處方的數量將醫師分入十分位數群組。盡管每個十分位數包含的底方數大致相同,但提供這些底方的個人數並不會相同,所開底方最多的個人集中在十分位數 10 中。請注意,此方法會假定所有值均大於零,如果實際情況不是這樣則可能產生意外結果。

鏈結。 當分割點兩端的值相同時,將產生結條件。例如,如果是分配十分位數,且超過 10% 的記錄的分級欄位具有相同值,那麼除非對臨界值進行向上或向下的強制轉換,否則無法將這些記錄全部分配至同一分級。可以將同分值上移至下一個「分組」,也可以保留在目前「分組」中,但必須將其解析,使具有相同值的所有記錄位於同一「分組」內,即使這樣會導致某些「分組」的記錄數超過預期值也是如此。後續「分組」的臨界值可能也會因此發生調整,導致對相同數字集合進行不同的值分配,具體取決於用於解析同分值的方法。

  • 新增至下一個。 選取此項以將鏈結值向上移至下一個「分組」。
  • 保留在現行中。 將鏈結值保留在現行(下方)分組中。此方法可能會導致建立的「分組」總數較少。
  • 隨機分配。選取此選項可將同分值隨機配置至一個分級。這將試圖使每個分級中的記錄數數量相等。

範例:按記錄計數分位

下表格說明按記錄計數進行分位時如何將簡單欄位值分為四分位數。請注意,結果將隨選取的同分值選項而變化。

表 1. 依記錄計數分位範例
新增至下一個 保留在目前分級中
10 1 1
13 2 1
15 3 2
15 3 2
20 4 3

每個分級的項目數的計算方法如下:

值的總數/分位顯示

在上方的簡單範例中,每個分級的所需項目數為 1.25(5 個值 / 4 個四分位數)。值 13(值編號為 2)跨越 1.25 的所需計數臨界值,因此將根據所選的同分值選項進行不同處理。在 新增到下一個 模式下,會將其新增到分級 2 中。在 保留在目前分級中 模式下,會將其留在分級 1 中,從而將分級 4 的值範圍推到現有資料值範圍外。結果是,僅建立三個「分組」,每個「分組」的臨界值將進行相應調整,如下表格中所示。

表 2. 「分組」範例結果
分級 下限 上限
1 >=10 <15
2 >=15 <20
3 >=20 <=20

注意:啟用平行處理可提高按分位顯示分組的速度。