距離

此程序可用來計算成對變數或成對觀察值之間的相似性或相異性 (距離)。 然後,我們再將這些相似性或距離測量結果,用於像是因素分析、叢集分析、或多維度方法之類的其他程序,以便進一步協助我們分析更複雜的資料集。

範例。 在本車輛範例中,研究人員想要根據某些特性 (如引擎大小、MPG 和馬力),來測量成對車輛之間的相似性。 並藉由計算車輛之間的相似性來進一步得知,哪些車輛相類似,而哪些車輛又彼此不同。 如果想要進行比較正式的分析,您可能需要考慮是否要使用階層叢集分析、或多維度方法,以探測其基本結構。

統計資料。 在區間資料的相異性(距離)測量方面,其統計量包括︰歐基里得直線距離、歐基里得直線距離平方、Chebychev、區塊、Minkowski 或自訂式;如果是個數資料,統計量則有︰卡方或法方的平方距離測量;如果是二項資料,統計量則有︰歐基里得直線距離、歐基里得直線距離平方、大小差異、形式差異、變異數、形狀、或 Lance 與 Williams。 在區間資料的相似性測量方面,其統計量包括︰皮爾遜 (Pearson) 相關或餘弦;如果是二項資料,統計量則有︰Russel 與 Rao、簡單配對、Jaccard、骰子、Rogers 與 Tanimoto、Sokal 與 Sneath 1、Sokal 與 Sneath 2、Sokal 與 Sneath 3、Kulczynski 1、Kulczynski 2、Sokal 與 Sneath 4、Hamann、Lambda (λ) 值、Anderberg D 值、Yule Y 係數、Yule Q 值、Ochiai、Sokal 與 Sneath 5、Phi (φ) 值 4 點相關、分散情形。

若要取得距離矩陣

本功能需要 Statistics Base 選項。

  1. 從功能表中選擇:

    分析 > 關聯 > 距離 ...

  2. 若要計算觀察值之間的距離,請至少選取一個數值變數﹔或者,若要計算變數之間的距離,請至少選取兩個數值變數,。
  3. 選取「計算距離」組別中的其中一個項目,以計算觀察值或變數之間的近似性。