範例:散佈圖矩陣 (SPLOM)

我們要建立一個具有許多不同變數的散佈圖矩陣,判斷資料集中的各個變數之間有沒有關聯性。

附註:本範例使用 customer_subset

  1. 從功能表中選擇:

圖形 > 圖形板樣本選擇器 ...

  1. 在「基本」標籤上,選取 ageincomecreddebt 。 (按住 Ctrl 並按一下可選取多個欄位/變數。)
  2. 選取 SPLOM
  3. 按一下確定
圖 1. 散佈圖矩陣 (SPLOM)
散佈圖矩陣 (SPLOM)

我們可以觀察下列資訊:

  • 對角線上的直方圖顯示 SPLOM 中各變數的分配。 age 的直方圖出現於左上儲存格,而 income 出現於中央儲存格,creddebt 則出現於右下儲存格。 這些變數都不是常態分配。 也就是說,沒有一個直方圖呈現鐘型曲線。 另外,請注意 incomecreddebt 的直方圖呈現正偏斜。
  • age 和其他變數之間似乎沒有任何關係。
  • incomecreddebt 之間有線性關係。 也就是說,creddebt 增加的時候,income 也會增加。 您可以建立這些變數與其他相關變數的個別散佈圖,進一步探索其中關聯。