從尺度變數建立類別變數

資料檔 demo.sav 中的數個類別變數,事實上是該資料檔所衍生的尺度變數。 例如,變數 inccat 只是分組成四種類別的 income。 此類別變數使用整數值 1 到 4 來代表下列收入類別(以千元為單位):$25、$25–$49、$50–$74 和 $75 或以上。

若要建立類別變數 inccat

  1. 從「資料編輯器」視窗中的功能表選擇:

    轉換 > Visual Binning ...

    在初始的 Visual Binning 對話框中,選擇您要為其建立新 bin 變數的尺度和(或)序數變數。 Binning 是指將兩個或多個連續數值群組成相同的類別。

    因為 Visual Binning 需依靠資料檔中的實際值來幫助您做出正確的 bin 選擇,所以它需要先讀取資料。 如果您的資料檔中含有大量的觀察值個數,讀取資料可能需要一點時間,並且此初始對話框也能讓您限制讀取(「掃描」)的觀察值個數。 我們的樣本資料檔並不需要進行限制。 雖然此檔案含有 6,000 個以上的觀察值,但掃描此數目的觀察值並不需要太多時間。

  2. 將「變數」清單中的「家庭收入(千元)[income]」拖放到「變數至 Bin」清單中,然後按一下「繼續」。
    圖 1. 主 Visual Binning 對話框
    主 Visual Binning 對話框
  3. 在主 Visual Binning 對話框中,選擇「掃描變數」清單中的「家庭收入(千元)[income]」。

    直方圖顯示選擇變數的分配(此觀察值中的分配嚴重歪斜)。

  4. 輸入 inccat2 作為新的 bin 變數名稱,輸入 Income category [in thousands] 作為變數標籤。
  5. 按一下製作分割點
  6. 選取等寬間隔
  7. 輸入 25 作為第一個分割點位置,輸入 3 作為分割點的數目,然後輸入 25 作為寬度。

    bin 類別的數目為分割點數目加一。 因此在這個範例中,新的 bin 變數將擁有四類別別,前三個類別各包含 25(千元)的範圍,而最後一個則包含最高分割點數值 75(千元)以上的所有數值。

  8. 按一下套用

    現在網格中所顯示的數值代表已定義的分割點,為各類別的上端點。 直方圖中的垂直線亦代表分割點的位置。

    依預設,這些分割點的數值包含在對應的類別中。 例如,25 的第一個數值應包含小於或等於 25 的所有數值。 但在此範例中,我們要的是對應於 25 以下、25 到 49、50 到 74 和 75 或以上的類別。

  9. 在「上端點」群組中,選取 已排除 (<)。
  10. 然後按一下製作標記
    圖 2. 自動產生值標籤
    具有自動產生標籤的 Visual Binning 對話框

    這會自動為每個類別產生描述性的數值標籤。 因為指定給新 bin 變數的實際數值,不過是從 1 開始的整數,因此數值標籤非常實用。

    您也可以手動輸入或變更網格中的分割點和標記、拖放直方圖中的分割點線條來變更分割點位置,以及將分割點線條拖曳到直方圖以外的地方以刪除分割點。

  11. 按一下「確定」以建立新的 bin 變數。

「資料編輯器」中會顯示新的變數。 因為變數是加到檔案的結尾處,因此新變數會顯示在「資料視圖」中最右邊一行,以及「變數視圖」中的最後一列。

下一個