選取觀察值

您可以利用「選擇觀察值」所提供的方法,來選擇觀察值子集 (這裡的觀察值以包含變數及複雜表示式的條件為基礎)。 或者,您也可以選擇隨機的觀察值樣本。 定義子群組所需之準則包括:

  • 變數值和範圍
  • 日期和時間範圍
  • 觀察值(列)個數
  • 算術表示式
  • 邏輯表示式
  • 函數

所有觀察值關閉觀察值過濾功能並使用所有觀察值。

如果滿足設定條件使用條件式表示式來選取觀察值。 如果條件表示式的結果為 true,則系統會選取此觀察值。 如果結果是 false 或 missing,則不選取該觀察值。

觀察值的隨機樣本依據近似百分比,或是精確的觀察值數目,來選取隨機樣本。

根據時間或觀察值範圍根據觀察值編號範圍或日期/時間範圍來選取觀察值。

使用過濾變數使用從資料檔中選取的數值變數作為過濾變數。 系統會選取包含 0 以外任意值或遺失過濾變數的觀察值。

輸出

本節可控制未選擇之觀察值的處理方式。 您可以任選下列其中一個選項作為未選擇之觀察值的處理方式:

  • 過濾掉未選取的觀察值。 未選擇的觀察值不列入分析但保留於資料集內。 如果您關掉過濾功能,您可稍後於作業階段中使用未選擇的觀察值。 如果您選擇一個隨機樣本,或如果您以條件表示式為基礎選擇觀察值,將產生名為 filter_$ 的變數,其包含數值 1 的選擇觀察值及數值 0 的未選擇觀察值。
  • 複製已選擇觀察值至新資料集。 選擇的觀察值被複製到新的資料集,不影響原始資料集。 未選擇的觀察值不列入新的資料集,並以原始狀態留置於原始資料集中。
  • 過濾掉未選取的觀察值。 自資料集刪除未選擇的觀察值。 如果要復原已刪除的觀察值,必須離開檔案且不儲存任何變更,再重新開啟檔案。 如果您將變更儲存於資料檔,觀察值便永久刪除。

附註:如果您刪除未選擇的觀察值並儲存檔案,將無法復原觀察值。

若要選擇觀察值的子集

  1. 從功能表中選擇:

    資料 > 選取觀察值 ...

  2. 選取一個 (或多個) 選擇觀察值的方法。
  3. 指定選擇觀察值的條件。