選取觀察值
您可以利用「選擇觀察值」所提供的方法,來選擇觀察值子集 (這裡的觀察值以包含變數及複雜表示式的條件為基礎)。 或者,您也可以選擇隨機的觀察值樣本。 定義子群組所需之準則包括:
- 變數值和範圍
- 日期和時間範圍
- 觀察值(列)個數
- 算術表示式
- 邏輯表示式
- 函數
所有觀察值。 關閉觀察值過濾功能並使用所有觀察值。
如果滿足設定條件。 使用條件式表示式來選取觀察值。 如果條件表示式的結果為 true,則系統會選取此觀察值。 如果結果是 false 或 missing,則不選取該觀察值。
觀察值的隨機樣本。 依據近似百分比,或是精確的觀察值數目,來選取隨機樣本。
根據時間或觀察值範圍。 根據觀察值編號範圍或日期/時間範圍來選取觀察值。
使用過濾變數。 使用從資料檔中選取的數值變數作為過濾變數。 系統會選取包含 0 以外任意值或遺失過濾變數的觀察值。
輸出
本節可控制未選擇之觀察值的處理方式。 您可以任選下列其中一個選項作為未選擇之觀察值的處理方式:
- 過濾掉未選取的觀察值。 未選擇的觀察值不列入分析但保留於資料集內。 如果您關掉過濾功能,您可稍後於作業階段中使用未選擇的觀察值。 如果您選擇一個隨機樣本,或如果您以條件表示式為基礎選擇觀察值,將產生名為 filter_$ 的變數,其包含數值 1 的選擇觀察值及數值 0 的未選擇觀察值。
- 複製已選擇觀察值至新資料集。 選擇的觀察值被複製到新的資料集,不影響原始資料集。 未選擇的觀察值不列入新的資料集,並以原始狀態留置於原始資料集中。
- 過濾掉未選取的觀察值。 自資料集刪除未選擇的觀察值。 如果要復原已刪除的觀察值,必須離開檔案且不儲存任何變更,再重新開啟檔案。 如果您將變更儲存於資料檔,觀察值便永久刪除。
附註:如果您刪除未選擇的觀察值並儲存檔案,將無法復原觀察值。
若要選擇觀察值的子集
- 從功能表中選擇:
- 選取一個 (或多個) 選擇觀察值的方法。
- 指定選擇觀察值的條件。