插補遺漏資料值(多重插補)
「插補遺漏資料值」可用來產生多重插補。 完整資料集可使用支援多重插補資料集的程序進行分析。 如需分析多重插補資料集及支援這些資料之程序清單的相關資訊,請參閱 分析多重插補資料 。 此為 多重插補 程序。
範例。 某電信公司想要更了解客戶資料庫中的服務使用形式。 電信公司擁有客戶使用的服務之完整資料,但其收集的人口資訊內有幾個遺漏值。 而且這些值並不是隨機遺漏值,因此可以在此使用多重插補完成資料集。
從功能表中選擇:
- 在插補模型中選擇至少兩個變數。 程序會插補這些變數的遺漏資料多重值。
- 指定要計算的插補數目。 此值預設為 5。
- 指定應寫入插補資料的資料集或 IBM® SPSS® Statistics格式資料檔。
輸出資料集包含原始觀察值資料和遺漏資料,以及針對每個插補含有插補值的一組觀察值。 例如,若原始資料集有 100 個觀察值,而您有 5 個插補,則輸出資料集將有 600 個觀察值。 輸入資料集中的所有變數都包含在輸出資料集中。 字典內容 (名稱、標籤等) 現有變數的會複製到新資料集。 檔案亦包含新變數、Imputation_、指示插補的數值變數(0 為原始資料,或 1..n 為具備已插補數值的觀察值)。
建立輸出資料集時,程序會自動將 Imputation_ 變數定義為分割變數 (請參閱 分割檔案) 。 若執行程序時分割起了作用,則輸出資料集中,分割變數值的各種組合都會包含一組插補。
選用設定
分析加權。 此變數包含分析(迴歸或取樣)加權。 程序會於插補遺漏值所用的迴歸與分類模式中,合併分析加權。 插補摘要中也會使用分析加權;例如,平均數、標準差、標準誤。 會排除具有負或零分析加權的觀察值。
具有未知測量層級的欄位
若在資料集中出現一或多個未知的變數 (欄位) 測量層級,就會顯示「測量層級」警示。 由於測量層級會影響此程序的結果計算,因此所有變數皆必須具有已定義的測量層級。
掃描資料。 讀取作用中資料集的資料,並且針對目前具有未知測量層級的任何欄位指派預設的測量層級。 若為大型資料集,則讀取時可能需要一些時間。
手動指派。 開啟對話框,以列出具有未知測量層級所有欄位。 您可以使用此對話框以指派測量層級給這些欄位。 您可以在「資料編輯器」的「變數視圖」中指派測量層級。
由於測量層級是此程序的重要項目,因此您在所有欄位皆擁有已定義的測量層級之前,無法存取對話框來執行此程序。
此程序會貼上 MULTIPLE IMPUTATION 指令語法。