缺失值简介

包含缺失值的个案是严重的挑战,因为典型的建模过程会直接将这些个案排除在分析之外。 如果存在少量缺失值(大约低于个案总数的 5%),且这些值可以被认为随机缺失,即值的缺失不依赖于其他值,则成列删除的典型方法相对比较“安全”。 “缺失值”选项可以帮助确定成列删除是否足够,并在必要时提供其他缺失值处理方法。

缺失值分析与多重插补过程

“缺失值”选项提供了两组处理缺失值的过程。

  • 多重插补 过程提供对缺失数据模式的分析,以最终实现缺失值的多重插补。 这意味着会产生多个版本的数据集,它们分别包含各自的插补值集。 在执行统计分析时,汇集了针对所有插补数据集的参数估计,因此提供的估计结果通常比单个插补更为准确。
  • 缺失值分析 提供了一组略有不同的描述性工具,用于分析缺失数据 (尤其是 Little 的 MCAR 检验) ,并包含各种单一插补方法。 注意,多重插补通常被认为优于单一插补。

缺失值任务

可以按照这些基本步骤来开始进行缺失值分析:

  1. 检查缺失。 使用“缺失值分析”和“分析模式”探索数据中的缺失值模式,并确定是否有必要进行多重插补。
  2. 插补缺失值(I)。 使用“插补缺失数据值”以对缺失值进行多重插补。
  3. 分析 "完整" 数据。 使用任何支持多重插补数据的过程。 请参阅 分析多重插补数据 ,以获取有关分析多重插补数据集以及支持这些数据的过程列表的信息。