估计统计与插补缺失值

您可以使用列表法(仅限完整个案)、成对法、EM(期望最大化)法和/或回归法选择估计平均值、标准差、协方差和相关性。您还可以选择插补缺失值(估计替换值)。注意,在解决缺失值问题方面,多重插补通常被认为优于单一插补。Little's MCAR 检验对于确定是否需要进行插补方面仍然有效。

列表法

此方法仅使用完整个案。一旦任何分析变量具有缺失值,计算中将忽略该个案。

成对法

此方法参见分析变量对,并只有当其在两种变量中都具有非缺失值时才使用个案。频率、平均值以及标准差是针对每对分别计算的。由于忽略个案中的其它缺失值,两个变量的相关性与协方差不取决于任何其它变量的缺失值。

EM 法

此方法假设一个部分缺失数据的分布并基于此分布下的可能性进行推论。每个迭代都包括一个 E 步骤和一个 M 步骤。在给定观察值和当前参数估计值的前提下,E 步骤查找“缺失”数据的条件期望值。这些期望值将替换“缺失”数据。在 M 步骤中,即使填写了缺失数据,也将计算参数的最大似然估计值。“缺失”包含在引号中,因为缺失值不是直接填写的。而其函数用于对数似然。

用于检验值是否完全随机丢失(MCAR)的 Roderick J. A. Little 卡方统计作为 EM 矩阵的脚注印刷。对于此检验,原假设就是数据完全随机缺失且 0.05 水平的 p 值显著。若值小于 0.05,则数据将不会完全随机缺失。数据可能随机缺失(MAR)或不随机缺失(NMAR)。您无法假设一个或其它数据缺失,而是需要分析数据以确定数据是如何缺失的。

回归法

此方法计算多个线性回归估计值并具有用于通过随机元素增加估计值的选项。对于每个预测值,其过程可以从一个随机选择的完整个案中添加一个残差,或者从 t 分布中添加一个随机正态偏差,一个随机偏差(通过残差平均值方的平方根测量)。