方法(多重插补)
“方法”选项卡指定如何插补缺失值,包括使用的模型类型。分类预测值是指示符(哑元)编码。
插补方法。 自动方法扫描数据,并在数据显示单调缺失值模式时使用单调方法;否则使用完全条件指定。如果您确定应使用的方法,您可以将其指定为自定义方法。
- 完全条件指定。 这是一个迭代 Markov 链 Monte Carlo (MCMC) 方法,当缺失数据模式任意(单调或非单调)时可使用该方法。
对于每个迭代以及对于以变量列表中指定顺序的每个变量,完全条件指定(FCS)方法使用模型中的所有其他可用变量作为预测值,拟合一个单变量(单个因变量)模型,然后为拟合的变量插补缺失值。此方法持续执行,直到达到最大迭代次数,最大迭代的插补值保存到插补数据集中。
最大迭代次数。 它规定 FCS 方法所使用的 Markov 链进行的迭代(或“步骤”)数量。如果自动选择 FCS 方法,则它使用缺省 10 次迭代次数。当您明确选择 FCS 时,您可以指定自定义迭代次数。如果 Markov 链不收敛性,您可能需要增加迭代次数。在“输出”选项卡上,您可以保存 FCS 迭代历史记录数据并将其画成曲线,以评估收敛性。
- 单调。 这是一种非迭代方法,只有当数据具有单调缺失值模式时才可使用该方法。当您可以排序变量使得(如果变量具有非缺失值)所有先前变量也具有非缺失值时,就表示存在单调模式。当将此指定为定制方法时,确保以显示单调模式的顺序指定列表中的变量。
对于单调顺序的每个变量,单调方法使用模型中的所有前面的变量作为预测值,拟合一个单变量(单个因变量)模型,然后为拟合的变量插补缺失值。这些插补值保存到插补数据集中。
包括双向交互。 当自动选择插补方法时,每个变量的插补模型包括预测变量的常数项和主效应。当选择特定方法时,您也可以在分类预测变量中包括所有可能的双向交互。
刻度变量的模型类型。 当自动选择插补方法时,线性回归用作刻度变量的单变量模型。当选择特定方法时,您也可以选择预测平均值匹配(PMM)作为刻度变量的模型。PMM 是线性回归的一种变型,它将回归模型计算得出的插补值与最接近的观察值匹配。
Logistic 回归总是用作分类变量的单变量模型。无论是哪种模型类型,都使用指示符(哑元)编码处理分类预测值。
奇异性容差。 奇异(非可逆)矩阵具有线性相关列,对估计算法可能产生严重问题。即使近似奇异的矩阵也可导致不良结果,因此该过程会将行列式小于容差的矩阵作为奇异矩阵对待。指定一个正值。
如何指定插补方法
此功能需要 Statistics Base Edition。
- 从菜单中选择:
- 在“插补缺失数据值”对话框中,单击方法选项卡。