分析模式(多重插补)

分析模式提供数据中缺失值模式的描述性测量,可用作插补之前的探索步骤。 这是 多重插补 过程。

示例。 电信供应商想更好理解客户数据库中的服务用途模式。 他们拥有客户所使用的服务的完整数据,但是公司收集的人口统计信息有大量缺失值。 分析缺失值的模式可以帮助确定插补的下一步。

从菜单中选择:

分析 > 多重插补 > 分析模式 ...

  1. 请选择至少两个分析变量。 该过程分析这些变量的缺失数据的模式。

可选设置

分析权重。 此变量包含分析(回归或抽样)权重。 此过程在缺失数据概要中融入分析权重。 排除分析权重为负值或零值的个案。

输出。 显示下面的可选输出:

  • 缺失值概要。 它会显示带面板的饼图,图中显示具有一个或多个缺失值的分析变量、个案或单独数据值的数量及百分比。
  • 缺失值模式。 它会显示缺失值的制表模式。 每个模式对应于分析变量上具有相同的不完整和完整数据模式的一组个案。 您可以使用此输出判断该单调插补方法是否可用于您的数据,如果不能,判断您的数据近似单调模式的程度。 该过程对分析变量排序,以揭示或近似单调模式。 如果重新排序后不存在非单调模式,则您可以得出结论,如此排序分析变量时数据具有单调模式。
  • 缺失值频率最高的变量。 它会按缺失值百分比的降序顺序显示一个分析变量表格。 该表格包括刻度变量的描述性统计数据(平均值和标准差)。

    您可以控制显示变量的最大数量和显示中可包括的变量的最小缺失百分比。 将显示满足两个条件的变量集合。 例如,设置最大变量数量为 50 和最小缺失百分比为 25 会要求表格显示缺失值至少为 25% 的最多 50 个变量。 如果有 60 个分析变量,但只有其中 15 个的缺失值大于或等于 25%,则输出只包括 15 个变量。

此过程将粘贴 MULTIPLE IMPUTATION 命令语法。