验证数据

“验证数据”对话框允许您标识活动数据集中可疑的和无效的个案、变量和数据值。

示例。数据分析人员每个月必须向客户提供客户满意度报告。她每个月接收到的数据需要进行质量检查,看是否存在不完整的客户标识、超出范围的变量值以及经常错误输入的变量值组合。“验证数据”对话框允许分析人员指定唯一标识客户的变量,为有效变量范围定义单变量规则,并定义交叉变量规则以找出不可能的组合。该过程返回问题个案和变量的报告。此外,每个月的这些数据都具有相同的数据元素,因此分析人员可以将规则应用于下个月的新数据文件。

统计信息。该过程生成多项检查失败的变量、个案和数据值的列表,违反单变量和交叉变量规则的次数计数,以及分析变量的简单描述摘要。

权重。该过程忽略权重变量规范,而是像对待任何其他分析变量一样对待权重变量。

验证数据

此功能需要“数据准备”选项。

  1. 从菜单中选择:

    数据 > 验证 > 验证数据...

  2. 选择一个或多个分析变量,以便由基本变量检查或单变量验证规则进行验证。

    或者,您可以:

  3. 单击交叉变量规则选项卡并应用一个或多个交叉变量规则。

根据需要,您可以:

  • 选择一个或多个个案标识变量以便检查重复的或不完整的 ID。个案标识变量还可用于标记个案输出。如果指定了两个或更多个案标识变量,则可将其值的组合视为个案标识。

测量级别未知的字段

当数据集中的一个或多个变量(字段)的测量级别未知时,将显示测量级别警告。由于测量级别会影响该过程的计算结果,因此所有变量必须都定义有测量级别。

扫描数据。 读取活动数据集中的数据,并分配缺省测量级别给任何具有当前未知测量级别的字段。如果数据集较大,该过程可能需要一些时间。

手动分配。 打开列出了所有具有未知测量级别的字段的对话框。您可以使用该对话框将测量级别分配给这些字段。您也可以在数据编辑器的变量视图中分配测量级别。

由于测量级别对该过程很重要,因此您无法访问运行该过程的对话框,除非所有字段均定义了测量级别。