验证数据
“验证数据”对话框允许您标识活动数据集中可疑的和无效的个案、变量和数据值。
示例。数据分析人员每个月必须向客户提供客户满意度报告。她每个月接收到的数据需要进行质量检查,看是否存在不完整的客户标识、超出范围的变量值以及经常错误输入的变量值组合。“验证数据”对话框允许分析人员指定唯一标识客户的变量,为有效变量范围定义单变量规则,并定义交叉变量规则以找出不可能的组合。该过程返回问题个案和变量的报告。此外,每个月的这些数据都具有相同的数据元素,因此分析人员可以将规则应用于下个月的新数据文件。
统计信息。该过程生成多项检查失败的变量、个案和数据值的列表,违反单变量和交叉变量规则的次数计数,以及分析变量的简单描述摘要。
权重。该过程忽略权重变量规范,而是像对待任何其他分析变量一样对待权重变量。
验证数据
此功能需要“数据准备”选项。
- 从菜单中选择:
- 选择一个或多个分析变量,以便由基本变量检查或单变量验证规则进行验证。
或者,您可以:
- 单击交叉变量规则选项卡并应用一个或多个交叉变量规则。
根据需要,您可以:
- 选择一个或多个个案标识变量以便检查重复的或不完整的 ID。个案标识变量还可用于标记个案输出。如果指定了两个或更多个案标识变量,则可将其值的组合视为个案标识。
测量级别未知的字段
当数据集中的一个或多个变量(字段)的测量级别未知时,将显示测量级别警告。由于测量级别会影响该过程的计算结果,因此所有变量必须都定义有测量级别。
扫描数据。 读取活动数据集中的数据,并分配缺省测量级别给任何具有当前未知测量级别的字段。如果数据集较大,该过程可能需要一些时间。
手动分配。 打开列出了所有具有未知测量级别的字段的对话框。您可以使用该对话框将测量级别分配给这些字段。您也可以在数据编辑器的变量视图中分配测量级别。
由于测量级别对该过程很重要,因此您无法访问运行该过程的对话框,除非所有字段均定义了测量级别。