缺失值(S)
很多数据文件都包含一些缺失数据。导致缺失数据的原因有多种。例如,调查的响应者可能不会对每一个问题都作出回答;一些变量可能不适用于某些个案;编码错误可能会导致丢弃某些值。
在 IBM® SPSS® Statistics 中有两种缺失值:
- 用户缺失值。 定义为包含缺失数据的值。可以为这些值指定值标签,以标识数据缺失的原因(例如,为男性的怀孕项使用代码 99,不适用作为值标签)。
- 系统缺失值。 如果数值变量没有值,则为其指定系统缺失值。在数据编辑器的“数据视图”中用句点表示系统缺失值。
存在很多可以帮助补偿缺失数据的影响甚至分析缺失数据模式的功能。不过,本 节的作用较为简单:用于描述“定制表”如何处理缺失数据以及缺失数据如何影响汇总统计的计算。
样本数据文件
本 节使用数据文件 missing_values.sav。请参阅样本文件主题以获取更多信息。这是一个非常简单的全人工数据文件;该文件只包含一个变量和十个个案,用于说明缺失值的基本概念。