复杂样本的属性

复杂样本在很多方面与简单随机样本不同。在简单随机样本中,各抽样单元格是直接从整个总体中采用不放回方式以等概率 (WOR) 随机选择的。相比之下,给定的复杂样本具有以下部分或全部特征:

分层。 分层抽样在总体的非重叠子组(即层次)中独立选择样本。例如,层次可以是社会经济组、工作类别、年龄组或种族组。通过分层,可以确保子组的样本大小足够大,提高整个估计值的精确度,并在不同层次使用不同抽样方法。

聚类。 聚类抽样需要选择抽样单元格组(即聚类)。例如,聚类可以是学校、医院或地理区域,抽样单元格可以是学生、病人或市民。聚类在多阶段设计和区域(地理)样本中很常见。

多阶段。 在多阶段抽样中,应基于聚类选择第一阶段样本。然后,通过从所选聚类抽取子样本创建第二阶段样本。如果第二阶段样本是基于子聚类的,则可以向样本添加第三阶段。例如,在调查的第一阶段,可以抽取城市样本。然后,从所选城市中,可以抽取家庭样本。最后,从所选家庭中,可以对个人进行民意调查。使用抽样和分析准备向导可以在一个设计中指定三个阶段。

非随机抽样。 如果随机选择难以实现,则可以系统(以固定间隔)或顺序方式抽取单元格。

不等选择概率。 如果抽取的聚类包含的单元格数不相等,可以使用与大小成正比 (PPS) 的概率进行抽样,以使聚类的选择概率与其所含单元格的比例相等。PPS 抽样还可以使用更多一般加权设计来选择单元格。

无限制抽样。 无限制抽样以放回方式 (WR) 选择单元格。因此,单个单元格可能多次选入样本中。

抽样权重。 抽样权重是在抽取复杂样本时自动计算的,与目标总体中每个抽样单元格代表的“频率”十分一致。因此,根据样本的权重总和可以估计群体大小。复杂样本分析过程需要抽样权重以正确分析复杂样本。请注意:这些权重应该在“复杂样本”选项内使用,而不应通过“加权个案”过程用于其他分析过程,该过程将权重视为个案重复。