抽样向导:设计变量
在这一步骤中,可以选择分层变量和聚类变量,可以定义输入样本权重。还可指定阶段的标签。
分层依据。 分层变量的交叉分类定义了不同的子群体,即层次。分别为各层获取了不同的样本。要提高估计值的精确度,层中单元格的特征应尽量均一。
聚类。 聚类变量定义观察单元格组,即聚类。如果从总体直接抽取观察单元格很昂贵,或者不可能实现,就可以使用聚类;可以从总体抽取聚类,然后从所选聚类抽取观察单元格。但是,使用聚类会在抽样单元格之间引入相关性,导致精度下降。要使这种影响减到最小,聚类中的单元格的特征应尽量均一。必须至少定义一个聚类变量才能计划多阶段设计。在使用多个不同抽样方法时,聚类也是必不可少的。请参阅 抽样向导:抽样方法主题以获取更多信息。
输入样本权重。 如果当前样本设计是更大样本设计的一部分,则可以从更大样本设计的以前阶段获得样本权重。在当前设计的第一阶段,可以指定一个包含这些权重的数值型变量。对于当前设计的后续阶段,样本权重将自动计算。
阶段标签。 可为每个阶段指定一个可选的字符串标签。该标签用在输出中以帮助识别分阶段信息。
注:源变量列表的内容在所有向导步骤中都相同。换言之,在某个特定步骤中从源列表移去的变量将在所有步骤中从该列表移去。返回源列表的变量在所有步骤中都会显示在列表中。