层的样本大小

提取分层样本时,缺省选项是对每个层中相同比例的记录和聚类进行抽样。例如,如果某个组的数目超出另一个组数目的 3 倍,那么通常希望在样本中保留同一比率。但如果不是这种情况,那么可以为每个层单独指定样本大小。

“层的样本大小”对话框列出了层字段的每个值,您可以覆盖层的缺省值。如果选择了多个层字段,那么将列出每个可能的值组合,这样您可以指定具体的大小,例如每个城市内每一种族组的大小,或每个县内的每个镇的大小。可以将大小指定为比例或计数,具体取决于“样本”节点中现有设置。

指定层的样本大小

  1. 在“样本”节点,选择复杂,然后选择一个或多个层字段。有关更多信息,请参阅聚类和分层设置主题。
  2. 选择自定义,然后选择指定大小
  3. 在“层的样本大小”对话框中,单击左下角的读取值按钮填充屏幕。如有必要,您可能需要在上游源节点或“类型”节点中实例化值。有关更多信息,请参阅什么是实例化?主题。
  4. 单击任意一行以覆盖该层的缺省大小。

有关样本大小的注意事项

例如,如果不同的层具有不同的方差,为了使样本大小与标准差成比例,定制样本大小可能会十分有用。(如果层中的观测值变化比较大,则需要抽样更多的观测值以获得具有代表性的样本。)或者层比较小,而您可能想要使用更大的样本比例以确保将观测值的最小数包含在内。

注意:如果按包含缺失值(空值或系统缺失值、空字符串、空白以及空值或用户定义的缺失值)的字段进行分层,那么无法为层指定定制样本大小。当按包含缺失值或空白值的字段进行分层时,如果要使用定制样本大小,那么需要在上游进行填写。