拔靴
Bootstrap 方法可以导出稳健的标准误差估计值,并能为诸如平均值、中位数、比例、几率比、相关系数或回归系数等估计值导出置信区间。 它还可用于构建假设检验。 当参数估算方法的假设存在疑问(例如,异方差残差拟合较小样本的回归模型),参数推论无法执行或需要非常复杂的标准误差计算公式(例如,为中位数、四分位数和其他百分位数计算置信区间)时,Bootstrap 是最好的替代选项。
示例
一家电信公司每月大约会流失 27% 的客户。 为了正确实施减少客户流失的举措,管理部门需要知道这一百分比在各个预定义客户组之间是否不同。 使用 bootstrap 可以确定单一的客户流失率是否充分描述了四个主要的客户类型。
在查看员工记录时,管理部门对员工的以往工作经验比较感兴趣。 工作经验向右偏斜,这使得平均值在作为员工“典型”以往工作经验的估计方面不如中位数理想。 然而,在产品中无法获得中位数的参数置信区间。
管理部门还有兴趣使用线性模型拟合度当前和起始工资之间的差异,以确定哪些因素与员工工资上升存在关联。 在 bootstrap 线性模型时,可以使用特殊的重新抽样方法(残差和狂野 bootstrap)以获得更准确的结果。
许多过程支持 bootstrap 抽样和对 bootstrap 样本分析结果的汇聚。 指定 bootstrap 分析的控件作为公共子对话框直接集成在支持 bootstrap 的过程中。 在 bootstrap 对话框上的设置会在不同过程中保留,因此如果您通过对话框使用 bootstrap 运行频率分析,则对支持此功能的其他过程而言,bootstrap 缺省打开。
获取 bootstrap 分析
- 从菜单中,选择一个支持 bootstrap 的过程,并单击 Bootstrap。
- 选择 执行引导。
此外,您还可以控制下列选项:
样本数。 对于生成的百分位数和 BCa 区间,建议使用至少 1000 个 bootstrap 样本。 指定一个正整数。
为 Mersenne Twister 设置种子。 设置种子允许您复制分析。 使用此控件类似于将“Mersenne 扭曲器”设为活动生成器并在“随机数生成器”对话框中指定固定起始点,两者的重大差别在于在此对话框中设置种子会保留随机数生成器的当前状态并在分析完成后恢复该状态。 请参阅主题 随机数生成器 以获取更多信息。
置信区间。 指定一个大于 50 且小于 100 的置信度。 百分位数区间简单地使用对应于置信区间百分位数的有序 bootstrap 值。 例如,一个 95% 的百分位数置信区间使用 bootstrap 值的第 2.5 个和第 97.5 个百分位数作为区间的下限和上限(必要时插 bootstrap 值)。 偏差修正加速 (BCa) 区间为调整区间,它更加准确,但代价是需要更长的计算时间。
抽样。 简单方法为通过放回方式从原始数据集进行个案重新取样。 分层方法为通过放回方式从原始数据集进行个案重新取样,但在层次变量的交叉分类定义的层内。 如果层中的单元格相对均一,且不同层间的单元格相差较大,那么分层 bootstrap 抽样非常有用。
正在执行 bootstrap 粘贴 BOOTSTRAP 命令语法。