ブートストラップ

ブートストラップとは、平均値、中央値、比率、オッズ比、相関係数、回帰係数などの、推定に対する標準誤差および信頼区間の頑強な推定を派生させる方法です。 これは、仮説検定の構築にも使用されることがあります。 ブートストラップは、これらの方法の仮定が不確かな場合 (不均一残差の回帰モデルに適合するサンプル数が小さい場合など)、またはパラメトリック推定が不可能であるか、標準誤差を計算するには非常に複雑な数式を必要とする場合 (中央値、4 分位、その他のパーセンタイルの信頼区間を計算する場合など) に、パラメトリック推定の代替として最も役立ちます。

ある電話会社では、毎月 27% の顧客が解約しています。 解約数の減少に向けたとりくみを適切に集中させるために、経営陣は、事前定義された顧客グループ間でこの解約率に違いがあるかどうかを知る必要があります。 ブートストラッピングを使用して、単一の解約率が 4 つの主要な顧客タイプを適切に表しているかどうかを判別できます。

従業員レコードを見直していて、経営陣は従業員の以前の業務経験に関心を持ちます。 業務経験が右肩下がりであるため、従業員の「典型的な」以前の業務経験の推定値について、平均値の方が中央値よりも適切ではなくなります。 しかし、この製品では、中央値に対してはパラメトリック信頼区間を使用できません。

経営陣は、線型モデルを現在の給与と初任給との差分に適用することで、従業員の昇給に関連付ける要素を決定することにも関心を持ちます。 ブートストラップが線型モデルのときは、特別な再サンプリング方法 (残差ブートストラップおよびワイルド・ブートストラップ) を使用して、より正確な結果を取得できます。

多くのプロシージャーが、ブートストラップのサンプリング、およびブートストラップ・サンプルの分析から得られた結果のプールをサポートしています。 ブートストラップ分析を指定するコントロールは、ブートストラップをサポートするプロシージャーの共通サブダイアログとして直接統合されています。 ブートストラップ・ダイアログの設定は、プロシージャーをまたがって持続するため、ダイアログを使用してブートストラップにより度数分析を実行すると、ブートストラップをサポートする他のプロシージャーについて、ブートストラップがデフォルトで有効になります。

ブートストラップ分析の実行

  1. メニューからブートストラップをサポートするプロシージャーを選択し、「ブートストラップ」をクリックします。
  2. 「ブートストラップの実行」を選択します。

オプションで、次のオプションを制御できます。

サンプル数。 パーセンタイル区間および BCa 区間を生成する場合、少なくとも 1000 件のブートストラップ・サンプルを使用することをお勧めします。 正の整数を指定します。

Mersenne Twister のシードを設定します。 シードを設定すると、分析を複製することができます。 このコントロールを使用すると、アクティブ・ジェネレーターとして Mersenne Twister を設定し、「乱数ジェネレーター」ダイアログの固定開始ポイントを指定した場合と同様の結果になりますが、このダイアログでシードを設定することによる大きな違いは、乱数ジェネレーターの現在の状態が保存され、分析の完了後にその状態が復元されることです。 詳しくは、 乱数ジェネレーター のトピックを参照してください。

信頼区間。 50 より大きく、100 より小さい信頼度レベルを指定してください。 パーセンタイル区間は、単に、信頼区間のパーセンタイルに応じて並べられたブートストラップ値を使用します。 例えば、95% パーセンタイルの信頼区間は、ブートストラップ値の 2.5 番目と 97.5 番目のパーセンタイルを区間の下限および上限として使用します (必要に応じて、ブートストラップ値を補間します)。 バイアス補正加速 (BCa) 区間は、区間をより正確に調整しますが、その代わり、より長い計算時間を必要とします。

サンプリング。 「単純」方式では、元のデータ・セットからの置き換えにより、ケースを再サンプリングします。 「層化」方式では、ストラータ変数の交差分類によって定義されている階層 で、元のデータ・セットからの置き換えによりケースを再サンプリングします。 層化ブートストラップ・サンプリングは、階層全体では単位が大きく異なるのに対し、階層内では単位が比較的同質である場合に役立ちます。

注: ブートストラッピングが有効になっている場合、グラフは出力に作成されません。

ブートストラップを実行すると、 BOOTSTRAP コマンド・シンタックスが貼り付けられます。