Bootstrapping

Bootstrapping ist eine Methode zur Ableitung von robusten Schätzungen von Standardfehlern und Konfidenzintervallen für Schätzungen wie Mittelwert, Median, Anteil, Odds-Verhältnis, Korrelationskoeffizient oder Regressionskoeffizient. Es kann auch für die Konstruktion von Hypothesentests verwendet werden. Bootstrapping ist besonders als Alternative zu parametrischen Schätzungen geeignet, wenn die Annahmen dieser Methoden zweifelhaft (zum Beispiel bei Regressionsmodellen mit heteroskedastischen, auf kleine Stichproben angepassten Residuen) oder parametrische Schlussfolgerungen unmöglich sind oder äußerst komplizierte Formeln zur Berechnung von Standardfehlern erfordern (zum Beispiel bei der Berechnung von Konfidenzintervallen für den Median, Quartilen und andere Perzentilen).

Beispiele

Eine Telekommunikationsfirma verliert jeden Monat etwa 27 % ihrer Kunden durch Abwanderung. Um bei den Bemühungen zur Verringerung der Abwanderung die richtigen Schwerpunkte setzen zu können, möchte die Geschäftsleitung wissen, ob dieser Prozentsatz zwischen verschiedenen vordefinierten Kundengruppen variiert. Anhand Bootstrapping können Sie bestimmen, ob eine einzelne Abwanderungsrate die vier großen Kundentypen angemessen beschreibt.

Bei der Durchsicht von Mitarbeiterdaten ist die Geschäftsleitung an der bisherigen Arbeitserfahrung seiner Mitarbeiter interessiert. Die Arbeitserfahrung ist rechtslastig, was bedeutet, dass der Mittelwert eine weniger wünschenswerte Schätzung der "typischen" bisherigen Arbeitserfahrung unter Mitarbeitern darstellt als der Median. Für den Median im Produkt stehen jedoch keine parametrischen Konfidenzintervalle zur Verfügung.

Das Management ist ebenfalls daran interessiert zu ermitteln, welche Faktoren Gehaltserhöhungen von Mitarbeitern entsprechen, indem ein lineares Modell über die Differenz zwischen aktuellem und Anfangsgehalt erstellt wird. Beim Bootstrapping eines linearen Modells können Sie spezielle Resampling-Methoden (Residuen- und Wild-Bootstrap) verwenden, um genauere Ergebnisse zu erzielen.

Viele Prozeduren unterstützen das Ziehen von Bootstrap-Stichproben und das Pooling von Ergebnissen aus Analysen von Bootstrap-Stichproben. Steuerelemente für die Angabe von Bootstrap-Analysen sind bei Prozeduren, die Bootstrapping unterstützen, direkt als gemeinsames Unterdialogfeld enthalten. Einstellungen im Bootstrap-Dialogfeld werden für sämtliche Prozeduren beibehalten: Wenn Sie also über die Dialogfelder eine Häufigkeitsanalyse mit Bootstrapping durchführen, wird Bootstrapping standardmäßig auch für andere Prozeduren aktiviert, die es unterstützen.

Abrufen einer Bootstrap-Analyse

Wählen Sie aus den Menüs eine Prozedur aus, die Bootstrapping unterstützt, und klicken Sie auf Bootstrap.
Wählen Sie Bootstrapping durchführenaus.

Optional können Sie folgende Optionen auswählen:

Anzahl der Stichproben. Für das Perzentil und die BCa-Intervalle, die erzeugt werden, empfiehlt es sich, mindestens 1.000 Bootstrap-Stichproben zu verwenden. Geben Sie eine positive Ganzzahl ein.

Startwert für Mersenne-Twister festlegen. Wenn Sie einen Startwert festlegen, können Sie Analysen reproduzieren. Die Verwendung dieses Steuerelements gleicht der Festlegung eines Mersenne-Twisters als aktivem Generator und eines festen Startpunkts für das Dialogfeld "Zufallszahlengeneratoren", mit dem wichtigen Unterschied, dass die Festlegung des Startpunkts in diesem Dialogfeld den aktuellen Status des Zufallszahlengenerators beibehält und diesen Status nach Abschluss der Analyse wiederherstellt. Weitere Informationen finden Sie im Thema Zufallszahlengeneratoren .

Konfidenzintervalle. Geben Sie ein Konfidenzniveau größer 50 und kleiner 100 an. Perzentilintervalle verwenden einfach die Bootstrap-Werte, die den Konfidenzintervallperzentilen entsprechen. Beispielsweise verwendet ein 95-%-Konfidenzintervall die 2,5- und 97,5-Perzentile der Bootstrap-Werte als untere und obere Grenze des Intervalls (bei Bedarf werden die Bootstrap-Werte interpoliert). BCa-Intervalle (bias corrected and accelerated) sind korrigierte Intervalle, die eine höhere Genauigkeit auf Kosten einer höheren Berechnungszeit bieten.

Stichprobenziehung. Die einfache Methode ist das erneute Ziehen von Fallstichproben mit Zurücklegen aus dem ursprünglichen Dataset. Die geschichtete Methode ist das erneute Ziehen von Fallstichproben mit Zurücklegen aus dem ursprünglichen Dataset innerhalb der Schichten, die durch die Kreuzklassifikation von geschichteten Variablen definiert werden. Das geschichtete Ziehen von Bootstrap-Stichproben kann von Nutzen sein, wenn die Einheiten innerhalb der Schichten relativ homogen sind, während sich die Einheiten der einzelnen Schichten stark voneinander unterscheiden.

Hinweis: Bei aktiviertem Bootstrapping werden keine Diagramme in der Ausgabe erstellt.

Beim Bootstrapping wird BOOTSTRAP -Befehlssyntax eingefügt.