Wprowadzenie do metody bootstrap

Gdy zbieramy dane, często interesują nas właściwości populacji, z której próba została wybrana. Możemy wyciągać wnioski dotyczące tej populacji na podstawie oszacowań obliczonych z próby. Na przykład, jeśli zbiór danych Employee data.sav dołączony do produktu jest losową próbą wybraną z większej populacji pracowników, to średnia wartości Current salary (Obecne wynagrodzenie) w próbie równa 34 419,57 USD jest oszacowaniem średniego obecnego wynagrodzenia w populacji pracowników. Ponadto oszacowanie ma błąd standardowy równy 784 311 USD dla próby o rozmiarze 474, zatem 95% przedział ufności dla średniego obecnego wynagrodzenia w populacji pracowników wynosi od 32 878,40 do 35 960,73 USD. Pytanie, na ile niezawodne są te estymatory? Gdy populacja jest „znana”, a parametry mają optymalną charakterystykę, wiemy całkiem dużo o właściwościach oszacowań próby i możemy zaufać tym wynikom. Metoda bootstrap służy do ujawniania dodatkowych informacji o właściwościach estymatorów „nieznanych” populacji z parametrami o nieoptymalnej charakterystyce.

Jak działa metoda bootstrap

W najprostszej postaci ze zbioru danych z rozmiarem próby N wybieramy ze zwracaniem B prób „bootstrapowych” o rozmiarze N i obliczamy estymator dla każdej z tych B prób bootstrapowych. Tych B oszacowań bootstrapowych stanowi próbę o rozmiarze B, z której możemy wnioskować o estymatorze. Na przykład, jeśli weźmiemy 1000 prób bootstrapowych ze zbioru danych Employee data.sav, to szacowany błąd standardowy metody bootstrap równy 776,91 USD dla średniej z próby Obecnego wynagrodzenia jest alternatywą do oszacowania równego 784,311 USD.

Ponadto metoda bootstrap umożliwia wyznaczenie błędu standardowego i przedziału ufności mediany, dla której nie są dostępne oszacowania parametryczne.

Obsługa metody bootstrap w produkcie

Metoda bootstrap jest uwzględniona jako podrzędne okno dialogowe w procedurach, w których może być stosowana. Informacje o tym, które procedury obsługują operację bootstrap, zawiera sekcja Procedury, które obsługują operację bootstrapping .

Gdy użytkownik żąda użycia metody bootstrap w oknach dialogowych, oprócz zwykłych komend generowanych przez okno dialogowe wklejana jest nowa, odrębna komenda BOOTSTRAP. Komenda BOOTSTRAP tworzy próby bootstrapowe zgodnie ze specyfikacją określoną przez użytkownika. Oprogramowanie wewnętrznie traktuje te próby bootstrapowe jako podzbiory, mimo że nie są jawnie prezentowane w Edytorze danych. Oznacza to, że wewnętrznie istnieje efektywnie B*N obserwacji, zatem podczas stosowania metody bootstrap licznik obserwacji na pasku stanu będzie liczył od 1 do B*N. System zarządzania wynikami zbiera wyniki analizy każdego „podzbioru bootstrap”. Wyniki metody bootstrap są zbierane i prezentowane w oknie raportu razem z pozostałymi wynikami generowanymi przez procedurę. W niektórych przypadkach mogą pojawić się odniesienia do „podzbioru bootstrap 0”; jest to pierwotny zbiór danych.

Uwaga: Wykresy nie są generowane w danych wyjściowych, gdy jest włączone ładowanie bootstrapowa.