Regresja liniowa: Metody wyboru zmiennych

Wybór metody pozwala na określenie w jaki sposób zmienne niezależne będą wprowadzane do analizy. Korzystając z różnych metod, dla jednego zbioru zmiennych można skonstruować wiele modeli regresji.

  • Wprowadź (Regresja). Procedura doboru zmiennych, w której wszystkie zmienne z bloku są jednocześnie wprowadzane do analizy.
  • Krokowa. W każdym kroku analizy do modelu dołączana jest zmienna niezależna, nie będąca jeszcze w równaniu, o najmniejszym prawdopodobieństwie odpowiadającym F, o ile to prawdopodobieństwo jest dostatecznie małe. Zmienne uwzględnione już w równaniu regresji zostają z niego usunięte, jeśli związane z nimi prawdopodobieństwo F staje się dostatecznie duże. Procedura kończy się, kiedy nie da się wykluczyć ani dołączyć żadnej zmiennej.
  • Usuń. Procedura doboru zmiennych, w której wszystkie zmienne z bloku są jednocześnie wprowadzane do analizy.
  • Eliminacja wsteczna. Procedura doboru zmiennych, w której wszystkie zmienne zostają wprowadzone do równania, a następnie są kolejno usuwane. Zmienna o najmniejszej korelacji cząstkowej ze zmienną zależną jest brana pod uwagę do usunięcia w pierwszej kolejności. Jeśli spełnia kryteria eliminacji, zostaje usunięta. Po usunięciu pierwszej zmiennej, kolejną braną pod uwagę do usunięcia jest ta zmienna pozostająca w równaniu, która ma najmniejszą korelacją cząstkową ze zmienną zależną. Procedura kończy działanie, gdy w równaniu nie występują inne zmienne spełniające kryteria usunięcia.
  • Wybór do przodu. Sekwencyjna procedura doboru zmiennych, w której zmienne są kolejno wprowadzane do modelu. Jako pierwsza rozważana jest ta zmienna, która jest najsilniej skorelowana ze zmienną zależną. Jest ona wprowadzana do modelu tylko wtedy, gdy spełnia kryterium wprowadzenia. Po wprowadzeniu pierwszej zmiennej pod uwagę brana jest ta zmienna nie wprowadzona do równania, która ma największą wartość współczynnika korelacji cząstkowej ze zmienną zależną. Procedura kończy działanie, gdy nie ma już żadnych zmiennych spełniających kryterium wprowadzenia.

Wartości istotności wyników zależą od dopasowania pojedynczego modelu. Z tego względu, jeśli stosowana jest metoda krokowa (krokowa, eliminacji wstecznej lub selekcji postępującej) wartości istotności są zazwyczaj niepoprawne.

Niezależnie od wybranej metody wprowadzania wszystkie zmienne, aby były wprowadzone do równania, muszą spełniać kryteria tolerancji. Domyślnym poziomem tolerancji jest 0,0001. Zmienna nie jest wprowadzana także, kiedy jej wprowadzenie spowodowałoby spadek tolerancji innej zmiennej już uwzględnionej w modelu poniżej kryterium tolerancji.

Wszystkie wybrane zmienne niezależne są dodawane do jednego modelu regresji. Można jednak również określić różne metody wprowadzania dla różnych podzbiorów zmiennych. Na przykład jeden blok zmiennych można wprowadzić do modelu regresji przy użyciu selekcji krokowej, a drugi za pomocą selekcji postępującej. Aby do modelu regresji dodać drugi blok zmiennych, kliknij przycisk Dalej.