regresja liniowa
Regresja liniowa służy oszacowaniu współczynników równania liniowego wymagającego co najmniej jednej zmiennej niezależnej, które najlepiej przybliża wartość zmiennej zależnej. Na przykład na podstawie zmiennych niezależnych, takich jak wiek, wykształcenie, lata pracy można próbować prognozować wartość rocznej sprzedaży przez danego sprzedawcę (zmienną zależną).
Przykład. Czy liczba meczy wygranych w ciągu sezonu przez drużynę koszykarską jest związana ze średnią liczbą punktów zdobywanych przez tę drużynę w jednym meczu? Wykresy rozrzutu wykazują, że te zmienne są ze sobą liniowo związane. Podobnie, liniowo związane są: liczba wygranych meczy oraz liczba punktów zdobywanych przez przeciwnika. Te zmienne posiadają relację ujemną. Jeśli liczba wygranych meczy rośnie, średnia liczba punktów zdobytych przez przeciwnika maleje. Dzięki regresji liniowej można stworzyć model relacji pomiędzy tymi zmiennymi. Dobry model pozwoli przewidzieć ile meczy zostanie wygranych przez poszczególne drużyny.
Statystyki. W przypadku każdej zmiennej: liczba ważnych obserwacji, średnia i odchylenie standardowe. Dla każdego modelu: współczynniki regresji, macierz korelacji, korelacje semicząstkowe i cząstkowe, wielokrotne R, R 2, skorygowane R 2, zmiana w R 2, standardowy błąd oszacowania, tabela analizy wariancji powtarzanych pomiarów, tabela analizy wariancji, wartości przewidywane oraz reszty. Ponadto dla każdego współczynnika regresji przedziały ufności 95%, macierz wariancji i kowariancji, czynnik nadmiaru wariancji, tolerancja, test Durbina-Watsona, miary odległości (Mahalanobisa, Cooka oraz wartości wpływu), DfBeta, DfFit, przedziały predykcji oraz informacje diagnostyczne obserwacji. Wykresy: wykresy rozproszenia, wykresy cząstkowe, histogramy oraz normalne wykresy prawdopodobieństwa.
Wymagania dotyczące danych w regresji liniowej
Dane. Zmienne zależne i niezależne powinny być zmiennymi ilościowymi. Zmienne kategorialne, jak na przykład religia, główny przedmiot studiów, miejsce zamieszkania muszą być zakodowane w zmiennych binarnych (sztucznych) lub innych zmiennych kontrastowych.
Założenia. Dla każdej wartości zmiennej niezależnej rozkład zmiennej zależnej musi być normalny. Wariancja rozkładu zmiennej zależnej powinna być stała dla wszystkich wartości zmiennej niezależnej. Relacja między zmienną zależną a każdą zmienną niezależną powinna być liniowa, a wszystkie obserwacje powinny być niezależne.
Wykonywanie analizy regresji liniowej
Ta zmienna wymaga opcji Statistics Base.
- Z menu wybierz:
- W oknie dialogowym Regresja liniowa wybierz numeryczną zmienną zależną.
- Wybierz co najmniej jedną numeryczną zmienną niezależną.
Opcjonalnie można wykonać następujące czynności:
- Pogrupuj zmienne niezależne w bloki oraz określ metody wprowadzania dla poszczególnych podzbiorów zmiennych.
- Wybierz zmienną filtrującą, w celu ograniczenia analizy do podzbioru obserwacji zawierających określone wartości tej zmiennej.
- Wybierz zmienną opisu obserwacji w celu identyfikacji punktów na wykresach.
- Wybierz zmienną numeryczną WNK Waga na potrzeby analizy metodą ważonych najmniejszych kwadratów.
WLS. Pozwala na uzyskanie modelu ważonych najmniejszych kwadratów. Wartości analizowanych zmiennych są tu ważone przez odwrotność ich wariancji. Oznacza to, że obserwacje o dużej wariancji będą miały mniejszy wpływ na wyniki analizy niż obserwacje powiązane z małą wariancją. Jeśli wartość zmiennej ważącej wynosi zero, jest ujemna lub jest brakującą wartością to dana obserwacja zostaje wyłączona z analizy.
Ta procedura służy do wkleiania składni komendy REGRESSION .