Tabele krzyżowe

Ta zmienna wymaga opcji Statistics Base.

Procedura Tabele krzyżowe pozwala tworzyć tabele drugiego rzędu i tabele wielu rzędów, a także udostępnia wiele testów i miar powiązania dla tabel drugiego rzędu. Struktura tabeli oraz fakt, czy kategorie są uporządkowane, decyduje o tym, którego testu lub miary należy użyć.

Z wyjątkiem cząstkowych współczynników gamma, statystyki tabel krzyżowych i miary związku są obliczane niezależnie dla każdej tabeli dwuwymiarowej. Po zdefiniowaniu zawartości wierszy, kolumn i warstw (zmienna sterująca) procedura tabeli krzyżowej tworzy odrębny zestaw powiązanych statystyk i miar dla każdego czynnika definiującego warstwę (lub dla każdej kombinacji wartości dwóch lub większej liczby zmiennych sterujących). Na przykład jeśli płeć jest czynnikiem definiującym warstwę w tabeli przedstawiającej zależność zmiennej zamężna/żonaty (tak, nie) od zmiennej jakość życia (bardzo ciekawe, spokojne, nudne), to wyniki dla tabeli drugiego rzędu dla kobiet są obliczane oddzielnie od tych dla mężczyzn i przedstawione jako panele umieszczone jeden po drugim.

Przykład. Czy klienci pochodzący z małych firm mogą przynosić więcej zysków przy sprzedaży usług (takich jak szkolenia i doradztwo) niż klienci z dużych firm? Z tabeli krzyżowej można się przekonać, że większość małych firm (poniżej 500 zatrudnionych) daje wysoką zyskowność sprzedaży usług, natomiast większość dużych firm (więcej niż 2 500 zatrudnionych) daje niską zyskowność.

Statystyki i miary siły powiązania. Test chi-kwadrat Pearsona, iloraz wiarygodności chi-kwadrat, test powiązania liniowego, test dokładny Fishera, chi-kwadrat z poprawką Yatesa, współczynnik r Pearsona, współczynnik rho Spearmana, współczynnik kontyngencji, phi, V Craméra, współczynniki lambda symetryczne i asymetryczne, współczynniki tau Goodmana i Kruskala, współczynnik niepewności, gamma, współczynnik d Somersa, tau-b Kendalla, tau-c Kendalla, eta, kappa Cohena, oszacowanie ryzyka względnego, iloraz szans, test McNemara, statystyki Cochrana i Mantela-Haenszela oraz statystyki dla proporcji kolumnowych.

Wymagania dotyczące danych w tabelach krzyżowych

Dane. Do definiowania kategorii poszczególnych zmiennych w tabeli należy się posłużyć wartością numeryczną lub łańcuchową (osiem lub mniej bajtów). Na przykład dla zmiennej płeć można zakodować dane jako 1 i 2 lub jako mężczyzna i kobieta.

Założenia. Niektóre statystyki i miary zakładają, że kategorie są uporządkowane (dane porządkowe) lub że wartości są wartościami ilościowymi (dane przedziałowe lub ilorazowe), jak opisano w podrozdziale poświęconym statystyce. Inne jednak dadzą prawidłowe wyniki, gdy kategorie zmiennych w tabeli nie są uporządkowane (dane nominalne). Dla statystyk opartych na chi-kwadrat (phi, V Cramér i współczynnik kontyngencji) dane powinny być losową próbą o rozkładzie wielomianowym.

Uwaga: zmienne porządkowe mogą zawierać kody liczbowe, reprezentujące kategorie (na przykład 1 = niski, 2 = średni, 3 = wysoki) lub wartości łańcuchowe. Jednak zakłada się, że porządek alfabetyczny wartości łańcuchowych odzwierciedla rzeczywiste uporządkowanie kategorii. Na przykład zmiennej łańcuchowej o wartościach mało, średnio i dużo domyślnie przypisywany jest błędny porządek: dużo, mało i średnio. Zasadniczo lepiej jest stosować kody numeryczne do reprezentacji danych porządkowych.

Otrzymywanie tabeli krzyżowej

Ta zmienna wymaga opcji Statistics Base.

Z menu wybierz:
Analiza > Statystyki opisowe > Tabele krzyżowe ...
Wybierz jedną lub więcej zmiennych w wierszach i jedną lub więcej zmiennych w kolumnach.

Opcjonalnie można wykonać następujące czynności:

Wybierz jedną lub więcej zmiennych sterujących.
Kliknij przycisk Statystyki, aby określić testy i pomiary sił powiązania dla tabel drugiego rzędu lub podtabel.
Kliknij przycisk Komórki, aby określić zestawienie wartości obserwowanych lub oczekiwanych, udziałów procentowych i reszt.
Kliknij przycisk Format, aby określić porządek kategorii.

Ta procedura służy do wkleiania składni komendy CROSSTABS .