Kreuztabellen: Statistik

Chi-Quadrat. Für Tabellen mit zwei Zeilen und zwei Spalten wählen Sie Chi-Quadrat aus, um das Pearson-Chi-Quadrat, das Likelihood-Quotienten-Chi-Quadrat, den exakten Test nach Fisher und das korrigierte Chi-Quadrat nach Yates (Kontinuitätskorrektur) zu berechnen. Bei 2 × 2-Tabellen wird der exakte Test von Fisher berechnet, wenn eine Tabelle, die nicht aus fehlenden Zeilen oder Spalten in einer größeren Tabelle resultiert, eine Zelle mit einer erwarteten Häufigkeit von weniger als 5 aufweist. Das korrigierte Chi-Quadrat nach Yates wird für alle anderen 2 × 2 Tabellen berechnet. Für Tabellen mit einer beliebigen Anzahl von Zeilen und Spalten wählen Sie Chi-Quadrat aus, um das Pearson-Chi-Quadrat und das Likelihood-Quotienten-Chi-Quadrat zu berechnen. Wenn beide Tabellenvariablen quantitativ sind, ergibt Chi-Quadrat den Zusammenhangstest linear-mit-linear.

Korrelationen. Für Tabellen, in denen sowohl Zeilen als auch Spalten geordnete Werte enthalten, ergeben die Korrelationen den Korrelationskoeffizienten nach Spearman, also Rho (nur numerische Daten). Der Korrelationskoeffizient nach Spearman ist ein Zusammenhangsmaß zwischen den Rangordnungen. Wenn beide Tabellenvariablen (Faktoren) quantitativ sind, ergibt sich unter Korrelationen der Korrelationskoeffizient nach Pearson, r, der ein Maß für den linearen Zusammenhang zwischen den Variablen darstellt.

Nominal. Für nominale Daten (ohne implizierte Reihenfolge, wie beispielsweise katholisch, protestantisch, jüdisch) können Sie Kontingenzkoeffizient, Phi (Koeffizient) und Cramér-V, Lambda (symmetrische und asymmetrische Lambdas sowie Goodman-und-Kruskal-Tau) und Unsicherheitskoeffizient auswählen.

  • Kontingenzkoeffizient. Ein auf Chi-Quadrat basierendes Zusammenhangsmaß. Dieser Koeffizient liegt immer zwischen 0 und 1, wobei 0 angibt, dass kein Zusammenhang zwischen Zeilen- und Spaltenvariable besteht und Werte nahe 1 auf einen starken Zusammenhang zwischen den Variablen hindeuten. Der maximale Wert hängt von der Anzahl der Zeilen und Spalten in der Tabelle ab.
  • Phi und Cramer's V. Phi ist ein auf der Chi-Quadrat-Statistik basierendes Zusammenhangsmaß. Es ergibt sich als Quadratwurzel aus dem Quotienten aus der Chi-Quadrat-Statistik und dem Stichprobenumfang. Cramer-V ist ebenfalls ein Zusammenhangsmaß auf der Basis der Chi-Quadrat-Statistik.
  • Lambda. Ein Zusammenhangsmaß für die proportionale Fehlerreduktion, wenn Werte der unabhängigen Variablen zur Vorhersage von Werten der abhängigen Variablen verwendet werden. Der Wert 1 bedeutet, dass die abhängige Variable durch die unabhängige Variable vollständig vorhergesagt werden kann. Der Wert 0 bedeutet, dass die Vorhersage der abhängigen Variablen durch die unabhängige Variable nicht unterstützt wird.
  • Unsicherheitskoeffizient. Ein Zusammenhangsmaß, das die proportionale Fehlerreduktion angibt, wenn Werte einer Variablen zur Vorhersage von Werten der anderen Variablen verwendet werden. Ein Wert von 0,83 gibt z. B. an, dass die Kenntnis einer Variablen den Fehler bei der Vorhersage der Werte der anderen Variablen um 83 % reduziert. Das Programm berechnet beide Versionen des Unsicherheitskoeffizienten, die symmetrische und die asymmetrische.

Ordinalzahl. Für Tabellen, in denen die Zeilen und Spalten geordnete Werte enthalten, wählen Sie Gamma (nullte Ordnung für Zweifach-Tabellen und bedingt für Dreifach- bis Zehnfach-Tabellen), Kendall-Tau-b und Kendall-Tau-c aus. Zur Vorhersage von Spaltenkategorien auf der Grundlage von Zeilenkategorien wählen Sie Somers-d aus.

  • Gamma. Ein symmetrisches Maß der Assoziation zwischen zwei ordinalen Variablen, das zwischen -1 und 1 liegt. Werte, die in der Nähe eines absoluten Werts von 1 stehen, weisen auf eine starke Beziehung zwischen den beiden Variablen hin. Werte nahe 0 stehen für einen schwachen oder fehlenden Zusammenhang. Zeigt Gamma-Werte nullter Ordnung für Tabellen mit 2 Variablen an. Für Tabellen mit drei oder mehr Variablen werden bedingte Gamma-Werte angezeigt.
  • Somers ' d. Ein Maß für die Zuordnung zwischen zwei ordinalen Variablen, die von -1 bis 1 reicht. Werte, die in der Nähe des absoluten Werts 1 stehen, weisen auf eine starke Beziehung zwischen den beiden Variablen hin, und Werte, die nahe bei 0 liegen, weisen auf wenig oder keine Beziehung zwischen den Variablen hin. Somers-d ist eine asymmetrische Erweiterung von Gamma. Der Unterschied liegt in der Einbeziehung der Anzahl von Paaren, die keine Bindungen in der unabhängigen Variablen aufweisen. Eine symmetrische Version dieser Statistik wird ebenfalls berechnet.
  • Kendall-Tau-b. Ein nicht parametrisches Korrelationsmaß für ordinale Variablen oder Ränge, das Bindungen berücksichtigt. Das Vorzeichen des Koeffizienten gibt die Richtung des Zusammenhangs an und sein Betrag die Stärke; dabei entsprechen betragsmäßig größere Werte einem stärkeren Zusammenhang. Die möglichen Werte liegen im Bereich von -1 und 1, ein Wert von -1 oder +1 ergibt sich jedoch nur aus quadratischen Tabellen.
  • Kendall-Tau-c. Ein nicht parametrisches Zusammenhangsmaß für ordinale Variablen, das Bindungen ignoriert. Das Vorzeichen des Koeffizienten gibt die Richtung des Zusammenhangs an und sein Betrag die Stärke; dabei entsprechen betragsmäßig größere Werte einem stärkeren Zusammenhang. Die möglichen Werte liegen im Bereich von -1 und 1, ein Wert von -1 oder +1 ergibt sich jedoch nur aus quadratischen Tabellen.

Nominal bezüglich Intervall. Wenn eine Variable kategorial und eine andere quantitativ ist, wählen Sie Eta aus. Die kategoriale Variable muss numerisch codiert sein.

  • Eta. Ein Zusammenhangsmaß, das zwischen 0 und 1 liegt; dabei steht 0 für fehlenden Zusammenhang zwischen den Zeilen- und Spaltenvariablen und Werte nahe bei 1 geben einen starken Zusammenhang an. Eta ist geeignet für eine intervallskalierte abhängige Variable (z. B. Einkommen) und eine unabhängige Variable mit einer begrenzten Anzahl von Kategorien (z. B. Geschlecht). Es werden zwei Eta-Werte berechnet: der eine behandelt die Zeilenvariable und der andere die Spaltenvariable als Intervallvariable.

Kappa. Der Cohen-Kappa-Koeffizient misst die Übereinstimmung zwischen den Evaluierungen zweier Prüfer, wenn beide dasselbe Objekt bewerten. Der Wert 1 bedeutet perfekte Übereinstimmung. Der Wert 0 bedeutet, dass die Übereinstimmung nicht über das zufallsbedingte Maß hinausgeht. Kappa basiert auf einer quadratischen Tabelle, in der die Zeilen- und Spaltenwerte dieselbe Skala darstellen. Jeder Zelle, die Beobachtungswerte für eine Variable, aber nicht für die andere Variable aufweist, wird der Zählwert 0 zugewiesen. Kappa wird nicht berechnet, wenn der Datenspeichertyp ( Zeichenfolge oder numerisch) für die beiden Variablen nicht derselbe ist. Bei Zeichenfolgevariablen müssen beide Variablen dieselbe definierte Länge aufweisen.

Risiko. Ein Maß, das bei 2 x 2-Tabellen die Stärke des Zusammenhangs zwischen dem Vorhandensein eines Faktors und dem Auftreten eines Ereignisses misst. Wenn das Konfidenzintervall für die Statistik den Wert 1 enthält, ist nicht anzunehmen, dass zwischen Faktor und Ereignis ein Zusammenhang besteht. Das Odds-Verhältnis (Odds Ratio) kann als Schätzung für das relative Risiko verwendet werden, wenn der Faktor selten auftritt.

McNemar. Ein nicht parametrischer Test für zwei verbundene dichotome Variablen. Prüft unter Verwendung der Chi-Quadrat-Verteilung, ob Änderungen bei den Antworten vorliegen. Dieser Test ist für das Erkennen von Änderungen bei Antworten nützlich, die durch experimentelle Einflussnahme in sogenannten "Vorher-und-nachher-Designs" entstanden sind. Bei größeren quadratischen Tabellen wird der McNemar-Bowker-Test auf Symmetrie ausgegeben.

Cochran-und Mantel-Haenszel-Statistik. Die Cochran- und die Mantel-Haenszel-Statistik können verwendet werden, um auf Unabhängigkeit zwischen einer dichotomen Faktorvariablen und einer dichotomen Antwortvariablen zu testen, und zwar in Abhängigkeit von Kovariatenmustern, die durch mindestens eine Schichtvariable (Kontrollvariable) definiert werden. Beachten Sie, dass andere Statistiken schichtenweise berechnet werden, die Cochran- und die Mantel-Haenszel-Statistik dagegen einmal für alle Schichten berechnet werden.

Festlegen von Statistiken für Kreuztabellen

Für diese Funktion ist die Option "Statistics Base" erforderlich.

  1. Wählen Sie in den Menüs Folgendes aus:

    Analysieren > Deskriptive Statistiken > Kreuztabellen ...

  2. Klicken Sie im Dialogfeld "Kreuztabellen" auf Statistik.