Korrespondenzanalyse
Eine Korrespondenztabelle ist eine bidirektionale Tabelle, deren Zellen eine gewisse Messung der Übereinstimmung zwischen den Zeilen und den Spalten enthalten. Das Korrespondenzmaß kann ein beliebiger Hinweis auf Ähnlichkeit, Affinität, Verwirrung, Assoziation oder Interaktion zwischen Zeilen-und Spaltenvariablen sein. Ein sehr häufiger Typ von Korrespondenztabelle ist eine Kreuztabelle, bei der die Zellen Häufigkeitszähler enthalten.
Weitere Informationen finden Sie unter Professional Edition>Kategorien >Korrespondenzanalyse
Solche Tabellen können leicht mit der Prozedur "Kreuztabellen" abgerufen werden. Eine Kreuztabelle liefert jedoch nicht immer ein klares Bild der Art der Beziehung zwischen den beiden Variablen. Dies gilt insbesondere, wenn die relevanten Variablen nominal sind (ohne inhärente Ordnung oder Rang) und zahlreiche Kategorien enthalten. Die Kreuztabelle kann Ihnen mitteilen, dass sich die beobachteten Zellenhäufigkeiten signifikant von den erwarteten Werten in einer 10 x 9-Kreuztabelle mit Belegung und Frühstückscerealienunterscheiden, aber es kann schwierig sein zu erkennen, welche Berufsgruppen einen ähnlichen Geschmack haben oder was dieser Geschmack ist.
Mit der Korrespondenzanalyse können Sie die Beziehung zwischen zwei nominalen Variablen in einem mehrdimensionalen Raum grafisch untersuchen. Es berechnet Zeilen-und Spaltenscores und erzeugt Diagramme auf der Basis der Scores. Kategorien, die einander ähnlich sind, erscheinen in den Diagrammen nahe beieinander. Auf diese Weise können Sie leicht erkennen, welche Kategorien einer Variablen einander ähnlich sind oder welche Kategorien der beiden Variablen zusammengehören. Mit der Prozedur "Korrespondenzanalyse" können Sie zusätzliche Punkte in den durch die aktiven Punkte definierten Bereich einpassen.
Wenn die Reihenfolge der Kategorien nach ihren Scores unerwünscht oder kontraintuitiv ist, können Einschränkungen für die Reihenfolge auferlegt werden, indem die Scores für einige Kategorien auf gleich beschränkt werden. Angenommen, Sie erwarten, dass die Variable Rauchverhaltenmit den Kategorien none, light, mediumund heavyScores aufweisen, die dieser Reihenfolge entsprechen. Wenn die Analyse jedoch die Kategorien Keine, Licht, schwerund Mittelordnet, behält die Reihenfolge der Scores für schwer und Mittel die Reihenfolge der Kategorien in ihren Scores bei.
Die Interpretation der Korrespondenzanalyse nach Distanzen hängt von der verwendeten Normalisierungsmethode ab. Die Prozedur "Korrespondenzanalyse" kann verwendet werden, um entweder die Differenzen zwischen Kategorien einer Variablen oder die Differenzen zwischen Variablen zu analysieren. Bei der Standardnormalisierung werden die Unterschiede zwischen den Zeilen-und Spaltenvariablen analysiert.
Der Algorithmus für die Korrespondenzanalyse ist für viele Arten von Analysen geeignet. Die Zentrierung der Zeilen und Spalten und die Verwendung von Chi-Quadrat-Distanzen entspricht der Standardkorrespondenzanalyse. Die Verwendung alternativer Zentrieroptionen in Kombination mit euklidischen Distanzen ermöglicht jedoch eine alternative Darstellung einer Matrix in einem niedrigdimensionalen Raum.
Drei Beispiele werden vorgestellt. Die erste verwendet eine relativ kleine Korrespondenztabelle und veranschaulicht die Konzepte, die der Korrespondenzanalyse inhärent sind. Das zweite Beispiel zeigt eine praktische Marketinganwendung. Im letzten Beispiel wird eine Tabelle mit Distanzen in einem multidimensionalen Skalierungsansatz verwendet.