Auswählen einer Prozedur zum Durchführen einer Clusteranalyse

Clusteranalysen können mit den Prozeduren "Two-Step-Clusteranalyse", "Hierarchische Clusteranalyse" oder "K-Means-Clusteranalyse" durchgeführt werden. In jeder Prozedur wird ein anderer Algorithmus zum Erstellen von Clustern eingesetzt, und jede Prozedur verfügt über Optionen, die in den jeweils anderen Prozeduren nicht verfügbar sind.

Two-Step-Clusteranalyse. In vielen Fällen ist die Prozedur "Two-Step-Clusteranalyse" die beste Wahl. Sie bietet die folgenden speziellen Funktionen:

  • Automatische Auswahl der optimalen Anzahl von Clustern sowie Maße, die bei der Auswahl des Clustermodells helfen
  • Gleichzeitiges Erstellen von Clustermodellen mit kategorialen und stetigen Variablen
  • Speichern des Clustermodells in einer externen XML-Datei und anschließendem Einlesen dieser Datei und Aktualisieren des Clustermodells mit neuen Daten.

Außerdem können von der Prozedur "Two-Step-Clusteranalyse" auch umfangreiche Datendateien analysiert werden.

Hierarchische Clusteranalyse. Die Prozedur "Hierarchische Clusteranalyse" ist auf kleinere Datendateien begrenzt (mehrere Hundert zu gruppierende Objekte), bietet jedoch die folgenden speziellen Funktionen:

  • Möglichkeit der Zusammenfassung von Fällen oder Variablen in Clustern
  • Funktion zum Berechnen eines Bereichs möglicher Lösungen und zum Speichern der Clusterzugehörigkeiten für jede dieser Lösungen
  • Verschiedene Methoden zur Clusterbildung, Transformation von Variablen und Messung der Unähnlichkeit zwischen Clustern

Mit der Prozedur "Hierarchische Clusteranalyse" können Intervallvariablen (stetige Variablen), Zählvariablen oder binäre Variablen analysiert werden, wobei alle für die Prozedur ausgewählten Variablen jeweils denselben Typ aufweisen müssen.

K-Means-Clusteranalyse. Die Prozedur "K-Means-Clusteranalyse" ist auf stetige Daten beschränkt 
und setzt eine Festlegung der Clusteranzahl voraus, bietet jedoch die folgenden speziellen Funktionen:

  • Funktion zum Speichern der Distanz vom Clusterzentrum für jedes Objekt
  • Fähigkeit, anfängliche Clusterzentren aus einer externen IBM® SPSS® Statistics -Datei zu lesen und endgültige Clusterzentren zu speichern.

Außerdem können von der Prozedur "K-Means-Clusteranalyse" auch umfangreiche Datendateien analysiert werden.