Wybieranie procedury analizy skupień

Analiza skupień może być wykonywana przy wykorzystaniu procedury Dwustopniowe grupowanie, Hierarchiczna analiza skupień lub Analiza metodą K-średnich. W każdej procedurze funkcjonuje inny algorytm tworzenia skupień, który zawiera opcje niedostępne w innych.

Dwustopniowe grupowanie. W wielu zastosowaniach Dwustopniowe grupowanie jest najodpowiedniejszą metodą analizy skupień. Posiada ona następujące cechy unikalne:

  • Automatyczne wybieranie najodpowiedniejszej liczby skupień, obok możliwości wybierania modeli skupień.
  • Możliwość jednoczesnego tworzenia modeli skupień opartych na zmiennych jakościowych i ilościowych.
  • Możliwość zapisania modelu skupień w zewnętrznym pliku XML, a następnie odczytania takiego pliku i aktualizacji modelu skupień przy wykorzystaniu nowszych danych.

Procedura Dwustopniowe grupowanie umożliwia ponadto analizowanie dużych plików danych.

Hierarchiczna analiza skupień. Procedura Hierarchiczna analiza skupień może być stosowana tylko do mniejszych plików danych (kilkaset grupowanych obiektów), lecz posiada następujące cechy unikalne:

  • Możliwość grupowania obserwacji lub zmiennych.
  • Możliwość obliczania zakresu możliwych rozwiązań i zapisywania przynależności do skupień dla każdego z takich rozwiązań.
  • Kilka metod formowania skupień, transformacji zmiennych i pomiaru niepodobieństwa pomiędzy skupieniami.

O ile zmienne są tego samego typu, procedura Hierarchiczna analiza skupień umożliwia analizę zmiennych interwałowych (ilościowych), liczebności i zmiennych binarnych.

Analiza skupień metodą k-średnich. Procedura Analiza skupień metodą k-średnich może być stosowana tylko do danych ilościowych i wymaga określenia liczby skupień z góry, lecz posiada następujące cechy unikalne:

  • Możliwość zapisania odległości od centrów skupień dla każdego obiektu.
  • Możliwość odczytywania początkowych centrów skupień i zapisywania końcowych centrów skupień do zewnętrznego pliku IBM® SPSS® Statistics .

Procedura Analiza skupień metodą k-średnich umożliwia ponadto analizowanie dużych plików danych.