Efektywność analizy skupień metodą k-średnich

Komenda analizy skupień metodą k-średnich jest efektywna głównie dlatego, że nie wylicza odległości pomiędzy wszystkimi parami obserwacji, jak dzieje się to w przypadku wielu innych algorytmów wykorzystywanych w analizie skupień, włączając w to algorytmy wykorzystywane przez komendę hierarchicznej analizy skupień.

Dla uzyskania maksymalnej efektywności należy posłużyć się próbą obserwacji i zastosować metodę Iteracja i klasyfikacja w celu ustalenia centrów skupień. Zaznacz opcję Zapisz ostatecznie jako. Następnie przywróć cały plik danych i wybierz opcję Tylko klasyfikacja jako metodę i wybierz opcję Wczytaj wstępne z aby sklasyfikować całego pliku przy użyciu centów, które są oszacowane z próby. Można zapisywać i odczytywać plik i zbiór danych. Zbiory danych są dostępne do późniejszego użytku w tej samej sesji lecz nie są zapisywane jako pliki, jeśli nie zostaną wprost zapisane pod koniec sesji. Nazwy zbiorów danych muszą być zgodne z regułami nazewnictwa zmiennych. Więcej informacji można znaleźć w temacie Nazwy zmiennych .