Skalowanie wielowymiarowe

Skalowanie wielowymiarowe służy do znajdowania struktury w zbiorze miar odległości między poszczególnymi obiektami lub obserwacjami. Jest to możliwe dzięki przypisywaniu obserwacji do poszczególnych miejsc w przestrzeni pojęciowej (zwykle dwu- lub trójwymiarowej) w taki sposób, że odległości między punktami w przestrzeni możliwie blisko odpowiadają danym miarom nie-podobieństwa. W wielu przypadkach wymiary tej przestrzeni pojęciowej mogą być interpretowane i wykorzystywane do lepszego zrozumienia danych.

Dokonanie pomiarów zmiennych w sposób obiektywny pozwala na korzystanie ze skalowania wielowymiarowego jako metody redukcji danych (do wyliczania odległości między wieloma zmiennymi można, w razie potrzeby, posłużyć się procedurą skalowania wielowymiarowego). Skalowanie wielowymiarowe można również stosować do subiektywnych ocen niepodobieństwa między obiektami lub pojęciami. Procedura skalowania wielowymiarowego umożliwia ponadto przetwarzanie danych dotyczących niepodobieństw, pochodzących z różnych źródeł, takich jak wielu różnych ankieterów czy respondentów.

Przykład. W jaki sposób ludzie postrzegają relacje między różnego typu samochodami? Jeśli dane pochodzące od respondentów wskazują na podobieństwa między różnymi markami i modelami aut, to do identyfikacji wymiarów opisujących percepcję konsumentów wykorzystać można skalowanie wielowymiarowe. Z badania wynikać mogłoby, na przykład że cena i rozmiar auta tworzą dwuwymiarową przestrzeń, wyjaśniającą podobieństwa zgłaszane przez respondentów.

Statystyki. Dla każdego modelu danych: macierz danych, optymalnie skalowana macierz danych, obciążenie s (Younga), obciążenie (Kruskala), R kwadrat, współrzędne dla bodźców, średnią wartość obciążenia oraz R kwadrat dla każdego bodźca (modele RMDS). W przypadku modeli różnic indywidualnych (INDSCAL): wagi obiektów i wskaźnik odmienności dla każdego podmiotu. Dla każdej macierzy w replikowanym modelu skalowania wielowymiarowego: obciążenie i R kwadrat dla każdego bodźca. Wykresy: współrzędne dla bodźców (dwu- lub trójwymiarowe), wykres rozproszenia różnic-odległości.

Wymagania dotyczące danych przy skalowaniu wielowymiarowym

Dane. Jeśli dane są danymi dotyczącymi niepodobieństw, wszelkie niepodobieństwa powinny mieć postać ilościową i powinny być mierzone za pomocą tej samej metryki. Jeśli dane zawierają wiele zmiennych, zmienne mogą być danymi ilościowymi, binarnymi lub liczebnościowymi. Skalowanie zmiennych jest istotne, ponieważ różnice w skalowaniu mogą mieć wpływ na rozwiązanie. Jeżeli występują bardzo znaczne różnice w skalowaniu zmiennych (na przykład jedna zmienna jest mierzona w dolarach, a druga w latach), należy rozważyć możliwość ich standaryzacji (można to zrobić automatycznie za pomocą procedury Skalowanie wielowymiarowe).

Założenia. Procedura skalowania wielowymiarowego jest względnie wolna od założeń dystrybucyjnych. Upewnij się, by w oknie dialogowym Skalowanie wielowymiarowe: Opcje zaznaczyć odpowiedni Poziom pomiaru (porządkowy, interwałowy lub ilorazowy) tak, aby wyniki zostały obliczone poprawnie.

Procedury pokrewne. Jeśli celem jest redukcja danych, to alternatywną metodą, której można użyć w tym celu jest analiza czynnikowa, zwłaszcza kiedy czynności dotyczą zmiennych ilościowych. W razie potrzeby identyfikacji grup podobnych obserwacji, należy rozważyć uzupełnienie analizy skalowania wielowymiarowego o hierarchiczną analizę skupień lub analizę skupień metodą k-średnich.

Wykonywanie analizy skalowania wielowymiarowego

Ta zmienna wymaga opcji Statistics Base.

  1. Z menu wybierz:

    Analiza > Skala > Skalowanie wielowymiarowe ...

  2. Wybierz co najmniej cztery zmienne numeryczne do analizy.
  3. W grupie Odległości wybierz opcję Dane to odległości albo Utwórz odległości na podstawie danych.
  4. Jeśli wybierzesz opcję Utwórz odległości na podstawie danych, można również dodać również wybrać zmienną grupującą dla oddzielnych macierzy. Zmienna grupująca może być numeryczna lub łańcuchowa.

Opcjonalnie można również wykonać następujące czynności:

  • Określić kształt macierzy odległości, gdy dane są odległościami.
  • Określić miarę odległości, która będzie używana do tworzenia odległości na podstawie danych.

Ta procedura służy do wkleiania składni komendy ALSCAL .