Poziomy pomiaru
Poziom pomiaru (dawniej znany jako „typ danych” lub „typ użycia”) opisuje użycie zmiennych danych w programie IBM® SPSS Modeler. Poziom pomiaru może być określony na karcie Typy w węźle źródłowym lub w węźle typu. Można na przykład ustawić poziom pomiaru dla zmiennej całkowitej zawierającej wartości 1 i 0 jako Flaga. Zwykle oznacza to, że 1 = Prawda, a 0 = Fałsz.
Składowanie a pomiar. Należy pamiętać, że poziom pomiaru zmiennej różni się od jej typu składowania, który wskazuje, czy dane są składowane jako łańcuch, liczba całkowita, liczba rzeczywista, data, czas lub znacznik czasu. Typy danych można modyfikować w dowolnym punkcie strumienia za pomocą węzła typu, natomiast składowanie należy określić na poziomie źródła podczas wczytywania danych do programu IBM SPSS Modeler (chociaż można je później zmienić za pomocą funkcji przekształcenia). Więcej informacji można znaleźć w temacie Ustawienia składowania i formatowania zmiennej.
Niektóre węzły modelowania wskazują dozwolone typy poziomu pomiaru dla zmiennych wejściowych i przewidywanych za pośrednictwem ikon na kacie Zmienne.
Ikony poziomów pomiaru
| Ikona | Poziom pomiaru |
|---|---|
![]() |
Domyślny |
![]() |
Ilościowy |
![]() |
Jakościowy |
![]() |
Flaga |
![]() |
Nominalny |
![]() |
Porządkowy |
![]() |
Nieokreślony |
![]() |
Zbiór |
![]() |
Geoprzestrzenny |
Dostępne są następujące poziomy pomiaru:
- Domyślne Data, których typ składowania i wartości są nieznane (ponieważ przykładowo nie zostały jeszcze odczytane) są wyświetlane jako <Domyślne>.
- Ilościowy Umożliwia opisanie wartości liczbowych, takich jak zakres od 0 do 100 lub od 0,75 do 1,25. Wartość ilościowa może być liczbą całkowitą, liczbą rzeczywistą lub wartością typu data/czas.
- Jakościowy Stosowany w przypadku wartości łańcuchowych, kiedy dokładna liczba odmiennych wartości jest nieznana. Jest to nieokreślony typ danych, co oznacza, że żądne informacje na temat składowania i użycia danych nie są jeszcze znane. Po odczytaniu danych poziom pomiaru zostanie ustawiony jako Flaga, Nominalny lub Nieokreślony, w zależności od maksymalnej liczby elementów zmiennych nominalnych określonej w oknie dialogowym węzła Właściwości strumienia.
- Flaga Ten typ jest używany w przypadku danych z dwoma odmiennymi wartościami, które wskazują na obecność lub nieobecność danej cechy, np.
prawdaifałsz,TakiNielub0i1. Wartości mogą różnić się, ale jedna z nich musi być zawsze wartością "true" a druga — "false". Dane mogą być reprezentowane jako tekst, liczba całkowita, liczba rzeczywista, data, czas lub znacznik czasu. - Nominalny Służy do opisu danych z wieloma odmiennymi wartościami, a każda z nich jest traktowana jako element zbioru, np.
mała/średnia/duża. Dane nominalne mogą mieć dowolny typ składowania — numeryczny, łańcuch lub data/czas. Należy pamiętać, że ustawienie poziomu pomiaru jako Nominalny nie powoduje automatycznej zmiany wartości na składowanie łańcuchowe. - Porządkowy Służy do opisywania danych z wieloma odmiennymi wartościami, które mają dziedziczną kolejność. Przykładowo, typ danych porządkowych można przypisać do kategorii wynagrodzenia lub stopni zadowolenia. Porządek jest definiowany zgodnie z rzeczywistym porządkiem sortowania elementów danych. Przykładowo,
1, 3, 5to domyślny porządek sortowania dla zbioru liczb całkowitych, aHIGH, LOW, NORMAL(Wysoki, Niski, W normie) (rosnąco w kolejności alfabetycznej) to porządek dla zbioru łańcuchów. Porządkowy poziom pomiaru umożliwia zdefiniowanie zbioru danych jakościowych jako dane porządkowe na potrzeby wizualizacji, budowania modelu i eksportowania do innych aplikacji (takich jak IBM SPSS Statistics), które jako typ rozróżniania przyjmują dane porządkowe. Zmiennej porządkowej można użyć wszędzie tam, gdzie może być użyta zmienna nominalna. Ponadto, jako porządkowe można zdefiniować zmienne z dowolnym typem składowania (liczba rzeczywista, liczba całkowita, łańcuch, data, czas itd.). - Nieokreślony Używany w przypadku danych, które nie odpowiadają żadnemu z powyższych typów, zmiennych z pojedynczą wartością lub danych nominalnych, w których zbiór zawiera więcej elementów niż zdefiniowane maksimum. Jest również przydatny, jeśli w przeciwnym razie poziom pomiaru byłby zbiorem dowolnych elementów (np. numer konta). Po wybraniu typu Nieokreślony dla zmiennej jej rola jest automatycznie ustawiana na Brak, z opcją ID rekordów jako jedyna alternatywa. Domyślnie maksymalna wielkość zbiorów jest ustawiona na 250 unikalnych wartości. Liczbę tę można skorygować lub wyłączyć on na karcie Opcje w oknie dialogowym Właściwości strumienia, do którego można uzyskać dostęp z menu Narzędzia.
- Przedziałowy Umożliwia identyfikowanie danych zapisanych w postaci listy, które nie są danymi geoprzestrzennymi. Przedział to w rzeczywistości zmienna listy o głębokości zero, w której elementy z listy mają przypisany jeden z pozostałych poziomów pomiaru.
Aby uzyskać więcej informacji na temat list, patrz Składowanie listy i powiązane poziomy pomiaru.
- Dane geoprzestrzenne Służy do identyfikowania danych geoprzestrzennych z typem składowania Lista. Listy mogą być zmiennymi Lista liczb całkowitych lub Lista liczb rzeczywistych, a ich głębokość może być określona w przedziale od zero do dwóch włącznie.
Aby uzyskać więcej informacji, zobacz Geoprzestrzenne podpoziomy pomiarów.
Istnieje możliwość ręcznego określenia poziomów pomiaru lub można zezwolić, aby oprogramowanie odczytało dane i ustaliło poziom pomiaru na podstawie odczytanych wartości.
Alternatywnie, jeśli dostępnych jest kilka zmiennych danych ilościowych, które powinny być traktowane jako zmienne jakościowe, można wybrać opcję pozwalającą na ich przekształcenie. Więcej informacji można znaleźć w temacie Przekształcanie danych ilościowych.
Aby użyć automatycznego wpisywania
- W węźle typu lub na karcie Typy węzła źródłowego należy ustawić kolumnę Wartości na <Odczyt> dla wybranych zmiennych. Dzięki temu metadane będą dostępne dla wszystkich węzłów poniżej bieżącego. Można szybko ustawić wszystkie zmienne na <Odczyt> lub <Przepuść>, używając przycisków okularów w oknie dialogowym.
- Kliknięcie przycisku Odczytaj wartości umożliwia odczytanie wartości bezpośrednio ze źródła danych.
Aby ręcznie ustawić poziom pomiaru dla zmiennej
- Wybierz zmienną z tabeli.
- Z listy rozwijanej w kolumnie Poziom pomiaru wybierz poziom pomiaru dla zmiennej.
- Alternatywnie można użyć metody Ctrl+A lub Ctrl+kliknięcie, aby wybrać wiele zmiennych przed użyciem listy rozwijanej w celu wybrania poziomu pomiaru.








