Typy pól (zmiennych)
Obok pól na liście pól widoczne są ikony określające typ pola i typ danych. Wskazują także zestawy wielokrotnych odpowiedzi.
| Poziom pomiaru | Numeryczna | Łańcuch | Data | Czas |
|---|---|---|---|---|
| Ilościowy | |
n/a | |
|
| Zbiór uporządkowany | |
|
|
|
| Ustaw: | |
|
|
|
| Typ zestawu wielokrotnych odpowiedzi | Ikona |
|---|---|
| Zestaw wielokrotnych odpowiedzi, wielokrotne kategorie | |
| Zestaw wielokrotnych odpowiedzi, wielokrotne dychotomie | |
Poziom pomiaru
Poziom pomiaru pola jest istotnym czynnikiem podczas tworzenia wizualizacji. Poniżej przedstawiony jest opis poziomu pomiaru. Klikając prawym przyciskiem myszy pole na liście pól i wybierając opcję, można tymczasowo zmienić poziom pomiaru pola. W większości przypadków trzeba rozważyć tylko dwie najszersze klasyfikacje pól: jakościowe i ilościowe:
Zmienne jakościowe. Dane posiadające ograniczoną liczbę odrębnych wartości lub kategorii (np. płeć czy religia). Zmienne jakościowe mogą być łańcuchami (alfanumerycznymi) lub polami numerycznymi, wykorzystującymi kody liczbowe reprezentujące kategorie (np. 0 = mężczyzna i 1 = kobieta). Zmienne kategorialne nazywane są również danymi jakościowymi. Zbiory, zbiory uporządkowane i flagi (przełączniki) są zmiennymi jakościowymi.
- Zbiór. Zmienna, której wartości reprezentują kategorie bez wewnętrznego rangowania; na przykład wydział, na którym są zatrudnieni pracownicy. Przykładami zmiennych nominalnych są: region, kod pocztowy lub wyznanie. Zmienne tego typu nazywane są także nominalnymi.
- Zbiór uporządkowany. Zmienna, której wartości reprezentują kategorie z wewnętrznym rangowaniem, na przykład poziomy zadowolenia z usługi – od bardzo niezadowolonego do bardzo zadowolonego. Przykładami zmiennych uporządkowanych mogą być oceny opinii reprezentujące stopień satysfakcji lub przekonania oraz oceny preferencji. Zmienne tego typu nazywane są także porządkowymi.
- Flaga. Zmienna o dwu różnych wartościach, takich jak Tak i Nie lub 1 i 2. Znana również jako zmienna dychotomiczna lub binarna.
Ciągły. Dane mierzone na skali interwałowej lub ilorazowej, których wartości określają zarówno ich porządek, jak i odległość między nimi. Na przykład roczna pensja w wysokości 72 195 PLN jest wyższa niż pensja wynosząca 52 398 PLN, a odległość między tymi dwiema wartościami wynosi 19 797 PLN. Zmienne ilościowe są również zwane danymi ilościowymi, skali lub przedziału liczbowego.
Zmienne jakościowe określają kategorie wizualizacji, zazwyczaj w celu szkicowania osobnych elementów graficznych lub grupowania elementów graficznych. Zmienne ciągłe często są podsumowywane w kategoriach zmiennych jakościowych. Na przykład domyślna wizualizacja dochodu dla kategorii płci pokazuje średni dochód kobiet i mężczyzn. Surowe wartości zmiennych ciągłych można wykreślać, jak na wykresie rozrzutu. Przykładowo wykres rozrzutu dla każdego przypadku może przedstawiać bieżące wynagrodzenia i wynagrodzenia początkowe. Aby pogrupować przypadki według płci, można użyć zmiennej jakościowej.
Typy danych
Poziom pomiaru nie jest jedyną właściwością pola, która określa jego typ. Pole jest także przechowywane jako konkretny typ danych. Do dostępnych typów danych należą łańcuchy (dane inne niż liczbowe, np. litery), wartości liczbowe (liczby rzeczywiste) i daty. W odróżnieniu od poziomu pomiaru typu danych pola nie da się tymczasowo zmienić. Należy zmienić sposób przechowywania danych w oryginalnym zbiorze danych.
Zestawy wielokrotnych odpowiedzi
Niektóre pliki danych obsługują specjalny rodzaj „pól” nazywanych zestawami wielokrotnych odpowiedzi. Zestawy wielokrotnych odpowiedzi nie są „polami” w normalnym tego słowa znaczeniu. Zestawy wielokrotnych odpowiedzi wykorzystują wiele pól do rejestracji odpowiedzi na pytania w przypadku, kiedy respondent może udzielić więcej niż jednej odpowiedzi. Są one traktowane podobnie jak zmienne jakościowe i można je, w większości przypadków, poddawać podobnym operacjom.
Zestawy wielokrotnych odpowiedzi muszą być zestawami wielokrotnych dychotomii lub zestawami wielokrotnych kategorii.
Zestaw wielokrotnych dychotomii. Zestaw wielokrotnych dychotomii składa się z wielu pól dychotomii: pól o tylko dwu możliwych wartościach wynoszących tak/nie, występuje/nie występuje, zaznaczone/niezaznaczone. Mimo że pola nie muszą być czysto dychotomiczne, wszystkie pola w zestawie są zakodowane w ten sam sposób.
Przykład: ankieta zawiera pytanie „Z których źródeł wiadomości spośród podanych poniżej korzystasz?” i pięć możliwych odpowiedzi. Respondent może wybrać kilka odpowiedzi, zaznaczając pole wyboru obok każdej z nich. Pięć odpowiedzi staje się pięcioma polami w pliku danych, gdzie 0 oznacza Nie (nie zaznaczone) a 1 oznacza Tak (zaznaczone).
Zestawy wielokrotnych kategorii. Zestaw wielokrotnych kategorii składa się z wielu pól, zakodowanych w taki sam sposób, często z wieloma kategoriami możliwych odpowiedzi. Na przykład jeden z elementów ankiety jest następujący: „Podaj maksymalnie trzy narodowości, które najlepiej opisują twoje pochodzenie etniczne”. Mogą istnieć setki możliwych odpowiedzi, jednak na potrzeby kodowania lista jest ograniczona do 40 najbardziej powszechnych narodowości, a wszystkie pozostałe należą do kategorii "inne”. W pliku danych trzy wybrane odpowiedzi stają się trzema zmiennymi, przy czym każda posiada 41 kategorii (40 zakodowanych narodowości i jedna kategoria „inne”).