Przykład: Wykres skrzynkowy

Wykres skrzynkowy to kolejny sposób wizualizacji przydatny do sprawdzania rozkładu danych. Wykres skrzynkowy zawiera kilka miar statystycznych, które przeanalizujemy po utworzeniu wizualizacji.

Uwaga: w tym przykładzie używane są dane pracownika.

  1. Z menu wybierz:

Wykresy > Selektor szablonu wizualizacji danych ...

  1. Na karcie Opcje podstawowe wybierz opcję płeć i wynagrodzenie . (aby zaznaczyć wiele elementów pól/zmiennych, kliknij je, trzymając wciśnięty klawisz Ctrl).
  2. Wybierz opcję Wykres skrzynkowy.
  3. Kliknij przycisk OK.
Wykres 1. Wykres skrzynkowy
Wykres skrzynkowy

Przeanalizujmy różne części wykresu skrzynkowego:

  • Ciemna linia po środku prostokątów to mediana wynagrodzenia. Połowa obserwacji/wierszy ma wartość wyższą niż mediana, druga połowa zaś wartość niższą. Podobnie jak średnia, mediana jest miarą tendencji centralnej. W odróżnieniu od średniej, w mniejszym stopniu wpływają na nią obserwacje/wiersze o wartościach skrajnych. W tym przykładzie mediana jest niższa od średniej (porównaj z Przykład: Wykres słupkowy ze statystyką podsumowaną ). Różnica między średnią a medianą oznacza, że istnieje kilka obserwacji/wierszy z wartościami skrajnymi, które podnoszą wartość średniej. Oznacza to, że istnieje kilku pracowników, którzy otrzymują wysokie wynagrodzenia.
  • Dolna krawędź prostokąta oznacza 25. percentyl. Dwadzieścia pięć procent obserwacji/wierszy ma wartości poniżej 25. percentyla. Górna krawędź prostokąta oznacza 75. percentyl. Dwadzieścia pięć procent obserwacji/wierszy ma wartości powyżej 75. percentyla. Oznacza to, że 50% obserwacji/wierszy leży w obrębie prostokąta. Prostokąt jest znacznie niższy w przypadku kobiet niż w przypadku mężczyzn. Jest to jeden z czynników wskazujących na to, że wynagrodzenie kobiet jest mniej zróżnicowane niż wynagrodzenie mężczyzn. Górna i dolna część prostokąta często określane są mianem zawiasów.
  • Słupki w kształcie litery T, które wystają poza prostokąty, to ogrodzenia wewnętrzne lub wąsy. Ich wysokość jest równa 1,5 wysokości prostokąta lub, jeśli żadna obserwacja/żaden wiersz nie ma wartości w tym przedziale, wartości minimalnej albo maksymalnej. Jeśli dane mają rozkład normalny, oczekuje się, że około 95% danych znajdzie się między ogrodzeniami wewnętrznymi. W tym przykładzie ogrodzenia wewnętrzne wystają mniej w przypadku kobiet niż u mężczyzn, co także wskazuje na mniejsze zróżnicowanie wynagrodzenia kobiet niż mężczyzn.
  • Punkty to wartości skrajne. Definiuje się je jako wartości, które nie mieszczą się w ogrodzeniach zewnętrznych. Wartości skrajne to wartości ekstremalne. Gwiazdki oznaczają ekstremalne wartości skrajne. Reprezentują one obserwacje/wiersze, których wartości ponadtrzykrotnie przekraczają wysokość prostokątów. Zarówno w przypadku mężczyzn, jak i kobiet istnieje kilka wartości skrajnych. Należy pamiętać, że średnia jest wyższa od mediany. O wysokości średniej decydują właśnie te wartości skrajne.