Esempio: Grafico a scatole

I grafici a scatole rappresentano un altro utile metodo di visualizzazione della distribuzione dei dati. Un grafico di questo tipo contiene svariate misure statistiche che verranno discusse dopo aver preparato un esempio.

Nota: questo esempio utilizza Employee data.

  1. Dai menu, scegliere:

Grafici > Selezione modello lavagna grafica ...

  1. Nella scheda Base, selezionare sesso e stipendio . Premere CTRL facendo clic con il pulsante sinistro del mouse per selezionare più campi/variabili.
  2. Selezionare Grafico a scatole.
  3. Fare clic su OK.
Figura 1. Grafico a scatole
Grafico a scatole

È giunto il momento di esaminare le varie parti del grafico a scatole:

  • La linea scura al centro delle scatole è la mediana dello stipendio. Il 50% dei casi/delle righe ha un valore maggiore rispetto alla mediana, l'altro 50% un valore minore. Così come la media, anche la mediana è una misura di tendenza centrale, con la differenza che è meno influenzata da casi/righe con valori estremi. In questo esempio, la mediana è più bassa della media (confrontare con Esempio: grafico a barre con statistica di riepilogo ). La differenza tra media e mediana indica la presenza di alcuni casi/alcune righe con valori estremi che innalzano la media. In altri termini, c'è qualche dipendente con stipendi elevati.
  • La parte inferiore della scatola indica il 25° percentile. Il 25% dei casi/delle righe mostra valori al di sotto del 25° percentile. La parte superiore della scatola rappresenta il 75° percentile. Il 25% dei casi/delle righe mostra valori al di sopra del 75° percentile. Ciò significa che il 50% dei casi/delle righe rientra all'interno della scatola. Quest'ultima risulta molto più corta per le donne, il che fa pensare che lo stipendio presenti meno variazioni per le donne rispetto a quello che avviene per gli uomini. Spesso la parte superiore e quella inferiore della scatola vengono denominate cardini.
  • Le barre a T che si diramano dalle scatole sono dette recinzioni interne o baffi. Si estendono per 1,5 volte l'altezza della scatola oppure, se nell'intervallo non sono presenti casi/righe con valori assegnati, fino ai valori minimi o a quelli massimi. Se i dati hanno una distribuzione normale, si prevede che circa il 95% di essi sia compreso tra le recinzioni interne. In questo esempio, le recinzioni interne hanno un'estensione minore per le donne, un ulteriore indizio che lo stipendio varia meno per le donne che per gli uomini.
  • I punti sono valori anomali, che cioè non rientrano nelle recinzioni interne. I valori anomali sono valori estremi. Gli asterischi o le stelle sono valori anomali estremi e rappresentano casi/righe con valori che superano di tre volte l'altezza delle scatole. Sono presenti numerosi valori anomali sia per le donne sia per gli uomini. È opportuno ricordare che la media è maggiore della mediana proprio a causa di questi valori anomali.