Exemple : Boîtes à moustaches

Une boîte à moustaches est un autre graphique utile pour la visualisation de la distribution des données. Une boîte à moustaches contient plusieurs mesures statistiques que nous allons explorer après avoir créé la visualisation.

Remarque : Cet exemple utilise Employee data.

  1. A partir des menus, sélectionnez :

Graphiques > Sélecteur de modèles de représentations graphiques...

  1. Dans l'onglet Basique, sélectionnez sexe et salaire . (Utilisez la combinaison Ctrl+clic pour sélectionner plusieurs champs/variables.)
  2. Sélectionnez Boîte à moustaches.
  3. Cliquez sur OK.
Figure 1. Boîtes à moustaches
Boîtes à moustaches

Etudions les différentes parties de la boîte à moustaches :

  • La ligne sombre au milieu des boîtes est la médiane du salaire. La moitié des observations /lignes a une valeur supérieure à la médiane, et la moitié a une valeur inférieure. Comme la moyenne, la médiane est une mesure de la tendance centrale. Contrairement à la moyenne, elle est moins influencée par les observations/lignes avec des valeurs extrêmes. Dans cet exemple, la médiane est inférieure à la moyenne (comparez à Exemple : Graphique à barres avec statistique récapitulative). Le fait que la moyenne et la médiane soient différentes indique qu'il existe quelques observations/lignes avec des valeurs extrêmes qui élèvent la moyenne. Autrement dit, il existe quelques employés qui gagnent des salaires élevés.
  • Le bas de la boîte indique le 25e percentile. Vingt-cinq pour cent des observations/lignes ont des valeurs au-dessous du 25e percentile. Le haut de la boîte indique le 75e percentile. Vingt-cinq pour cent des observations/lignes ont des valeurs au-dessus du 75e percentile. Cela signifie que 50 % des observations/lignes sont situées dans la boîte. La boîte est beaucoup plus petite pour les femmes que pour les hommes. Ceci indique que le salaire varie moins pour les femmes que pour les hommes. Le haut et le bas de la boîte sont souvent appelés charnières.
  • Les barres en T qui partent des boîtes sont appelées limites internes ou moustaches. Elles s'étendent jusqu'à 1,5 fois la hauteur de la zone ou, si aucune observation/ligne n'a une valeur comprise dans cette plage, jusqu'aux valeurs minimum ou maximum. Si les données sont distribuées normalement, environ 95 % des données doivent être situées entre les limites internes. Dans cet exemple, les limites internes sont moins étendues pour les femmes que pour les hommes, ce qui constitue une autre indication que le salaire varie moins pour les femmes que pour les hommes.
  • Les points sont des valeurs extrêmes. Il s'agit de valeurs qui n'entrent pas dans les limites internes. Les valeurs extrêmes sont des valeurs aberrantes. Les astérisques ou les étoiles sont des valeurs extrêmes et éloignées. Elles représentent des observations/lignes qui ont des valeurs égales à plus de trois fois la hauteur des boîtes. Il existe plusieurs valeurs extrêmes pour les femmes et les hommes. Souvenez-vous que la moyenne est supérieure à la médiane. La moyenne est plus élevée du fait de ces valeurs extrêmes.