例: 箱ひげ図
箱ひげ図も、データがどのように分布しているかを表示するための、役立つ視覚化です。箱ひげ図には、視覚化の作成後に説明するいくつかの統計指標が含まれています。
注: この例では、従業員データ を使用します。
- メニューから次の項目を選択します。
- 「基本」タブで、genderおよび salary を選択します。 (複数のフィールド/変数を選択するには、Ctrl を押しながらクリックします)。
- 「箱ひげ図」を選択します。
- 「OK」をクリックします。

以下に、箱ひげ図の各種部分について説明します。
- 箱の中央にある暗い線は、salary の中央値です。 ケース/行の半数は、中央値より大きい値であり、半数は小さい値です。平均値と同様に、中央値は中心傾向の指標の 1 つです。平均値と異なり、極端な値を持つケース/行にはあまり影響を受けません。この例では、中央値は、平均値よりも小さくなっています (例: 要約統計が含まれた棒グラフと比較してください)。平均値と中央値の差は、平均値を上昇させている極端な値を持ったケース/行がいくつかあることを示しています。つまり、高い給与の従業員が数人いるということです。
- 箱の最下部は、25 番目の百分位数を示します。25% のケース/行の値は、25 番目の百分位数より小さくなっています。箱の最上部は、75 番目の百分位数を示します。25% のケース/行の値は、75 番目の百分位数より大きくなっています。つまり、50% のケース/行が箱の中に含まれています。この箱は、男性より女性のほうがはるかに低くなっています。これは、男性よりも女性の方が salary の変動が小さいことを示す 1 つのヒントとなります。箱の上部と下部は、多くの場合、「ヒンジ」と呼ばれます。
- 箱から伸びている T 字の棒は、「内柵」または「ひげ」と呼ばれます。 これは、箱の高さの 1.5 倍まで、もしくは、その範囲の値を持つケース/行がない場合、最小値または最大値まで伸びます。データが正規分布の場合、データの約 95% は内柵内にあると期待されます。この例では、男性と比較して女性の方が、内柵の伸びが短くなっており、これも、男性よりも女性の方が salary の変動が小さいことを示しています。
- 点は外れ値です。これは、内柵に収まらない値として定義されます。外れ値は極端な値です。アスタリスクまたは星形は、極端な外れ値です。これらは、箱の高さの 3 倍を超える値を持つケース/行を表しています。女性と男性ともに、複数の外れ値があります。平均値が中央値よりも大きいことに注意してください。平均値が大きくなっているのは、これらの外れ値が原因です。