ケースの要約の統計

各グループ化変数のカテゴリー内の変数に対するサブグループ統計量としては、合計、ケースの数、平均値、中央値、グループの中央値、平均値の標準誤差、最小値、最大値、範囲、グループ化変数の最初のカテゴリーの変数値、グループ化変数の最後のカテゴリーの変数値、標準偏差、分散、尖度、尖度の標準誤差、歪度、歪度の標準誤差、総和のパーセント、合計 N のパーセント、グループ化変数内の合計のパーセント、グループ化変数内の N のパーセント、幾何平均、調和平均のうちの 1 つ以上を選択することができます。 統計量は、「セル統計量」リストに表示されている順序で、出力に表示されます。 カテゴリー全体の各変数についても、要約統計量が表示されます。

「最初」データ・ファイルで最初に検出されたデータ値を表示します。

「幾何平均 (Geometric Mean)」データ値の積の n 乗根。ここで、n はケースの数を表します。

グループ化された中央値: グループにコード化される、データについて計算した中央値。 例えば、年齢データを使用しており、30 代のそれぞれの値を 35 にコード化し、40 代のそれぞれの値を 45 にコード化し、他の年齢層についても同様にコード化する場合、グループ化した中央値は、コード化したデータから計算される中央値です。

調和平均: グループ間で標本サイズが等しくない場合に、 グループの平均サイズを推定するために使用します。 調和平均は、サンプルの総数を標本サイズの逆数の和で割ったものです。

尖度. 外れ値が存在する度合いの指標。 正規分布の場合、 尖度の統計値は 0 です。 尖度が正の場合、そのデータの極端な外れ値は正規分布よりも多いことを示します。 負の尖度は、データが正規分布よりも極端な異常値を示さないことを示します。 使用されている尖度の定義では、正規分布の場合は値が0となり、過剰尖度と呼ばれることもあります。 ソフトウェアによっては、正規分布の場合、kurtosisの値が3であると報告されることがあります。

「最後」データ・ファイルで最後に検出されたデータ値を表示します。

最大値: 数値変数の最大値。

平均値: 中心傾向の指標。 算術平均 (合計をケース数で割った値) です。

中央値: この値より上と下それぞれにケースの半数ずつが該当することになる値。50 パーセンタイル。 ケース数が偶数の場合の中央値は、 昇順または降順にソートしたときに中央に来る 2 つのケースの平均です。 中央値は、 外れ値に対して敏感でない、中心傾向の指標です。それに対して平均値は、 少数の極端に大きいまたは小さい値に影響されることがあります。

最小. 数値変数の最小値。

Nケース (観測値またはレコード) の数。

「合計 N のパーセント」各カテゴリーのケースの総数のパーセント。

総合計のパーセント: 各カテゴリーの総合計の割合。

範囲数値変数の最大値と最小値の差。最大値から最小値を引いた値。

スケウネス. 分布の非対称性の指標。 正規分布は対称であり、 歪度の値は 0 です。 歪度が正の大きな値である分布は、 右側の裾が長くなります。 歪度が負で絶対値が大きい分布は、 左側の裾が長くなります。 目安として、 歪度が標準誤差の 2 倍より大きい場合は、対称分布からずれていると解釈します。

「標準偏差」平均値の周りの散らばりの指標。 正規分布では、 平均から 1 標準偏差以内にケースの 68% が含まれ、2 標準偏差以内にケースの 95% が含まれます。 例えば平均年齢が 45 で標準偏差が 10 である場合、 正規分布ではケースの 95% が 25 と 65 の間に含まれます。

「尖度の標準誤差」標準誤差に対する尖度の比率は、 正規性の検定として使用することができます (比率が -2 より小さいか +2 より大きい場合は、 正規性を棄却することができます)。 尖度が大きな正の値である場合は、 分布の裾が正規分布の裾より長いことを示します。尖度が負の値である場合は、 裾が短いことを示します (箱形の一様分布に似た形になります)。

平均値の標準誤差: 同じ分布から抽出したサンプルの間で平均値がどの程度異なるかを示す指標。 観測した平均と仮説による値をおおまかに比較するために使用することができます (差と標準誤差の比率が -2 より小さいか +2 より大きい場合は、2 つの値が異なっていると結論付けることができます)。

「歪度の標準誤差」標準誤差に対する歪度の比率は、 正規性の検定として使用することができます (比率が -2 より小さいか +2 より大きい場合は、 正規性を棄却することができます)。 歪度が大きな正の値である場合は、右側の裾が長いことを示します。 極端な負の値の場合は、左側の裾が長いことを示します。

「合計」欠損値でない値を持つすべてのケースにわたる値の和 (合計)。

「分散」平均値の周りの値の散らばりの指標。 平均値からの偏差の平方和を、ケース数より 1 少ない値で割ったものに等しくなります。 分散の測定単位は、 変数自体の単位の 2 乗です。

ケースの要約の統計量を指定するには

この機能には Statistics Base オプションが必要です。

  1. メニューから次の項目を選択します。

    分析 > レポート > ケースの要約 ...

  2. 「ケースの要約」ダイアログ・ボックスで、「統計」をクリックします。