判別分析

判別分析により、所属グループ用の予測モデルが作成されます。このモデルは、各グループを最も適切に判別する予測変数の線型結合に基づいた 1 つの判別関数 (複数のグループの場合は、判別関数のセット) から構成されます。各関数は、所属グループが判明しているケースのサンプルから生成されます。各関数は、予測変数の測定は存在するが所属グループが不明な新規ケースに適用することができます。

注: グループ化変数には、3 つ以上の値を設定することができます。ただし、グループ化変数のコードは整数でなければならず、変数の最小値と最大値を指定する必要があります。この範囲外の値を持つケースは、分析から除外されます。

例。平均的に、温帯の国に住んでいる人は、熱帯に住んでいる人に比べて 1 日当たりのカロリー消費量が多く、さらに温帯のほうが都市人口の比率が高くなっています。この 2 つのグループの国々をどの程度正確に区別できるかを判断するため、研究者はこれらの情報を 1 つの関数にまとめたいと考えています。さらに、研究者は、人口規模や経済情報も重要であると考えています。この場合は判別分析を使用すると、多重線型回帰式の右側の項に類似した線型判別関数の係数を推定することができます。つまり、係数 a、b、c、d を使用した場合、この関数は以下のようになります。


D = a * climate + b * urban + c * population + d * gross domestic product per capita

これらの変数が 2 つの気候帯の判別に役立つ場合、温帯の国と熱帯の国では D の値が異なることになります。ステップワイズ変数選択法を使用すると、4 つの変数のすべてを関数に含める必要はないことがわかります。

統計。 各変数: 平均値、標準偏差、1 変量の分散分析。各分析: Box の M、グループ内相関行列、グループ内共分散行列、グループ別共分散行列、総共分散行列。各正準判別関数: 固有値、分散の割合、正準相関、Wilks のラムダ、カイ 2 乗。各ステップ: 事前確率、Fisher の分類関数の係数、標準化されていない分類関数の係数、各正準関数に対する Wilks のラムダ。

判別分析データの考慮事項

データ。 グループ化変数は、整数でコード化された一定数のカテゴリーを持っている必要があります。名義型の独立変数は、ダミー変数または対比変数として再割り当てする必要があります。

仮定: ケースは独立している必要があります。予測変数は多変量正規分布を持っている必要があり、グループ内分散共分散行列はグループ全体で等しくなければなりません。各所属グループは相互に排他的であり (つまり、複数のグループに所属しているケースが存在しない)、グループ全体で包括的である (つまり、すべてのケースがいずれかのグループに所属している) と想定されます。この手続きは、所属グループがカテゴリー変数である場合に最も効果的です。所属グループが連続変数の値 (例えば、高い IQ と低い IQ など) に基づいている場合は、連続変数そのものが提供する詳細な情報を最大限に活用するために、線型回帰を使用することをお勧めします。

判別分析を実行するには

この機能には Statistics Base オプションが必要です。

メニューから次の項目を選択します。
分析 > 「分類」 > 「判別分析 ...」

注：赤で強調表示されている項目は必須です。すべての必須項目に有効な値を入力すると、 [貼り付け ]ボタンと [OK] ボタンが有効になります。
整数値をとるグループ変数を選択し、「範囲の定義」をクリックして目的のカテゴリーを指定します。
独立変数 (つまり、予測変数) を選択します。グループ化変数の値が整数ではない場合、「変換」メニューの「連続数への再割り当て」を選択すると、整数値をとる変数が作成されます。
独立変数を投入する方法を選択します。
- 同時に独立変数を投入します。 許容基準を満たすすべての独立変数を同時に投入します。
- ステップワイズ法を使用: ステップワイズ法の分析を使用して、変数の投入と削除を制御します。
オプションで、ケース選択変数を選択します。

このプロシージャーでは、 DISCRIMINANT コマンド・シンタックスを貼り付けます。