コレスポンデンス分析

コレスポンデンス分析の目的の 1 つは、低次元空間でコレスポンデンス・テーブル内の 2 つの名義変数間の関係を記述することと、各変数のカテゴリー間の関係を同時に記述することです。各変数について、プロットのカテゴリー・ポイント間の距離は、カテゴリー間の関係を反映しています。類似したカテゴリーは、相互に近い位置にプロットされます。また、1 つの変数の各ポイントを、原点から他の変数のカテゴリー・ポイントに至るベクトル上に射影すると、変数間の関係が記述されます。

分割表の分析には、通常、行と列のプロファイルの検討と、カイ 2 乗統計を使用した独立性の検定が含まれます。ただし、プロファイルの数が非常に多くなる場合があるため、カイ 2 乗検定では従属構造は明らかになりません。クロス集計表手続きでは、関連度の指標と関連度の検定がいくつか提供されますが、変数間の関係を図表で示すことはできません。

因子分析は、低次元空間で変数間の関係を記述するための標準的な手法です。ただし、因子分析では間隔データが必要で、変数の 5 倍の数の観測値が必要になります。一方、コレスポンデンス分析は名義変数を前提とし、変数間の関係のほかに、各変数のカテゴリー間の関係も記述することができます。また、コレスポンデンス分析を使用して、正のコレスポンデンス指標の任意のテーブルを分析することができます。

例: コレスポンデンス分析を使用して、社員のカテゴリーと喫煙習慣の関係を図示することができます。例えば、喫煙に関して、中間管理職と秘書では異なるが、秘書と上級管理職では同じであることがわかる場合があります。また、中間管理職は喫煙量が多く、秘書は喫煙量が少ないことがわかる場合もあります。

統計と作図: コレスポンデンス指標、行と列のプロファイル、特異値、行と列のスコア、イナーシャ (慣性)、マス (質量)、行スコアと列スコアの信頼統計、特異値の信頼統計、変換プロット、行ポイント・プロット、列ポイント・プロット、およびバイプロット。

表示

コレスポンデンス分析データの考慮事項

データ: 分析対象のカテゴリー変数は、名義変数として尺度化されます。集計データの場合、または度数以外のコレスポンデンス指標の場合、正の類似値を含む重み付け変数を使用します。一方、テーブル・データの場合は、シンタックスを使用してテーブルを読み込みます。

前提条件: この手続きで使用される次元の最大数は、アクティブな行と列のカテゴリーの数と、同等性の制約条件の数によって異なります。同等性の制約条件が使用されず、すべてのカテゴリーがアクティブな場合、次元の最大数は、最もカテゴリー数の少ない変数のカテゴリー数から 1 を減算した数になります。例えば、ある変数に 5 つのカテゴリーがあり、他の変数には 4 つのカテゴリーがある場合、次元の最大数は 3 になります。補助カテゴリーは、アクティブなカテゴリーではありません。例えば、ある変数に 5 つのカテゴリーがあり、そのうちの 2 つが補助カテゴリーで、他の変数には 4 つのカテゴリーがある場合、次元の最大数は 2 になります。同等になるように制約されたカテゴリーの組は、すべて 1 つのカテゴリーとして扱う必要があります。例えば、ある変数に 5 つのカテゴリーがあり、そのうち 3 つが同等になるように制約されている場合、次元の最大数を決定する際に、その変数は 3 つのカテゴリーを持つ変数として扱う必要があります。この場合、2 つのカテゴリーは制約されておらず、第 3 のカテゴリーが、制約された 3 つのカテゴリーに対応します。最大値を超える次元数を指定しても、最大値が使用されます。

関連手続き: 3 つ以上の変数を使用する場合は、多重応答分析を使用します。変数を順序変数として尺度化する必要がある場合は、カテゴリー主成分分析を使用します。

コレスポンデンス分析を行うには

この機能を使用するには Categories オプションが必要です。

  1. メニューから次の項目を選択します。

    「分析」 > 「次元分解」 > 「コレスポンデンス分析...」

  2. 行変数を選択します。
  3. 列変数を選択します。
  4. 変数の範囲を定義します。
  5. 「OK」をクリックします。

この手続きでは、CORRESPONDENCEのコマンド・シンタックスが貼り付けられます。