コレスポンデンス分析

コレスポンデンス・テーブル とは、行と列の間のコレスポンデンスの測定がセルに含まれている 2 元表のことです。 対応の指標は、行変数と列変数の間の類似性、類似性、混乱、関連、または相互作用を示すことができます。 非常に一般的なタイプのコレスポンデンス・テーブルはクロス集計表で、セルに度数が含まれます。

もっと詳しく知りたい方は、プロフェッショナル版>カテゴリー >通信文分析へどうぞ

このような表は、「クロス集計表」手続きを使用して簡単に取得できます。 ただし、クロス集計表は、2 つの変数間の関係の性質を常に明確に示すものではありません。 これは特に、対象となる変数が名義型 (固有の順序やランクがない) で、多数のカテゴリーが含まれている場合に当てはまります。 クロス集計表では、観測されたセル度数が 職業 および 朝食シリアルの 10 x 9 クロス集計表の期待値と大きく異なることがわかりますが、類似した嗜好を持つ職業グループやそれらの嗜好性を識別するのは難しい場合があります。

コレスポンデンス分析では、多次元空間における 2 つの名義変数間の関係をグラフィカルに調べることができます。 行と列のスコアを計算し、スコアに基づいてプロットを作成します。 相互に類似したカテゴリーは、プロット内で相互に近い位置に表示されます。 このようにして、変数のどのカテゴリーが互いに類似しているか、または 2 つの変数のどのカテゴリーが関連しているかを簡単に確認できます。 コレスポンデンス分析手続きを使用すると、アクティブ・ポイントによって定義されたスペースに補助ポイントを適合させることもできます。

スコアに従ったカテゴリーの順序付けが望ましくないか、直観的でない場合は、一部のカテゴリーのスコアを等しくなるように制限することにより、順序の制限を課すことができます。 例えば、カテゴリーが nonelightmedium、および behaviorの変数 喫煙動作に、この順序に対応するスコアがあると想定します。 ただし、分析でカテゴリー なし重い、および メディアを順序付けする場合、 重いメディア のスコアが等しくなるように制約すると、スコア内のカテゴリーの順序が保持されます。

距離に関するコレスポンデンス分析の解釈は、使用する正規化方法によって異なります。 コレスポンデンス分析プロシージャを使用して、変数のカテゴリー間の差、または変数間の差を分析することができます。 デフォルトの正規化では、行変数と列変数の差を分析します。

コレスポンデンス分析アルゴリズムは、さまざまな種類の分析を行うことができます。 行と列を中央揃えし、カイ 2 乗距離を使用すると、標準のコレスポンデンス分析に対応します。 ただし、代替の中心化オプションをユークリッド距離と組み合わせて使用すると、低次元空間における行列の代替表現が可能になります。

3 つの例を示します。 最初の例では、比較的小さなコレスポンデンス・テーブルを使用し、コレスポンデンス分析に固有のコンセプトを示します。 2 番目の例は、実用的なマーケティング・アプリケーションを示しています。 最後の例では、多次元尺度法で距離のテーブルを使用します。

次へ