カテゴリー主成分分析 (CATPCA)

この手続きは、データの次元数を削減する一方で、複数のカテゴリー変数を同時に数量化します。カテゴリー主成分分析の略語は CATPCA (categorical principal components analysis) です。

主成分分析の目的は、元の変数の組数を減らし、元の変数が持っていた情報の大部分を表す無相関の成分の組にまとめることです。この手法は、多数の変数があるためにオブジェクト (被験者や単位) 間の関係を適切に解釈できない場合に最も有効です。次元数を削減することにより、多数の変数ではなく、少数の成分を解釈します。

標準の主成分分析では、数値変数間に線型関係があることを前提とします。一方、最適尺度法では、変数をさまざまなレベルで尺度化することができます。カテゴリー変数は、指定された次元数で最適に数量化されます。その結果、変数間の非線型関係をモデルリングできるようになります。

例: カテゴリー主成分分析を使用して、仕事の満足度と、職種、部署、地域、移動量 (多、中、少) との関係を視覚的に表現することができます。例えば、2 つの次元で分散のほとんどが示されることがわかります。第 1 次元では職種と地域が離れていますが、第 2 次元では部署と移動量が離れているような場合があります。また、高い仕事の満足度が中程度の移動量に関連していることがわかる場合もあります。

統計と作図: 度数、欠損値、最適尺度水準、最頻値、変数と次元ごとに重心座標、ベクトル座標、および合計によって説明された分散、ベクトル数量化変数の成分負荷、カテゴリー数量化と座標、反復の記述、変換後の変数の相関と相関行列の固有値、元の変数の相関と相関行列の固有値、オブジェクト・スコア、カテゴリー・プロット、結合カテゴリー・プロット、変換プロット、残差プロット、射影された重心のプロット、オブジェクト・プロット、バイプロット、トリプロット、および成分負荷のプロット。

カテゴリー主成分分析データの考慮事項

「データ」。文字列変数の値は、英数字の昇順で常に正の整数に変換されます。ユーザー定義の欠損値、システム欠損値、および 1 未満の値は、欠損値とみなされます。値が 1 未満の変数は、再割り当てを行うか定数を加算することにより、非欠損値変数にすることができます。

仮定: データには、3 つ以上の有効なケースを含める必要があります。この分析は、正の整数データに基づきます。離散化オプションは、小数値変数の値を「正規」分布に近いカテゴリーにグループ化することによってその小数値変数を自動的に分類し、さらに、文字列変数の値を正の整数に自動的に変換します。他の離散化方式も指定することができます。

関連プロシージャー: すべての変数を数値レベルで尺度化した場合は、標準の主成分分析と同等になります。標準の線型主成分分析で変換された変数を使用することにより、代替の作図機能を使用することができます。すべての変数に多重名義尺度水準が含まれている場合、カテゴリー主成分分析は、多重応答分析と同じになります。変数の組について調べる場合、カテゴリー (非線型) 正準相関分析を使用する必要があります。

カテゴリー主成分分析を行うには

この機能を使用するには、SPSS® Statistics Professional Edition または Categories オプションが必要です。

メニューから次の項目を選択します。
「分析」 > 「次元分解」 > 「最適尺度法...」
「一部の変数が多重名義でない」を選択します。
「単一グループ」を選択します。
「定義」をクリックします。
2 つ以上の分析変数を選択し、解の次元の数を指定します。
「OK」をクリックします。

必要に応じて、検出された解に適合させる補助変数を指定することも、プロットのラベル付け変数を指定することもできます。

この手続きでは、CATPCA のコマンド・シンタックスが貼り付けられます。