TwoStep クラスター分析

「TwoStep クラスター分析」手続きは、通常は明らかにされることがない、データ・セット内の自然なグループ (またはクラスター) を明らかにすることを目的として設計された探索ツールです。この手続きで使用されるアルゴリズムには、従来のクラスター分析手法とは異なる以下の優れた特徴があります。

: 小売企業と、消費者製品を扱っている企業は、顧客の購買習慣、性別、年齢、収入レベルなどを記述するデータに対して、定期的にクラスタリング手法を適用します。これらの企業は、販売を拡大し、ブランド・ロイヤリティーを構築するために、マーケティング戦略と製品開発戦略を各消費者グループに合わせて調整します。

距離測度: このオプションにより、2 つのクラスター間の類似度を計算する方法を指定します。

クラスター数: このオプションにより、クラスター数の判定方法を指定することができます。

連続変数の数: このグループは、「オプション」ダイアログ・ボックスで指定された連続型変数の標準化仕様の集計を示します。詳しくは、TwoStep クラスター分析のオプションのトピックを参照してください。

クラスター化の基準: この選択項目により、自動クラスタリング・アルゴリズムでクラスター数を判定する方法を決定します。ベイズの情報量基準 (BIC) または赤池情報量基準 (AIC) のどちらかを指定することができます。

TwoStep クラスター分析データの考慮事項

データ: この手続きは、連続型変数とカテゴリー変数の両方で有効です。ケースはクラスター化されるオブジェクトを表し、変数はクラスター化の基準となる属性を表します。

ケースの並び順: クラスター機能ツリーと最終解は、ケースの並び順によって異なる可能性があることに注意してください。並び順の影響を最小限に抑えるには、ケースを無作為に並べます。得られた解の安定性を確認するために、異なる無作為の順序でソートしたケースを使用して複数の異なる解を取得することをお勧めします。ファイル・サイズが非常に大きいためにこの方法を実行するのが難しい場合は、異なる無作為の順序でソートされたケースのサンプルを使用して、何回かに分けて実行してください。

仮定: 尤度距離測度は、クラスター・モデル内の変数が独立しているものと仮定します。さらに、各連続型変数には正規 (ガウス) 分布があると仮定し、各カテゴリー変数には多項分布があると仮定します。経験的内部検定は、この手続きが独立の仮定と分布の仮定の両方の違反に対して堅牢であることを示していますが、これらの仮定がどの程度満たされているかについて注意する必要があります。

2 つの連続型変数の独立性を検定するには、「2 変量の相関分析」手続きを使用します。2 つのカテゴリー変数の独立性を検定するには、「クロス集計表」手続きを使用します。連続型変数とカテゴリー変数との間の独立性を検定するには、「グループの平均」手続きを使用します。連続型変数の正規性を検定するには、「探索的分析」手続きを使用します。指定された多項分布がカテゴリー変数にあるかどうかを検定するには、「カイ 2 乗検定」 手続きを使用します。

TwoStep クラスター分析を実行するには

この機能を使用するには、Statistics Base Edition が必要です。

  1. メニューから次の項目を選択します。

    「分析」 > 「分類」 > 「TwoStep クラスター...」

  2. 1 つ以上のカテゴリー変数または連続型変数を選択します。

オプションとして、以下を行うことができます。

この手続きは、TWOSTEP CLUSTER コマンド・シンタックスを貼り付けます。