ガウス混合ノードの作成オプション

ガウス混合ノードの作成オプションを指定するには、「作成オプション」タブを使用します。このタブには、基本オプション拡張オプションが用意されています。このセクションで説明していないこれらのオプションの詳細については、以下のオンライン情報源を参照してください。

基本

共分散タイプ。以下の分散共分散行列のいずれかを選択します。
  • 完全。各コンポーネントが独自の一般的な分散共分散行列を持ちます。
  • Tied。すべてのコンポーネントが同じ一般的な分散共分散行列を共有します。
  • Diag。各コンポーネントが独自の対角分散共分散行列を持ちます。
  • Spherical。各コンポーネントが独自の分散を 1 つずつ持ちます。

コンポーネントの数。モデルの作成時に使用する混合コンポーネントの数を指定します。

クラスター ラベル: クラスター・ラベルが数値なのか文字列なのかを指定します。 「文字列」を選択した場合、クラスター・ラベルの接頭辞を指定します (例えば、デフォルト接頭辞は cluster であり、cluster-1cluster-2 といったクラスター・ラベルが作成されることになります)。

ランダム シード: 乱数発生ルーチンによって使用されるシードを生成するには、このオプションを選択し、「生成」をクリックします。

詳細

許容度: 収束しきい値を指定します。デフォルト値は 0.001 です。

反復数: これにより、指定された反復数の後にモデル評価の作成を停止できます。実行する反復の最大回数を指定します。デフォルト値は 100 です。

Init パラメータ。初期化パラメータ「KMeans」(KMeans を使用して負担率を初期化する) または「無作為」(ランダムに負担率を初期化する) を選択します。

ウォーム スタート「True」を選択すると、最後の適合の解を次の適合の初期値として使用します。これにより、類似した問題に対して何度も適合を呼び出す場合に収束が早くなります。

次の表に、SPSS® Modeler のガウス混合ノードのダイアログの設定と Python のガウス混合ライブラリーのパラメータとの間の関係を示します。
表 1. ノードのプロパティーと Python ライブラリーのパラメータのマッピング
SPSS Modeler の設定 スクリプト名 (プロパティー名) ガウス混合パラメータ
定義済みの役割を使用/ユーザー設定フィールドの割り当てを使用 role_use
入力 予測値
区分されたデータを使用 use_partition
共分散タイプ covariance_type covariance_type
コンポーネントの数 number_component n_components
クラスター ラベル component_lable
ラベル接頭辞 label_prefix
ランダム シードの設定 enable_random_seed
ランダム シード random_seed random_state
許容度 tol tol
反復数 max_iter max_iter
Init パラメータ init_params init_params
ウォーム スタート warm_start warm_start

1 Scikit-learn: Machine Learning in Python, Pedregosa et al., JMLR 12, pp. 2825-2830, 2011.

2 "User Guide." Gaussian mixture models. Web. © 2007 - 2017. scikit-learn developers.