ガウス混合ノードの作成オプション
ガウス混合ノードの作成オプションを指定するには、「作成オプション」タブを使用します。このタブには、基本オプションや拡張オプションが用意されています。このセクションで説明していないこれらのオプションの詳細については、以下のオンライン情報源を参照してください。
基本
- 完全。各コンポーネントが独自の一般的な分散共分散行列を持ちます。
- Tied。すべてのコンポーネントが同じ一般的な分散共分散行列を共有します。
- Diag。各コンポーネントが独自の対角分散共分散行列を持ちます。
- Spherical。各コンポーネントが独自の分散を 1 つずつ持ちます。
コンポーネントの数。モデルの作成時に使用する混合コンポーネントの数を指定します。
クラスター ラベル: クラスター・ラベルが数値なのか文字列なのかを指定します。 「文字列」を選択した場合、クラスター・ラベルの接頭辞を指定します (例えば、デフォルト接頭辞は cluster であり、cluster-1、cluster-2 といったクラスター・ラベルが作成されることになります)。
ランダム シード: 乱数発生ルーチンによって使用されるシードを生成するには、このオプションを選択し、「生成」をクリックします。
詳細
許容度: 収束しきい値を指定します。デフォルト値は 0.001 です。
反復数: これにより、指定された反復数の後にモデル評価の作成を停止できます。実行する反復の最大回数を指定します。デフォルト値は 100 です。
Init パラメータ。初期化パラメータ「KMeans」(KMeans を使用して負担率を初期化する) または「無作為」(ランダムに負担率を初期化する) を選択します。
ウォーム スタート。「True」を選択すると、最後の適合の解を次の適合の初期値として使用します。これにより、類似した問題に対して何度も適合を呼び出す場合に収束が早くなります。
| SPSS Modeler の設定 | スクリプト名 (プロパティー名) | ガウス混合パラメータ |
|---|---|---|
| 定義済みの役割を使用/ユーザー設定フィールドの割り当てを使用 | role_use |
|
| 入力 | 予測値 |
|
| 区分されたデータを使用 | use_partition |
|
| 共分散タイプ | covariance_type |
covariance_type |
| コンポーネントの数 | number_component |
n_components |
| クラスター ラベル | component_lable |
|
| ラベル接頭辞 | label_prefix |
|
| ランダム シードの設定 | enable_random_seed |
|
| ランダム シード | random_seed |
random_state |
| 許容度 | tol |
tol |
| 反復数 | max_iter |
max_iter |
| Init パラメータ | init_params |
init_params |
| ウォーム スタート | warm_start |
warm_start |
1 Scikit-learn: Machine Learning in Python, Pedregosa et al., JMLR 12, pp. 2825-2830, 2011.
2 "User Guide." Gaussian mixture models. Web. © 2007 - 2017. scikit-learn developers.