ロジスティック回帰ノードの「モデル」オプション
モデル名: ターゲットまたは ID フィールド (その指定がない場合はモデル タイプ) に基づいてモデル名を生成、またはカスタム名を指定することができます。
データ区分データを使用。 データ区分フィールドが定義されている場合、このオプションでは学習用データ区分からのデータのみがモデル構築に使用されるようにします。
分割モデルを作成 : 分割フィールドとして指定される入力フィールドの各値の個別モデルを作成します。 詳しくは、分割モデルの作成を参照してください。
手続き : 二項モデルまたは多項モデルのどちらが作成されるかを指定します。ダイアログ・ボックス内で使用できるオプションは、どのタイプのモデル作成手順が選択されたかによって異なります。
- 2 項。 対象フィールドが、はい/いいえ、オン/オフ、男性/女性 のように、2 つの異なる値 (二分) のフラグ型または名義型の場合に使用されます。
- 多項分布。 対象フィールドが 2 つ以上の値をとる名義型フィールドの場合に使用されます。「主効果」、「すべての因子による」、または「ユーザー設定」を指定できます。
回帰式に定数項を含む: 生成される方程式に定数項を含めるかどうかを指定します。ほとんどの場合、このオプションは選択したままにしておきます。
二項モデル
二項モデルには、次の方法とオプションが利用できます。
方法: ロジスティック回帰モデルの作成に使用する手法を指定します。
- Enter : デフォルトの方法で、すべての項が方程式に直接入力されます。モデル作成時にフィールド選択は実行されません。
- 変数増加ステップワイズ法: フィールド選択に対する変数増加ステップワイズ法は、名前が示すとおりステップごとに方程式を作成していきます。初期モデルは最も単純なモデルで、方程式にモデルの項はありません (定数を除く)。各ステップで、モデルにまだ追加されていない項を評価します。評価された項の中で最適な項がモデルの予測精度を大幅に改善する場合、その項が追加されます。 さらに、モデルの現在の項が再評価され、削除してもモデルの性能が低下しないかどうかが判断されます。低下しないと判断されると、これらの項は削除されます。この処理が繰り返されて、他の項の追加や削除が行われます。項を追加してもモデルの性能が改善されず、項を削除してもモデルの性能が低下しなくなった時点で、最終モデルが生成されます。
- 変数減少ステップワイズ法: 変数減少ステップワイズ法は、基本的に変数増加ステップワイズ法の反対です。この方法では、すべての項が予測フィールドとして初期モデルに含まれています。各ステップにおいて、モデル中の項が評価され、削除してもモデルの性能が大幅に低下しない項が削除されます。また、前に削除された項が再評価され、それらの項を追加するとモデルの予測精度が大幅に改善されるかどうかが判断されます。大幅に改善される場合は、その項がモデルに追加されます。項を削除してもモデルの性能が大幅に低下せず、項を追加してもモデルの性能が改善されなくなった時点で、最終モデルが生成されます。
カテゴリー入力 :カテゴリーとして特定される、つまり尺度がフラグ型、名義型、または順序型であると特定されたフィールドを一覧します。各カテゴリー・フィールドについて、対比およびベース・カテゴリーを指定できます。
- フィールド名 : この列には、カテゴリー入力のフィールド名が入ります。この列に連続または数値入力を追加するには、「フィールドを追加」アイコンをクリックし、必要な入力を選択します。
-
対比 : カテゴリー・フィールドの回帰係数の解釈は、使用する対比によって異なります。対比により、どのように仮説の検定を設定して推定平均を計算するのかを決定します。例えば、カテゴリー・フィールドに、パターンやグループ分けなどの暗黙の順序があることを知っている場合は、その順序をモデル作成するために対比を使用できます。使用できる対比は次の通りです。
指標。対比は、所属カテゴリーの有無を示します。これがデフォルトの方法となります。
単純: 参照カテゴリーを除く予測値フィールドの各カテゴリーが、参照カテゴリーと比較されます。
「差分」。最初のカテゴリーを除く予測値フィールドの各カテゴリーが、前のカテゴリーの平均効果と比較されます。逆 Helmert 対比とも呼ばれます。
Helmert: 最後のカテゴリーを除く予測値フィールドの各カテゴリーが、後のカテゴリーの平均効果と比較されます。
反復: 最初のカテゴリーを除く予測値フィールドの各カテゴリーが、その前のカテゴリーと比較されます。
多項式 : 直交多項対比。直交多項式の対比。各カテゴリーが等間隔で配置されていると仮定されます。多項対比は数値フィールドのみで使用可能です。
偏差: 予測値フィールドの各カテゴリーが、全体の効果と比較されます。
-
基本カテゴリー : 選択された対比の種類について参照カテゴリーを決定する方法を指定します。「最初」を選択して、アルファベットで分類された入力フィールドに最初のカテゴリーを使用するか、または、「最後」を選択して最後のカテゴリーを使用します。デフォルトの基本カテゴリーは、「カテゴリ入力」領域にリストされた変数に適用されます。
注: 対比設定が差分、Helmert、反復、または多項である場合は、このフィールドを使用できません。
全体の回答の各フィールドの効果の推定は、参照カテゴリーに関連するその他のカテゴリーの尤度の増減として計算されます。このために、特定の応答を得やすいフィールドおよび値を特定しやすくなっています。
ベース・カテゴリーは 0.0 として出力に表示されます。これは、それをそれ自体と比較すると空の結果が得られるためです。他のすべてのカテゴリーは、ベース・カテゴリーに関係する式として表示されます。 詳しくは、ロジスティック ナゲット・モデルの詳細のトピックを参照してください。
多項モデル
多項モデルには、次の方法とオプションが利用できます。
方法: ロジスティック回帰モデルの作成に使用する手法を指定します。
- Enter : デフォルトの方法で、すべての項が方程式に直接入力されます。モデル作成時にフィールド選択は実行されません。
- ステップワイズ法: フィールド選択に対するステップワイズ法は、名前が示すとおりステップごとに方程式を作成していきます。初期モデルは最も単純なモデルで、方程式にモデルの項はありません (定数を除く)。各ステップで、モデルにまだ追加されていない項を評価します。評価された項の中で最適な項がモデルの予測精度を大幅に改善する場合、その項が追加されます。 さらに、モデルの現在の項が再評価され、削除してもモデルの性能が低下しないかどうかが判断されます。低下しないと判断されると、これらの項は削除されます。この処理が繰り返されて、他の項の追加や削除が行われます。項を追加してもモデルの性能が改善されず、項を削除してもモデルの性能が低下しなくなった時点で、最終モデルが生成されます。
- 変数増加法 :「変数増加法」は、モデル作成がステップに分かれている点で「ステップワイズ法」と似ています。この手法の初期モデルは、最も単純なモデルで、定数と項しかモデルに追加することはできません。各ステップで、モデルに含まれていない項が、モデルをどの程度改善するかに基づいて検定され、最も適したフィールドがモデルに追加されていきます。追加する項がなくなるか、候補の項を追加してもモデルの性能がそれほど向上しなくなった時点で、最終モデルが生成されます。
- 変数減少法。変数減少法は、基本的に変数増加法の反対の方法です。この手法では、初期モデルに予測フィールドとしてすべての項が含まれているため、項の削除だけが行われます。モデルの改善にほとんど寄与しないモデルの項が削除され、削除してもモデルの性能が低下しない項がなくなった時点で、最終モデルができあがります。
- 変数減少ステップワイズ法: 変数減少ステップワイズ法は、基本的にステップワイズ法の反対です。この方法では、すべての項が予測フィールドとして初期モデルに含まれています。各ステップにおいて、モデル中の項が評価され、削除してもモデルの性能が大幅に低下しない項が削除されます。また、前に削除された項が再評価され、それらの項を追加するとモデルの予測精度が大幅に改善されるかどうかが判断されます。大幅に改善される場合は、その項がモデルに追加されます。項を削除してもモデルの性能が大幅に低下せず、項を追加してもモデルの性能が改善されなくなった時点で、最終モデルが生成されます。
対象の基本カテゴリー: 参照カテゴリーの決定方法を指定します。 これは、対象の中の他のすべてのカテゴリーのための回帰式を推定するベースラインとして使用します。「最初」を選択してアルファベットで分類された現在の対象フィールドに最初のカテゴリーを使用するか、または、「最後」を選択して最後のカテゴリーを使用します。また、「指定」を使用して、特定のカテゴリーを選択し、一覧から必要な値を選択できます。得られた値は、データ型ノードでそれぞれのフィールドに定義できます。
多くの場合、利益をもたらさない製品など、最も興味のないカテゴリーをベース・カテゴリーに指定します。その他のカテゴリーは、相対的にこのベース・カテゴリーに関係するので、それら自体のカテゴリーにふさわしくなっています。このために、特定の応答を得やすいフィールドおよび値を特定しやすくなっています。
ベース・カテゴリーは 0.0 として出力に表示されます。これは、それをそれ自体と比較すると空の結果が得られるためです。他のすべてのカテゴリーは、ベース・カテゴリーに関係する式として表示されます。 詳しくは、ロジスティック ナゲット・モデルの詳細のトピックを参照してください。
モデル タイプ : モデルの項を定義する 3 つのオプションがあります。「主効果」を選択すると、モデルに入力フィールドが個別に含まれ、入力フィールド間の交互作用は検定されません (倍数効果)。「すべての因子による」を選択すると、モデルに入力フィールドの主効果の他に、すべての交互作用が含まれます。すべての因子によるモデルの方が複雑な関係を把握できますが、解釈が難しく、オーバーフィットの可能性も高くなります。考えられる組み合わせの数が大きくなる可能性があるため、すべての因子によるモデルの場合、自動フィールド選択手法 (強制投入方以外の手法) は無効にされます。「ユーザー設定」を選択すると、モデルには指定した項 (主効果と交互作用) だけが含まれます。このオプションを選択した場合、「モデルの項」リストを使用してモデルに項を追加、または削除します。
モデルの項 :「ユーザー設定」でモデルを構築する場合、モデル中の項を明示的に指定する必要があります。このリストには、モデルの現在の項のセットが表示されます。「モデルの項」リストの右側にあるボタンを使用して、モデルの項を追加、削除することができます。
- モデルに項を追加するには、「モデルの項の新規追加」ボタンをクリックします。詳しくは、ロジスティック回帰モデルへの項の追加のトピックを参照してください。
- 項を削除するには、該当する項を選択して「選択したモデルの項の削除」ボタンをクリックします。