モデルの選択 (線型モデル)
モデル選択方法: モデル選択方法 (下記参照) のいずれかを選択するか、または主効果のモデル項として使用可能なすべての予測値を単に入力する「すべての予測値を含む」を選択します。 デフォルトでは、「変数増加ステップワイズ法」 が使用されます。
変数増加ステップワイズ法の選択: モデルの効果がない状態から、これ以上追加または削除できなくなるまで、ステップワイズ法の基準に従って徐々に効果を追加および削除します。
- 投入または除去の基準: これは、モデルに効果を加えるかどうか、またはモデルから効果を削除するかどうかを決定するときに使用する統計です。 「情報量基準 (AICC)」はモデルを指定された学習セットの尤度に基づき、過度に複雑なモデルにペナルティーを課すよう調整します。 「F 統計量」はモデルのエラーの改善に対する統計検定に基づいています。 「調整済み R2 乗」は学習セットの適合度に基づき、過度に複雑なモデルにペナルティーを科すよう調整されます。
「オーバーフィット防止基準 (ASE)」 は、オーバーフィット防止セットの適合度 (平均平方誤差、または ASE) に基づきます。 オーバーフィット防止セットは、モデルの学習に使用されない元のデータ・セットのおよそ 30% の無作為サブサンプルです。
「F 統計量」以外の基準を選択した場合、各ステップでその基準での最も大きい正の増分に対応する効果がモデルに追加されます。 その基準での減少に対応するモデルの効果はいずれも削除されます。
基準として 「F 統計量」 が選択されると、各ステップで最も小さい p 値が指定されたしきい値より小さい効果がモデルに追加されます (「次の値より小さい p 値の効果を含む」)。 デフォルトは 0.05 です。 p 値が指定されたしきい値より大きいモデルの効果は削除されます (「次の値より大きい p 値の効果を削除する」 は削除されます。 デフォルトは 0.10 です。
- 最終モデルの最大効果数をカスタマイズする: デフォルトでは、すべての使用可能な効果をモデルに投入できます。 あるいは、ステップワイズ・アルゴリズムが指定した効果の最大数でステップを終了する場合は、アルゴリズムは効果の現在のセットで停止します。
- ステップの最大数をカスタマイズする: 特定のステップ数の後、ステップワイズ・アルゴリズムが停止します。 デフォルトでは、これは使用可能な効果の数の 3 倍です。 あるいは、ステップの最大数を正整数で指定します。
最適サブセットの選択: 「可能なすべての」モデル、または少なくとも変数増加ステップワイズ法より大きい、可能なモデルのサブセットをチェックし、最適サブセットの基準に従って最適サブセットを選択します。 情報基準 (AICC)は、モデルに与えられたトレーニング・セットの尤度に基づいており、過度に複雑なモデルをペナライズするように調整されます。 「調整済み R2 乗」は学習セットの適合度に基づき、過度に複雑なモデルにペナルティーを科すよう調整されます。 「オーバーフィット防止基準 (ASE)」 は、オーバーフィット防止セットの適合度 (平均平方誤差、または ASE) に基づきます。 オーバーフィット防止セットは、モデルの学習に使用されない元のデータ・セットのおよそ 30% の無作為サブサンプルです。
最大の基準値を持つモデルが最良のモデルとして選択されます。