スコアリング・ウィザード: スコアリング関数の選択
スコアリング関数は、選択したモデルに使用できる「スコア」の種類です。 例えば、対象の予測値、予測値の確率、または選択した対象値の確率です。
スコアリング関数。 使用できるスコアリング関数は、モデルによって異なります。 次のうち 1 つまたは複数を使用できます。
- 予測値。 関心のある対象の結果の予測値。 対象のないモデル以外のすべてのモデルに使用できます。
- 予測値の確率。 比率として示される、予測値が適切な値になる確率。 カテゴリー対象のあるほとんどのモデルに使用できます。
- 選択した値の確率。 比率として示される、選択した値が適切な値になる確率。 「値」列のドロップダウン・リストから値を選択します。 使用可能な値は、モデルで定義されます。 カテゴリー対象のあるほとんどのモデルに使用できます。
- 確信度。 カテゴリー対象の予測値に関連する確率の測定。 2 項ロジスティック回帰、多項ロジスティック回帰、Naive Bayes モデルの場合、結果は予測値の確率と同じになります。 ツリー・モデルおよびルール・セット・モデルの場合、信頼度は予測カテゴリーの調整済み確率と解釈され、常に予測値の確率を下回ります。 これらのモデルの場合、信頼度の値は、予測値の確率よりも信頼性が高くなります。
- ノード番号。 ツリー・モデルの予測ターミナル・ノード番号。
- 「標準誤差」。予測値の標準誤差。 線型回帰モデル、一般線型モデル、スケール対象の一般化線型モデルに使用できます。 共分散行列がモデル・ファイルに保存されている場合にのみ使用できます。
- 累積ハザード: 推定累積ハザード関数。 この値は、予測値が与えられたときに、指定された時刻以前にそのイベントが観測される確率を示します。
- 最近傍。 最近傍の ID。 指定されている場合はケース・ラベルの変数の値、指定がない場合はケース番号が ID になります。 最近傍モデルにのみ適用されます。
- K 番目の最近傍。 k 番目の最近傍の ID。 「値」列に k の値として整数を入力します。 指定されている場合はケース・ラベルの変数の値、指定がない場合はケース番号が ID になります。 最近傍モデルにのみ適用されます。
- 最近傍への距離。 最近傍への距離。 モデルによって、ユークリッド距離または都市ブロック距離が使用されます。 最近傍モデルにのみ適用されます。
- K 番目の最も近い neigbor までの距離。 k 番目の最近傍への距離。 「値」列に k の値として整数を入力します。 モデルによって、ユークリッド距離または都市ブロック距離が使用されます。 最近傍モデルにのみ適用されます。
フィールド名: 選択した各スコアリング関数は、アクティブ・データ・セットの新しいフィールド (変数) を保存します。 デフォルト名を使用するか、新しい名前を入力することができます。 同じ名前を持つフィールドがすでにアクティブ・データ・セットに存在する場合は、置き換えられます。 フィールドの命名規則については、 変数名を参照してください。
値: 「値」の設定を使用する関数の説明については、スコアリング関数の説明を参照してください。