IBM® Db2® for z/OS® モデル - ディシジョン ツリー ノード - ツリーの剪定

剪定オプションを使用して、ディシジョン・ツリーの剪定基準を指定できます。剪定の目的は、新しいデータに対して予期した精度が改善されない成長しすぎたサブグループを削除することによって、オーバーフィットのリスクを軽減することにあります。

剪定の測定:デフォルトの剪定の測定、「精度」は、ツリーから葉を削除した後、推定されたモデルの精度が可能な上限内にあるようにします。剪定を適用しながらクラスの重みを考慮に入れる場合、「重みつき精度」 を使用します。

剪定するデータ: 新しいデータに対する想定された精度を推定するには、学習データの一部またはすべてを使用できます。また、指定されたテーブルの別の剪定データセットを使用できます。

  • すべての学習データを使用: このオプション (デフォルト) は、モデルの精度を推定するためにすべての学習データを使用します。
  • 剪定に次のパーセンテージ学習データを使用: 剪定データに指定した割合で、一方は学習用、一方は剪定用です。
  • ストリームを実行するごとにデータを同じ方法で区分するようランダム シードを指定する場合、「結果を再現」 を選択します。「剪定に使用するシード」 フィールドで整数を指定するか、または 「生成」 をクリックすると、擬似無作為の整数を作成します。
  • 既存のテーブルのデータを使用: モデルの精度を推定するために個別の剪定データセットのテーブル名を指定します。学習データを使用するより信頼性が高いと見なされます。