ランダム・フォレスト・ノード
ランダム フォレスト© は、ツリー モデルを基本モデルとして使用するバギング アルゴリズムの高度な実装です。ランダム フォレストでは、置き換えを行って学習セットから抽出したサンプル (ブートストラップ サンプルなど) からアンサンブルの各ツリーを構築します。ツリーの構築中にノードを分割するとき、選択された分割がすべてのフィーチャーの間で最良の分割になるわけではありません。その代わり、選択された分割は、フィーチャーのランダムなサブセットの間で最良の分割になっています。このようにランダム性があるため、通常は (単一の非 Random Trees の偏りについて) フォレストの偏りがやや増えますが、平均化により分散も減少するため (通常は偏りの増加の補正より減少が大きくなります)、全体としてよりよいモデルが得られます。1
SPSS® Modeler のランダム・フォレスト・ノードは Python で実装されています。「ノード パレット」の「Python」タブには、このノードおよびその他の Python ノードがあります。
ランダム フォレストのアルゴリズムについて詳しくは、https://scikit-learn.org/stable/modules/ensemble.html#forestを参照してください。
1L. Breiman, "Random Forests," Machine Learning, 45(1), 5-32, 2001.