隨機森林節點

隨機森林© 是將樹狀結構模型用作基底模型的自助重抽總合法演算法的進階實作。在隨機森林中,集成中的每一個樹狀結構都透過使用訓練集中的取代(例如,重複取樣樣本)繪製的樣本建置。在樹狀結構建構期間分割節點時,選擇的分割不再是所有功能中的最佳分割。挑選的分割反而是隨機功能子集中的最佳分割。因為這種隨機性,森林的偏移通常略有增加(關於單一非隨機樹狀結構的偏移),但由於平均化,其變異也會降低,通常超過對偏移增加的補償,因此會產生整體更好的模型。1

SPSS® Modeler 中的「隨機森林」節點使用 Python 進行實作。節點選用區上的 Python 標籤包含此節點和其他 Python 節點。

如需隨機森林演算法的相關資訊,請參閱https://scikit-learn.org/stable/modules/ensemble.html#forest

1L. Breiman, "Random Forests," Machine Learning, 45(1), 5-32, 2001.