узел Случайный лес

Случайный лес (Random Forest©) - улучшенная реализация алгоритма бэггинга с моделью дерева в качестве базовой. В случайном лесе каждое дерево в ансамбле строится из выборки с заменой (например, выборки бутстрапа) из набора обучения. При расщеплении узла во время построения дерева выбранное расщепление больше не является лучшим расщеплением среди всех возможностей. Вместо этого выбирается расщепление, наилучшее среди случайного подмножества возможностей. Из-за случайности смещение леса обычно слегка возрастает (по сравнению со смещением единственного неслучайного дерева), но из-за усреднения также уменьшается дисперсия, причем обычно сильнее, чем возрастает смещение, тем самым порождая в целом лучшую модель.1

Узел Случайный лес в SPSS Modeler реализован на языке Python. На вкладке Python палитры Узлы содержится этот узел и другие узлы Python.

Дополнительную информацию об алгоритмах случайного леса смотрите в разделе https://scikit-learn.org/stable/modules/ensemble.html#forest .

1L. Breiman, "Random Forests," Machine Learning, 45(1), 5-32, 2001.