węzeł Las losowy

Las losowy (Random Forest©) to zaawansowana implementacja algorytmu agregacji (bagging), która jako model bazowy wykorzystuje model drzewa. W lasach losowych każde drzewo w zespole jest zbudowane z prób losowanych ze zwracaniem (np. próby bootstrapowej) ze zbioru uczącego. Podczas dzielenia węzła w trakcie tworzenia drzewa wybrany podział nie jest już najlepszym spośród wszystkich predyktorów. Zamiast tego wybierany jest najlepszy podział z losowego podzbioru predyktorów. Ze względu na tę losowość odchylenie lasu zwykle nieznacznie wzrasta (względem odchylenia jednego drzewa nielosowego), jednak w wyniku uśredniania zmniejsza się także jego zmienność — zwykle w stopniu z nawiązką kompensującym wzrost odchylenia. W rezultacie ogólna jakość modelu jest wyższa.1

Węzeł Las losowy w programie SPSS Modeler jest zaimplementowany w języku Python. Karta Python na palecie węzłów zawiera ten i inne węzły Python.

Aby uzyskać więcej informacji o algorytmach lasu losowego, patrz https://scikit-learn.org/stable/modules/ensemble.html#forest.

1L. Breiman, "Random Forests," Machine Learning, 45(1), 5-32, 2001.