Nodo Bosque aleatorio

Random Forest© es una implementación avanzada de un algoritmo de agregación autodocimante con un modelo de árbol como modelo base. En los bosques aleatorios, cada árbol del conjunto se genera a partir de una muestra trazada con sustitución (por ejemplo, una muestra de programa de arranque) a partir del conjunto de entrenamiento. Al dividir un nodo durante la construcción del árbol, la división elegida deja de ser la mejor división entre todas las características. En su lugar, la división que es elige es la mejor división entre un conjunto aleatorio de las características. Debido a esta aleatoriedad, por regla general el sesgo del bosque aumenta ligeramente (con respecto al sesgo de un único árbol no aleatorio) pero, debido al promedio, su varianza también disminuye, normalmente más que la compensación para el aumento en el sesgo, por este motivo genera un modelo mejor en general.¹

El nodo Bosque aleatorio en SPSS Modeler se implementa en Python. La pestaña Python en la Paleta de nodos contiene este nodo y otros nodos Python.

Si desea más información sobre algoritmos de bosque aleatorio, consulte https://scikit-learn.org/stable/modules/ensemble.html#forest.

¹L. Breiman, "Random Forests," Machine Learning, 45(1), 5-32, 2001.