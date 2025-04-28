El aumento de gradiente es un algoritmo de aprendizaje automático potente y ampliamente utilizado en ciencia de datos para tareas de clasificación. Es parte de una familia de métodos de aprendizaje por conjuntos, junto con el embolsado, que combinan las predicciones de múltiples modelos más simples para mejorar el rendimiento general. La regresión de aumento de gradiente utiliza el aumento de gradiente para generar mejor los datos de salida basados en una regresión lineal. Un clasificador de aumento de gradiente, que explorará en este tutorial, utiliza el aumento de gradiente para clasificar mejor los datos de entrada como pertenecientes a dos o más clases diferentes.

Gradient boosting es una actualización del algoritmo adaboost que utiliza tocones de decisión en lugar de árboles. Estos tocones de decisión son similares a los árboles de un bosque aleatorio, pero solo tienen un nodo y dos hojas. El algoritmo de aumento de gradiente construye modelos secuencialmente, cada paso intenta corregir los errores de la iteración anterior. El proceso de entrenamiento a menudo comienza con la creación de un aprendiz débil como un árbol de decisión superficial para los datos de entrenamiento. Después de ese entrenamiento inicial, el impulso de gradiente calcula el error entre los valores reales y predichos (a menudo llamados residuales) y luego entrena un nuevo estimador para predecir este error. Ese nuevo árbol se agrega al conjunto para actualizar las predicciones y crear un aprendiz fuerte. El aumento de gradiente repite este proceso hasta que se detiene la mejora o hasta que se alcanza un número fijo de iteraciones. El impulso en sí mismo es similar al descenso del gradiente, pero "desciende" el gradiente mediante la introducción de nuevos modelos.

Boosting tiene varias ventajas: tiene un buen rendimiento en datos tabulares y puede manejar datos numéricos y categóricos. Funciona bien incluso con parámetros predeterminados y es resistente a los valores atípicos en el conjunto de datos. Sin embargo, puede ser lento de entrenar y, a menudo, muy sensible a los hiperparámetros establecidos para el proceso de entrenamiento. Mantener menor el número de árboles creados puede acelerar el proceso de entrenamiento cuando se trabaja con un gran conjunto de datos. Este paso generalmente se realiza a través del parámetro de profundidad máxima. El aumento de gradiente también puede ser propenso al sobreajuste si no se ajusta correctamente. Para evitar el sobreajuste, puede configurar la tasa de aprendizaje para el proceso de entrenamiento. Este proceso es aproximadamente el mismo para un clasificador o un regresor de aumento de gradiente y se utiliza en el popular xgboost, que se basa en el aumento de gradiente agregando regularización.

En este tutorial, aprenderá a usar dos lenguajes de programación diferentes y bibliotecas de aumento de gradiente para clasificar pingüinos mediante el popular conjunto de datos Palmer Penguins.

Puede descargar el cuaderno para este tutorial desde Github.