¿Qué es boosting?

¿Qué es boosting?

En machine learning, el impulso es un método de aprendizaje conjunto que combina un conjunto de aprendices débiles en un aprendiz fuerte para minimizar los errores de entrenamiento. Los algoritmos de impulso pueden mejorar el poder predictivo de la identificación de imágenes, objetos y característica, el análisis de sentimientos, la minería de datos y más.

En el boosting, se selecciona una muestra aleatoria de datos, se ajusta a un modelo y luego se entrena secuencialmente, es decir, cada modelo intenta compensar las debilidades de su predecesor. En cada iteración, las reglas débiles de cada clasificador individual se combinan para formar una regla de predicción fuerte.

Más información sobre el aprendizaje por conjuntos

El aprendizaje conjunto da crédito a la idea de la "sabiduría de las multitudes", que sugiere que la toma de decisiones de un grupo más amplio de personas suele ser mejor que la de un experto individual. Del mismo modo, el aprendizaje conjunto se refiere a un grupo de aprendices base, o modelos, que trabajan colectivamente para lograr una mejor predicción final. Un modelo único, también conocido como modelo básico o de aprendizaje débil, puede no funcionar bien individualmente debido al alta varianza o al alto sesgo. Sin embargo, cuando se agregan aprendices débiles, pueden formar un aprendiz fuerte, ya que su combinación reduce el sesgo o la varianza, lo que produce un mejor rendimiento del modelo.

Los métodos de conjunto se ilustran con frecuencia mediante árboles de decisión, ya que este algoritmo puede ser propenso al sobreajuste (varianza alta y sesgo bajo) cuando no se ha podado y también puede prestarse a un ajuste insuficiente (varianza baja y sesgo alto) cuando es muy pequeño, como un muñón de decisión, que es un árbol de decisión con un nivel. Recuerde que cuando un algoritmo se ajusta en exceso o en defecto a su conjunto de entrenamiento, no puede generalizar bien nuevos conjuntos de datos, por lo que los métodos de conjunto se emplean para contrarrestar este comportamiento y permitir la generalización del modelo a nuevos conjuntos de datos. Aunque los decision trees pueden presentar una varianza o un sesgo elevados, cabe señalar que no es la única técnica de modelado que aprovecha el aprendizaje por conjuntos para encontrar el "punto óptimo" dentro del equilibrio entre sesgo y varianza.

Las últimas tendencias de IA presentadas por expertos

Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .

¡Gracias! Ya está suscrito.

Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

Bagging vs. boosting

El bagging y el boosting son dos tipos principales de métodos de aprendizaje por conjuntos. Como se destaca en este estudio, la principal diferencia entre estos métodos de aprendizaje es la forma en que se entrenan. En bagging, los aprendices débiles se capacitan en paralelo, pero en boosting, aprenden secuencialmente. Esto significa que se construye una serie de modelos y con cada nueva iteración del modelo, se incrementan los pesos de los datos mal clasificados en el modelo anterior. Esta redistribución de pesos ayuda al algoritmo a identificar los parámetros en los que debe centrarse para mejorar su rendimiento. AdaBoost, que significa “algoritmo de refuerzo adaptativo”, es uno de los algoritmos de refuerzo más populares, ya que fue uno de los primeros de su tipo. Otros tipos de algoritmos de impulso incluyen XGBoost, GradientBoost y BrownBoost.

Otra diferencia entre bagging y boosting es cómo se utilizan. Por ejemplo, los métodos de embolsado se utilizan normalmente en aprendices débiles que muestran una alta varianza y un sesgo bajo, mientras que los métodos de refuerzo se aprovechan cuando se observa una varianza baja y un sesgo alto. Si bien el embolsado se puede utilizar para evitar el sobreajuste, los métodos de impulso pueden ser más propensos a esto, aunque realmente depende del conjunto de datos. Sin embargo, el ajuste de parámetros puede ayudar a evitar el problema.

En consecuencia, el bagging y el boosting también tienen diferentes aplicaciones en el mundo real. El bagging se empleó en procesos de aprobación de préstamos y genómica estadística, mientras que el boosting se empleó más en aplicaciones de reconocimiento de imágenes y motores de búsqueda.

AI Academy

Ponga la IA a trabajar para servicio al cliente

Vea cómo la IA generativa puede satisfacer a los clientes con una experiencia más fluida y aumentar la productividad de la organización en estas tres áreas clave: autoservicio, agentes humanos y operaciones del centro de contacto.

Tipos de impulso

Los métodos de impulso se centran en combinar iterativamente aprendices débiles para crear un aprendiz fuerte que pueda predecir resultados más precisos. Como recordatorio, un aprendiz débil clasifica los datos ligeramente mejor que las conjeturas aleatorias. Este enfoque puede proporcionar Resultados sólidos para problemas de predicción y puede superar a las neural networks y las máquinas de vectores de soporte para tareas como la recuperación de imágenes

Los algoritmos de impulso pueden diferir en la forma en que crean y agregan aprendices débiles durante el proceso secuencial. Tres tipos populares de métodos de impulso incluyen:

  • Impulso adaptativo o AdaBoost: a Yoav Freund y Robert Schapire se les atribuye la creación del algoritmo AdaBoost. Este método funciona de forma iterativa, identificando puntos de datos mal clasificados y ajustando sus pesos para minimizar el error de entrenamiento. El modelo continúa optimizándose de forma secuencial hasta que produce el predictor más fuerte.

  • Refuerzo por gradiente: Basar en el trabajo de Leo Breiman, Jerome H. Friedman desarrolló el refuerzo por gradiente, que funciona agregando secuencialmente predictores a un conjunto en el que cada uno corrige los errores de su predecesor. Sin embargo, en lugar de cambiar los pesos de los puntos de datos como AdaBoost, el gradient boosting se basa en los errores residuales del predictor anterior. El nombre, gradient boosting, se emplea ya que combina el algoritmo de descenso de gradiente y el método boosting.

  • Aumento extremo de gradiente o XGBoost: XGBoost es una implementación del aumento de gradiente diseñada para velocidad y escala computacional. XGBoost aprovecha varios núcleos en la CPU, lo que permite que el aprendizaje se produzca en paralelo durante el entrenamiento.

Beneficios y desafíos del boosting

El método de boosting presenta una serie de ventajas y retos clave cuando se utiliza para problemas de clasificación o regresión.

Los beneficios clave de boosting incluyen:

  • Facilidad de implementación: el impulso se puede emplear con varias opciones de ajuste de hiperparámetros para mejorar el ajuste. No se requiere preprocesamiento de datos, y los algoritmos de impulso tienen rutinas integradas para manejar los datos faltantes. En Python, la biblioteca scikit-learn de métodos de conjunto (también conocida como sklearn.ensemble) facilita la implementación de los métodos de impulso populares, incluidos AdaBoost, XGBoost, etc.

  • Reducción del sesgo: los algoritmos de refuerzo combinan múltiples aprendices débiles en un método secuencial, mejorando iterativamente las observaciones. Este enfoque puede ayudar a reducir el alto sesgo, comúnmente visto en decision trees superficiales y modelos de regresión logística.

  • Eficiencia computacional: dado que los algoritmos de impulso solo seleccionan características que aumentan su poder predictivo durante el entrenamiento, puede ayudar a reducir la dimensionalidad y aumentar la eficiencia computacional.

Los desafíos clave del impulso incluyen:

  •  Sobreajuste: existe cierta controversia en la investigación sobre si el impulso puede ayudar o no a reducir el sobreajuste o exacerbarlo. Lo incluimos en los desafíos porque, en los casos en que ocurre, las predicciones no se pueden generalizar a nuevos conjuntos de datos.

  •  Cálculo intenso: el entrenamiento secuencial en boosting es difícil de escalar. Dado que cada estimador se basa en sus predecesores, los modelos de impulso pueden ser costosos desde el punto de vista computacional, aunque XGBoost busca dirigirse a los problemas de escalabilidad observados en otros tipos de métodos de impulso. Los algoritmos de impulso pueden ser más lentos de entrenar en comparación con el embolsado, ya que una gran cantidad de parámetros también pueden influir en el comportamiento del modelo.

Aplicaciones de boosting

Los algoritmos de impulso son adecuados para proyectos de inteligencia artificial en una amplia gama de industrias, que incluyen:

  • Atención médica: el impulso se utiliza para reducir los errores en las predicciones de datos médicos, como la predicción de factores de riesgo cardiovascular y las tasas de supervivencia de los pacientes con cáncer. Por ejemplo, investigaciónmuestra que los métodos conjuntos mejoran significativamente la precisión en la identificación de pacientes que podrían tener un beneficio del tratamiento preventivo de enfermedades cardiovasculares, al tiempo que evitan el tratamiento innecesario de otros. Del mismo modo, otro estudio encontró que aplicar boosting a múltiples plataformas genómicas puede mejorar la predicción del tiempo de supervivencia del cáncer.

 

  • IT: Los árboles de regression de gradiente reforzado se emplean en los motores de búsqueda para la clasificación de páginas, mientras que el algoritmo de refuerzo de Viola-Jones se emplea para la recuperación de imágenes. Como señaló Cornell, los clasificadores impulsados permiten que los cálculos se detengan antes cuando está claro hacia dónde se dirige una predicción. Esto significa que un motor de búsqueda puede detener la evaluación de las páginas peor clasificadas, mientras que los escáneres de imágenes sólo tendrán en cuenta las imágenes que realmente contengan el objeto deseado.

  • Finanzas: Boosting se utiliza con modelos de aprendizaje profundo para automatizar tareas críticas, incluida la detección de fraude, el análisis de Precios y más. Por ejemplo, impulsar los métodos en la detección de fraudes con tarjetas de crédito y  el análisis de precios de productos financieros mejora la precisión del análisis de conjuntos de datos masivos para minimizar las pérdidas financieras.
Soluciones relacionadas
IBM watsonx.ai

Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Diseñe aplicaciones de IA en menos tiempo y con menos datos.

Descubra watsonx.ai
Soluciones de inteligencia artificial

Ponga la IA a trabajar en su negocio con la experiencia en IA líder en la industria y la cartera de soluciones de IBM a su lado.

Explore las soluciones de IA
Consultoría y servicios de IA

Reinvente los flujos de trabajo y las operaciones críticas añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Conozca los servicios de IA
Dé el siguiente paso

Obtenga acceso único a capacidades que abarcan el ciclo de vida del desarrollo de IA. Produzca potentes soluciones de IA con interfaces fáciles de usar, flujos de trabajo y acceso a API y SDK estándar de la industria.

Explore watsonx.ai Reserve una demostración en vivo