¿Qué es el subajuste?

Las últimas tendencias de IA presentadas por expertos

Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .

¿Qué es el subajuste?

El subajuste es un escenario en la ciencia de datos en el que un modelo de datos no puede capturar con precisión la relación entre las variables de entrada y salida, lo que genera una alta tasa de error tanto en el conjunto de entrenamiento como en los datos no vistos.

El subajuste ocurre cuando un modelo es demasiado simple, lo que puede ser el resultado de que un modelo necesite más tiempo de entrenamiento, más características de entrada o menos regularización.

Al igual que el sobreajuste, cuando un modelo tiene subajuste, no puede establecer la tendencia dominante dentro de los datos, lo que genera errores de entrenamiento y un rendimiento deficiente del modelo. Si un modelo no puede generalizarse bien a nuevos datos, entonces no se puede aprovechar para tareas de clasificación o predicción. La generalización de un modelo a nuevos datos es, en última instancia, lo que nos permite utilizar algoritmos de machine learning todos los días para hacer predicciones y clasificar datos.

El sesgo alto y la baja varianza son buenos indicadores de subajuste. Dado que este comportamiento se puede ver mientras se usa el conjunto de datos de entrenamiento, los modelos con subajuste suelen ser más fáciles de identificar que aquellos con sobreajuste.

Mixture of Experts | 12 de diciembre, episodio 85

Decodificación de la IA: Resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el revuelo de la IA para ofrecerle las últimas noticias e insights al respecto.

Vea todos los episodios de Mixture of Experts

Subajuste frente a sobreajuste

En pocas palabras, el sobreajuste es lo opuesto al subajuste, y ocurre cuando el modelo fue sobreentrenado o cuando contiene demasiada complejidad, lo que resulta en altos índices de error en los datos de prueba. Es más común sobreajustar un modelo que subadaptarlo, y el subajuste generalmente ocurre en un esfuerzo por evitar el sobreajuste a través de un proceso llamado “detención temprana”.

Si la falta de entrenamiento o falta de complejidad resulta en un subajuste, entonces una estrategia lógica de prevención sería aumentar la duración del entrenamiento o agregar insumos más relevantes. Sin embargo, si entrena demasiado el modelo o le agrega demasiadas características, puede sobreajustar su modelo, lo que resulta en un sesgo bajo, pero una alta varianza (es decir, la compensación de sesgo y varianza). En este escenario, el modelo estadístico se ajusta demasiado a sus datos de entrenamiento, lo que lo hace incapaz de generalizar bien a nuevos puntos de datos. Es importante tener en cuenta que algunos tipos de modelos pueden ser más propensos al sobreajuste que otros, como los árboles de decisión o KNN.

Identificar el sobreajuste puede ser más difícil que el subajuste porque, a diferencia del subajuste, los datos de entrenamiento funcionan con alta precisión en un modelo sobreajustado. Para evaluar la precisión de un algoritmo, normalmente se utiliza una técnica llamada validación cruzada k-fold.

En la validación cruzada de pliegues K, los datos se dividen en K subconjuntos de igual tamaño, que también se denominan "pliegues". Uno de los pliegues K actuará como conjunto de prueba, también conocido como conjunto de retención o conjunto de validación, y los pliegues restantes entrenarán el modelo. Este proceso se repite hasta que cada uno de los pliegues haya actuado como pliegue de retención. Después de cada evaluación, se conserva una puntuación y, cuando se han completado todas las iteraciones, se promedian las puntuaciones para evaluar el rendimiento del modelo global.

El escenario ideal al ajustar un modelo es encontrar el equilibrio entre el sobreajuste y el subajuste. Identificar ese "punto óptimo" entre los dos permite que los modelos de machine learning hagan predicciones con precisión.

Cómo evitar el subajuste

Dado que podemos detectar el subajuste a partir del conjunto de entrenamiento, podemos ayudar mejor a establecer la relación dominante entre las variables de entrada y salida desde el inicio. Manteniendo una complejidad adecuada del modelo, podemos evitar el subajuste y realizar predicciones más precisas. A continuación, se presentan algunas técnicas que se pueden emplear para reducir el subajuste:

Disminuir la regularización

La regularización se utiliza normalmente para reducir la varianza con un modelo al aplicar una penalización a los parámetros de entrada con los coeficientes más grandes. Existen varios métodos diferentes, como la regularización L1, la regularización Lasso, la deserción, etc., que ayudan a reducir el ruido y los valores atípicos dentro de un modelo. Sin embargo, si las características de los datos se vuelven demasiado uniformes, el modelo no puede identificar la tendencia dominante, lo que lleva a un ajuste insuficiente. Al disminuir la cantidad de regularización, se introduce más complejidad y variación en el modelo, lo que permite un entrenamiento exitoso del modelo.

Aumentar la duración del entrenamiento

Como se mencionó anteriormente, detener el entrenamiento demasiado pronto también puede resultar en un modelo inadecuado. Por lo tanto, al extender la duración del entrenamiento, se puede evitar. Sin embargo, es importante ser consciente del sobreentrenamiento y, posteriormente, del sobreajuste. Encontrar el equilibrio entre los dos escenarios será clave.

Selección de características

Con cualquier modelo, se emplean características específicas para determinar un resultado determinado. Si no hay suficientes características predictivas presentes, entonces se deberían introducir más características o características con mayor importancia. Por ejemplo, en una red neuronal, puedes agregar más neuronas ocultas o en un bosque aleatorio, puedes agregar más árboles. Este proceso inyectará más complejidad al modelo, produciendo mejores resultados de entrenamiento.

Ciencia de datos y MLOps para líderes de datos

Una fuerzas con otros líderes para impulsar los tres pilares esenciales de MLOps y la IA confiable: confianza en los datos, confianza en los modelos y confianza en los procesos.

Recursos

Amplíe sus conocimientos de aprendizaje automático (ML)

Aprenda los conceptos fundamentales y construya sus habilidades con laboratorios prácticos, cursos, proyectos guiados, ensayos y mucho más.

Desbloquee el poder de la IA generativa + ML

Aprenda a incorporar con confianza la IA generativa y el aprendizaje automático en su negocio.

Explicación del machine learning

Techsplainers de IBM desglosa los fundamentos del machine learning, desde conceptos clave hasta casos de uso del mundo real. Los episodios claros y rápidos le ayudan a aprender los fundamentos rápidamente.

Ponga la IA a trabajar: Impulso del retorno de la inversión (ROI) con IA generativa

¿Quiere rentabilizar mejor sus inversiones en IA? Descubra cómo la IA generativa escalable en áreas clave impulsa el cambio ayudando a sus mejores mentes a crear y ofrecer nuevas soluciones innovadoras.

Cómo elegir el modelo fundacional adecuado

Aprenda a seleccionar el modelo fundacional de IA más adecuado para su caso de uso.

Explorar IBM Granite

IBM Granite es nuestra familia de modelos de IA abiertos, de alto rendimiento y confiables, diseñados para empresas y optimizados para escalar sus aplicaciones de IA. Explore opciones de lenguaje, código, series de tiempo y medidas de protección.

Cómo prosperar en esta nueva era de la IA con confianza y seguridad

Indague en los 3 elementos críticos de una estrategia sólida de IA: crear una ventaja competitiva, escalar la IA en todo el negocio y avanzar en la IA confiable.

Soluciones relacionadas

IBM watsonx.ai

Entrene, valide, ajuste y despliegue IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de próxima generación para creadores de IA. Diseñe aplicaciones de IA en menos tiempo y con menos datos.

Descubra watsonx.ai

Soluciones de inteligencia artificial

Ponga la IA a trabajar en su negocio con la experiencia en IA líder en la industria y la cartera de soluciones de IBM a su lado.

Explore las soluciones de IA

Consultoría y servicios de IA

Reinvente los flujos de trabajo y las operaciones críticas añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.

Conozca los servicios de IA

Dé el siguiente paso

Obtenga acceso único a capacidades que abarcan el ciclo de vida del desarrollo de IA. Produzca potentes soluciones de IA con interfaces fáciles de usar, flujos de trabajo y acceso a API y SDK estándar de la industria.

Explore watsonx.ai

Reserve una demostración en vivo

¿Qué es el subajuste?

Las últimas tendencias de IA presentadas por expertos

¡Gracias! Ya está suscrito.