¿Qué es AutoML?

Autores

Staff writer

Staff Editor, AI Models

IBM Think

¿Qué es AutoML?

El machine learning automatizado (AutoML) es la práctica de automatizar el desarrollo integral de modelos de machine learning (modelos ML). AutoML permite a los no expertos crear e implementar sistemas de inteligencia artificial (IA) al tiempo que agiliza los flujos de trabajo de IA para científicos de datos y desarrolladores.

Las herramientas AutoML simplifican el proceso de creación de modelos ML. Los usuarios obtienen beneficio de una interfaz intuitiva a través de la cual pueden crear, entrenar, validar e implementar modelos de IA generativa y otros sistemas de deep learning. AutoML facilita la implementación de IA en industrias reguladas con sus resultados explicables y reproducibles.

Sin AutoML, cada paso del flujo de trabajo de machine learning (ML), preparación de los datos, preprocesamiento de datos, ingeniería de características y optimización de hiperparámetros, debe llevarse a cabo manualmente. AutoML democratiza el machine learning haciéndolo accesible a cualquier persona interesada en explorar su potencial. Mientras tanto, los equipos experimentados de MLOps y los profesionales de la ciencia de datos pueden automatizar los aspectos rutinarios de los flujos de trabajo de machine learning mientras se centran en tareas de aprendizaje más exigentes.

Las últimas tendencias en IA, presentadas por expertos

Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.

¿Cómo funciona AutoML?

Las soluciones de AutoML funcionan creando numerosas canalizaciones de machine learning para gestionar la tarea prevista y, a continuación, identificando la opción óptima. La evaluación y selección de modelos se automatizan como parte del proceso iterativo de elección del mejor modelo para el puesto. Las herramientas de visualización de datos facilitan aún más el uso del proceso de AutoML.

La diferencia entre AutoML y el machine learning tradicional es que AutoML automatiza casi todas las etapas de la canalización del machine learning. Las canalizaciones tradicionales consumen mucho tiempo, recursos y son propensas a errores humanos. En comparación, los avances en AutoML han llevado a una mayor eficiencia y mejores resultados.

Una canalización típica de machine learning consta de los siguientes pasos:

Preparación de los datos y preprocesamiento

La preparación de los datos es el proceso de recopilar datos sin procesar e integrarlos en un conjunto de datos de entrenamiento. La preparación de los datos ayuda a garantizar que los datos de entrenamiento estén libres de sesgos y es lo que establece un modelo para el éxito: los datos precisos conducen a predicciones y conocimientos precisos. A medida que las empresas vinculan los sistemas de IA con almacenes de datos propios, como a través de generación aumentada por recuperación (RAG), la preparación de los datos es crítica para una implementación fiable de la IA.

Los usuarios conectan la plataforma AutoML con la fuente de los datos de entrenamiento, idealmente un gran conjunto de datos que esté listo para usar en el entrenamiento. La fase de preparación de los datos se produce antes de implementar una solución AutoML.

La solución AutoML interviene para preprocesar y limpiar aún más los datos. Un preprocesamiento de datos más exhaustivo conduce a un mejor rendimiento del modelo de IA.

Al crear manualmente modelos para tareas de aprendizaje supervisado y semisupervisado, los datos de entrenamiento deben etiquetarse manualmente. Las características y los resultados deben seleccionarse en función del caso de uso del modelo. Las soluciones AutoML pueden gestionar la ingeniería de características en nombre de los usuarios para seleccionar las características de datos que tienen más probabilidades de mejorar el rendimiento del modelo.

Ingeniería de características

Las características o variables de los datos son los atributos de un conjunto de datos que los modelos de machine learning utilizan para tomar decisiones y hacer predicciones. Por ejemplo, para un modelo de visión artificial construido para identificar especies vegetales, las características de los datos podrían incluir la forma y el color de las hojas.

La ingeniería de características es el proceso transformador mediante el cual un científico de datos extrae nueva información de los datos de entrada y la prepara para el machine learning. Una buena selección de ingeniería y funciones puede determinar la diferencia entre un rendimiento de modelo aceptable y uno de alta calidad.

La ingeniería automatizada de características automatiza el proceso de exploración del espacio de características, rellenando los valores que faltan y seleccionando las características que se van a utilizar. Crear manualmente una sola función puede llevar horas y el número de funciones necesario para obtener una puntuación de precisión mínima (y mucho menos una línea base de precisión a nivel de producción) puede llegar a los cientos. La ingeniería automatizada de funciones reduce esta fase de días a minutos.

Además de los beneficios de eficiencia, la eficiencia de las funciones automatizadas también aumenta la explicabilidad de la IA, lo cual es importante para sectores estrictamente regulados, como la atención médica o las finanzas. Una mayor claridad de las funciones hace que los modelos sean más atractivos y que se puedan ejecutar al descubrir nuevos KPI.

Selección de modelos, ajuste de hiperparámetros y entrenamiento de modelos

¿Qué tipo de modelo es mejor para el caso de uso previsto? Con el machine learning tradicional, la selección de modelos requiere un conocimiento experto de los tipos de modelos de IA junto con sus respectivas capacidades y limitaciones.

Las herramientas de AutoML mejoran los procesos tradicionales al crear y entrenar automáticamente varios modelos simultáneamente con una variedad de algoritmos y configuraciones de hiperparámetros. Muchas soluciones de AutoML combinan varios modelos en un proceso conocido como aprendizaje por conjuntos.

Búsqueda de arquitectura neuronal (NAS)

Una de las tareas más complicadas, propensas a errores y que más tiempo consumen a la hora de construir redes neuronales profundas es la creación de la arquitectura neuronal. Las tareas avanzadas requieren redes multicapa con configuraciones complejas de hiperparámetros.

La búsqueda de arquitectura neuronal (NAS) automatiza este proceso, lo que reduce el tiempo dedicado y la posibilidad de error. Con el uso de algoritmos avanzados, NAS identifica la arquitectura óptima en función del contexto y el conjunto de datos. Los avances recientes en NAS se centran en el desarrollo de técnicas más eficientes para reducir los costes computacionales asociados.

Optimización de hiperparámetros

Los hiperparámetros son las reglas que rigen el proceso de aprendizaje del modelo. A diferencia de los parámetros internos que un modelo actualiza durante el entrenamiento, los hiperparámetros son externos al modelo y los configuran los científicos de datos. La estructura de redes neuronales también se define mediante hiperparámetros.

En contextos de modelado de datos a pequeña escala, los hiperparámetros se pueden configurar y optimizar manualmente mediante prueba y error. Pero con las aplicaciones de deep learning, el número de hiperparámetros crece exponencialmente. La optimización automatizada de hiperparámetros permite a los equipos iterar y experimentar para descubrir los mejores hiperparámetros en todas las características y modelos.

El ajuste de hiperparámetros se automatiza mediante algoritmos avanzados como la optimización bayesiana. El ajuste automatizado de hiperparámetros libera a los científicos de datos para que se centren en el por qué de la creación de modelos en lugar del cómo durante el proceso de machine learning. Los equipos de análisis pueden centrarse en optimizar los modelos para caso de uso designados, por ejemplo, para minimizar los falsos negativos en las pruebas médicas.

Validación y pruebas

Los científicos de datos necesitan validar el progreso de un algoritmo de machine learning durante el entrenamiento. Tras el entrenamiento, el modelo se prueba con nuevos datos para evaluar su rendimiento antes de su implementación en el mundo real. El rendimiento del modelo se evalúa con métricas que incluyen una matriz de confusión, la puntuación de la F1, la curva ROC y otros.

Una vez completado el entrenamiento, la herramienta AutoML prueba cada modelo para identificar cuál obtiene mejores resultados en los conjuntos de datos de entrenamiento y de prueba, y selecciona automáticamente el modelo con mejores resultados para su implementación.

Implementación de modelos

La creación de modelos es solo el primer paso en la línea de tiempo del producto. Los modelos completados deben ponerse a disposición de los usuarios, monitorizar su rendimiento y mantenerlos a lo largo del tiempo para ayudar a garantizar la fiabilidad y la precisión. Sin automatización, los equipos de desarrollo deben escribir scripts y crear sistemas para integrar el modelo en sus operaciones y entregarlo a su base de usuarios.

Muchas soluciones AutoML incluyen herramientas de implementación para una integración perfecta en el mundo real. Los modelos pueden implementarse como un servicio accesible a través de una página web, una aplicación o una conexión API. Las plataformas AutoML pueden automatizar la implementación de modelos en ofertas de productos preexistentes, gestionar el escalado, las actualizaciones y la creación de versiones, y aumentar la explicabilidad con la visualización de datos.

AI Academy

Conviértase en un experto en IA

Obtenga los conocimientos necesarios para priorizar las inversiones en IA que impulsan el crecimiento empresarial. Dé sus primeros pasos hoy mismo con nuestra AI Academy gratuita y lidere el futuro de la IA en su organización.

Vea la serie

Casos de uso de AutoML

La gran variedad de herramientas AutoML permite aplicar la técnica a una amplia gama de tareas de machine learning, entre las que se incluyen:

Clasificación

Regression

Visión artificial

Procesamiento del lenguaje natural

Clasificación

Clasificación es la tarea de machine learning de asignar entradas de datos en categorías designadas. Los modelos predictivos utilizan las características de los datos de entrada para predecir las etiquetas correctas, o salidas. Los sistemas de AutoML pueden compilar y probar una matriz de algoritmos, como bosques aleatorios y máquinas de vectores de soporte (SVM), para procesar datos tabulares.

Las herramientas de AutoML detectan automáticamente patrones en conjuntos de datos etiquetados y pueden diseñar modelos para tareas de clasificación comunes, como la detección del fraude y el filtrado de correo electrónico no deseado.

Regresión

La regresión en el machine learning es el desafío de usar datos históricos para predecir valores futuros. La regresión lineal predice el valor de una variable dependiente en función de una o más variables independientes, por ejemplo, con el análisis de riesgos o la previsión del mercado. La regresión logística predice la probabilidad de un evento futuro, como la probabilidad de que un paciente contraiga una enfermedad, en lugar de un valor discreto.

AutoML agiliza el proceso de establecer relaciones entre las variables de entrada y las variables de destino, especialmente con tareas multivariantes complejas.

Visión artificial

La visión artificial es el uso de ordenadores para procesar datos visuales, como imágenes y vídeos. Los sistemas AutoML pueden generar modelos orientados a tareas de clasificación basadas en la visión, como la detección de objetos, la clasificación de imágenes y el reconocimiento óptico inteligente de caracteres. Los casos de uso pueden abarcar la moderación y el filtrado de contenidos, el etiquetado de imágenes y otras tareas relacionadas.

Los sistemas AutoML también pueden afinar modelos para su uso en contextos de visión artificial más avanzados, como con automóviles autónomos.

Procesamiento del lenguaje natural (PLN)

El procesamiento del lenguaje natural (PLN) permite a los sistemas de IA interpretar entradas textuales, como instrucciones del usuario y documentos legales. La creación de chatbots, la clasificación de texto multiclase y multietiqueta, el análisis de la opinión del cliente, el reconocimiento de entidades nombradas y la traducción de idiomas son ejemplos de tareas complejas de PLN que pueden gestionarse fácilmente con AutoML.

Los científicos de datos pueden crear modelos personalizados con AutoML que se optimizan automáticamente para obtener un rendimiento sólido en sus casos de uso previstos. De lo contrario, al crear modelos de PLN manualmente, los científicos de datos deben empezar de cero o basar sus modelos en modelos anteriores que podrían no funcionar tan bien como un modelo personalizado generado automáticamente.

Limitaciones de AutoML

Aunque AutoML aporta muchos beneficios a los desarrolladores de IA, no es un sustituto absoluto del conocimiento, la experiencia, las habilidades y la creatividad humanos. Las limitaciones de AutoML incluyen:

Costes elevados: cuanto más exigente sea la tarea, más avanzado debe ser el modelo correspondiente. Los costes de AutoML pueden descontrolarse rápidamente cuando la técnica se aplica a la creación de modelos grandes y complejos.

Falta de interpretabilidad: los modelos generados por AutoML a veces pueden caer en la trampa de la "IA de caja negra", donde el funcionamiento interno del modelo es obtuso. Los desarrolladores humanos pueden construir modelos diseñados de acuerdo con los principios de la IA explicable, pero esto no está garantizado con las soluciones AutoML.

Riesgo de sobreajuste: el sobreajuste,en el que un modelo entrenado se ajusta demasiado a sus datos de entrenamiento y no transfiere su aprendizaje a datos del mundo real, puede mitigarse con intervención humana y una monitorización cuidadosa del proceso de aprendizaje.

Control limitado: los desarrolladores sacrifican el control por la eficiencia con la automatización. En casos específicos en los que se necesitan modelos altamente personalizados, las soluciones AutoML pueden tener dificultades para ofrecer un modelo adecuado.

Dependencia de los datos: un modelo de IA es tan sólido como sus datos de entrenamiento. Tanto los modelos creados por humanos como los creados por AutoML no pueden funcionar bien si no se les proporcionan datos de alta calidad.

Herramientas AutoML

Los creadores de modelos de IA tienen una amplia gama de herramientas de AutoML al alcance de la mano. Las opciones incluyen:

AutoKeras: una herramienta de código abierto basada en la biblioteca Keras y TensorFlow.

Auto-PyTorch: una solución de AutoML diseñada para automatizar proyectos de machine learning creados con PyTorch.

Google Cloud AutoML: la solución AutoML de Google disponible en su plataforma en la nube para machine learning.

Lale¹: una biblioteca de Python semiautomatizada de código abierto que se integra perfectamente con las canalizaciones de scikit-learn.

Microsoft Azure AutoML: los desarrolladores que utilicen Microsoft Azure pueden obtener beneficio de sus capacidades AutoML.

Auto-Sklearn: una plataforma AutoML de código abierto basada en la biblioteca scikit-learn.

Ciencia de datos y MLOps para líderes de datos

Manténgase alineado con otros líderes en los 3 objetivos clave de MLOps y la IA fiable: la confianza en los datos, la confianza en los modelos y la confianza en los procesos.

Notas a pie de página

1. Library for Semi-Automated Data Science. Hirzel et al. IBM/lale. 28 de agosto de 2024.

¿Qué es AutoML?

¿Qué es AutoML?

Las últimas tendencias en IA, presentadas por expertos

¡Gracias! Está suscrito.

¿Cómo funciona AutoML?

Preparación de los datos y preprocesamiento

Ingeniería de características

Selección de modelos, ajuste de hiperparámetros y entrenamiento de modelos

Búsqueda de arquitectura neuronal (NAS)

Optimización de hiperparámetros

Validación y pruebas

Implementación de modelos

Conviértase en un experto en IA

Casos de uso de AutoML

Clasificación

Regresión

Visión artificial

Procesamiento del lenguaje natural (PLN)

Limitaciones de AutoML

Herramientas AutoML

Recursos

Notas a pie de página