AutoML
leadspace en la nube
¿Qué es AutoML?

Descubra cómo AutoML puede ayudarle a crear soluciones de IA repetibles y explicables.

Automated Machine Learning (AutoML)se ha convertido en un tema de tendencia en la industria y en el ámbito de investigación académica de inteligencia artificial (IA) en los últimos años. AutoML se muestra muy prometedor al proporcionar soluciones para la IA en industrias reguladas al proporcionar resultados explicables y reproducibles. AutoML permite un mayor acceso al desarrollo de IA para aquellos que no tienen los antecedentes teóricos que actualmente se necesitan para desempeñar un papel endata science

Cada paso en la actual canalización de la ciencia de datos prototípica, como el preprocesamiento de datos, la ingeniería de características y la optimización de hiperparámetros, debe ser realizado manualmente por expertos en machine learning. En comparación, la adopción de AutoML permite un proceso de desarrollo más simple mediante el cual unas pocas líneas de código pueden generar el código necesario para comenzar a desarrollar un modelo de machine learning. 

Se puede pensar en AutoML, independientemente de si se están construyendo clasificadores o entrenando regresiones, como un concepto de búsqueda generalizado, con algoritmos de búsqueda especializados para encontrar las soluciones óptimas para cada componente de la canalización de ML. Al construir un sistema que permite la automatización de solo tres piezas clave de automatización: ingeniería de funciones, optimización de hiperparámetros y búsqueda de arquitectura neuronal, AutoML promete un futuro en el que el machine learning democratizado es una realidad. 

Productos destacados

Watson Studio


Tipos de AutoML

En una canalización de ciencia de datos, hay muchos pasos que un equipo de ciencia de datos debe seguir para construir un modelo predictivo. Incluso los equipos experimentados de científicos de datos e ingenieros de ML pueden beneficiarse de la mayor velocidad y transparencia que viene con AutoML. Un científico de datos tiene que comenzar con una hipótesis, recopilar el conjunto de datos correcto, probar la visualización de datos, diseñar funciones adicionales para aprovechar toda la señal disponible, entrenar un modelo con hiperparámetros (el enlace externo a IBM), y para el deep learning de vanguardia, tienen que diseñar la arquitectura óptima para una red neuronal profunda, con suerte, en una GPU, si está disponible para ellos.

 

Automated Feature Engineering


Una característica de datos es parte de los datos de entrada a un modelo de machine learning, y la ingeniería de características se refiere al proceso transformador en el que un científico de datos obtiene nueva información de los datos existentes. La ingeniería de características es uno de los procesos clave de valor agregado en un flujo de trabajo de ML, y las buenas características son la diferencia entre un modelo con un rendimiento aceptable y un modelo con un rendimiento brillante. Estas transformaciones matemáticas de datos sin procesar se leen en el modelo y sirven como el corazón del proceso de machine learning. La Ingeniería de funciones automatizada (PDF 1,7 MB) (Automated Feature Engineering - AFE) (enlace externo a IBM) es el proceso de explorar el espacio de las combinaciones viables de características de una manera mecanicista, en lugar de manual.

La ingeniería de características manual es una alquimia moderna que tiene un gran costo en términos de tiempo: la creación de una sola característica a menudo puede llevar horas, y la cantidad de características necesarias para una puntuación de precisión mínima, y aún más una línea de base de precisión a nivel de producción, puede contarse en cientos. Al automatizar la exploración de un espacio de funciones, AutoML reduce el tiempo que un equipo de ciencia de datos pasa en esta etapa de días a minutos.

Reducir las horas de intervención manual de un científico de datos no es el único beneficio de la ingeniería de funciones automatizada. Las características generadas a menudo son claramente interpretables. En industrias estrictamente reguladas como la salud o las finanzas, esa explicabilidad (enlace externo a IBM) es importante porque reduce las barreras para adoptar IA a través de la interpretabilidad. Además, un científico o analista de datos se beneficia de la claridad de estas características porque hacen que los modelos de alta calidad sean más atractivos y prácticos. Las funciones generadas automáticamente también tienen el potencial de encontrar nuevos KPI para que una organización los controle y actúe. Una vez que un científico de datos ha completado la ingeniería de características, debe optimizar sus modelos con la selección de características estratégicas.

 

Optimización automatizada de hiperparámetros


Los hiperparámetros son parte de los algoritmos de machine learning que se entienden mejor por analogía como palancas para ajustar el rendimiento del modelo, aunque a menudo los ajustes incrementales tienen un impacto enorme. En el modelado de ciencia de datos a pequeña escala, los hiperparámetros se pueden configurar fácilmente a mano y optimizar mediante prueba y error.

Para las aplicaciones de deep learning, la cantidad de hiperparámetros crece exponencialmente, lo que coloca su optimización más allá de las capacidades de un equipo de ciencia de datos para lograrlo de manera manual y oportuna. La optimización automatizada e hiperparámetros o Automated hyperparameter optimization (HPO) (enlace externo a IBM) libera a los equipos de la intensa responsabilidad de explorar y optimizar en todo el espacio de eventos para los hiperparámetros y, en cambio, permite a los equipos iterar y experimentar con características y modelos.

Otro punto fuerte de la automatización del proceso de machine learning es que ahora los científicos de datos pueden centrarse en elpor quéde la creación de modelos en lugar del cómo.Teniendo en cuenta las cantidades extremadamente grandes de datos disponibles para muchas empresas y la abrumadora cantidad de preguntas que se pueden responder con estos datos, un equipo de análisis puede prestar atención a qué aspectos del modelo deben optimizar, como el clásico problema de minimizar los falsas negativos en pruebas médicas.

Búsqueda de arquitectura neuronal o Neural Architecture Search (NAS)


El proceso más complejo y lento del deep learninges la creación de la arquitectura neuronal. Los equipos de ciencia de datos dedican mucho tiempo a seleccionar las capas adecuadas y las tasas de aprendizaje que, al final, suelen ser solo para los pesos del modelo, como en muchos modelos de lenguaje. La búsqueda de arquitectura neuronal o Neural architecture search (NAS) (enlace externo a IBM) se ha descrito como "utilizar redes neuronales para diseñar redes neuronales" y es una de las áreas más obvias de ML para beneficiarse de la automatización.

Las búsquedas de NAS comienzan con la elección de qué arquitecturas probar. El resultado de NAS está determinado por la métrica con la que se evalúa cada arquitectura. Hay varios algoritmos comunes para usar en una búsqueda de arquitectura neuronal. Si el número potencial de arquitecturas es pequeño, las opciones de prueba se pueden realizar al azar. Los enfoques basados en gradientes, en los que el espacio de búsqueda discreto se convierte en una representación continua, han demostrado ser muy eficaces. Los equipos de ciencia de datos también pueden probar algoritmos evolutivos en los que las arquitecturas se evalúan al azar y los cambios se aplican lentamente, propagando las arquitecturas secundarias que tienen más éxito mientras se eliminan las que no lo tienen.

Las búsquedas de arquitectura neuronal son uno de los elementos clave de AutoML que prometen democratizar la IA. Sin embargo, estas búsquedas suelen tener una huella de carbono muy alta. Aún no se ha realizado una evaluación de estas compensaciones y la optimización del costo ecológico es un área de búsqueda continua en los enfoques de NAS.

Enlaces relacionados

Ciencia de datos

Machine learning

AutoAI


Estrategias para usar AutoML

El machine learning automatizado (AML) suena como una panacea del solucionismo técnico que una organización puede usar para reemplazar a los costosos científicos de datos, pero en realidad su uso requiere estrategias inteligentes para una organización. Los científicos de datos cumplen funciones esenciales para diseñar experimentos, traducir resultados en resultados comerciales y mantener el ciclo de vida completo de sus modelos de machine learning. Entonces, ¿cómo pueden los equipos multifuncionales hacer uso de AutoML para optimizar el uso del tiempo y acortar el tiempo para obtener valor de sus modelos?

El flujo de trabajo óptimo para incluir API de AutoML es aquel que lo usa para paralelizar cargas de trabajo y acortar el tiempo dedicado a tareas intensivas manualmente. En lugar de pasar días ajustando hiperparámetros, un científico de datos podría automatizar este proceso en múltiples tipos de modelos al mismo tiempo y luego probar cuál fue el más eficiente.  

Además, existen funciones de AutoML que permiten a los miembros del equipo con diferentes niveles de habilidad contribuir ahora a la canalización de la ciencia de datos. Un analista de datos sin experiencia en Python podría aprovechar un conjunto de herramientas, como AutoAI en Watson Studio, para entrenar un modelo predictivo utilizando los datos que pueden extraer por sí mismos mediante consultas. Con AutoML, un analista de datos ahora puede preprocesar datos, construir una canalización de machine learning y producir un modelo completamente entrenado que puede usar para validar sus propias hipótesis sin requerir la atención de un equipo completo de ciencia de datos.


AutoML e IBM AutoAI

Los investigadores y desarrolladores de IBM contribuyen al crecimiento y desarrollo de AutoML. Desarrollo continuo de productos con AutoAI en IBM Watson y el trabajo de los IBM Researchers en Lale (enlace externo a IBM), una biblioteca de ciencia de datos automatizada de código abierto, son solo algunas de las formas en que IBM ayuda a crear la próxima generación de enfoques de IA. Si bien Lale es un proyecto de código abierto, en realidad es fundamental para muchas de las capacidades de AutoAI. 

Para los equipos de ciencia de datos que trabajan con Python como el núcleo de su solución de ML, Lale ofrece una biblioteca semiautomatizada que se integra a la perfección en canalizaciones scikit-learn(enlace externo a IBM), diferente a auto-sklearn (enlace externo a IBM), o una biblioteca como TPOT (enlace externo a IBM). Lale va más allá de scikit-learn con automatización, evaluaciones de corrección e interoperabilidad. Si bien se basa en el paradigma scikit-learn, tiene un número creciente de transformadores y operadores de otras bibliotecas de Python y de bibliotecas en lenguajes como Java y R. 

AutoAI proporciona todos los elementos del machine learning automatizado descritos anteriormente y más. Las capacidades actuales de Auto ML automatizan solo una pequeña parte de las cargas de trabajo del científico de datos y del ingeniero de ML. Watson Studio y AutoAI permiten que un equipo de ciencia de datos automatice rápidamente todo el ciclo de vida de AI / ML y experimente para solucionar desafíos comerciales. Los equipos pueden acortar su tiempo de comercialización con sus capacidades predictivas comenzando con un conjunto de prototipos para modelos de machine learning. AutoAI en Watson Studio simplifica la ingeniería de funciones automatizada, la optimización de hiperparámetros automatizada y la selección de modelos de machine learning. Los equipos de científicos de datos y analistas de datos pueden evaluar sus hipótesis rápidamente y, cuando hayan certificado la validez de sus modelos, ya pueden haberlos implementado para su consumo en contextos de producción o control de calidad. 

Si usted o su equipo desean probar AutoML para prácticas avanzadas de ciencia de datos, podemos asociarnos con usted en sus iniciativas de creación de modelos más recientes. Las organizaciones han demostrado el valor de crear rápidamente prototipos de capacitación, selección e implementación de modelos. Si recién está comenzando, considere algunos de los tutoriales y casos de uso sobre IBM Developer

Regístrese para obtener una cuenta gratuita de IBM Cloud donde puede probar Rapid Prototyping with AutoAI en Watson Studio con un Plan Lite


Soluciones relacionadas

AutoAI

AutoAI es una variación del machine learning automatizado (AutoML). Extiende la automatización de la construcción de modelos a todo el ciclo de vida de un modelo de machine learning.