Las últimas tendencias en IA, presentadas por expertos
Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.
El ciclo de vida de la IA es un proceso estructurado e iterativo de planificación, formación, implementación y mantenimiento de los sistemas de IA. Esto implica no solo el entrenamiento de modelos de machine learning, sino también la recopilación y la preparación de datos de entrenamiento, sistemas para evaluar y mejorar el rendimiento, y la integración de los modelos entrenados en aplicaciones de IA del mundo real.
El ciclo de vida de la IA comprende todo, desde la decisión inicial de resolver un problema específico con inteligencia artificial, hasta el uso activo de un modelo entrenado en un flujo de trabajo del mundo real. La noción de ciclos de vida de la IA está estrechamente relacionada con las disciplinas de operaciones de machine learning (MLOps) y sistemas de gestión de IA (AIMS), las cuales implican enfoques sistemáticos para el desarrollo, el gobierno y el mantenimiento de la IA.
Un aspecto fundamental del concepto de los ciclos de vida del desarrollo de la IA es que las soluciones de IA no se diseñan ni se implementan de forma aislada: se trata de sistemas dinámicos cuya eficacia a largo plazo depende de una planificación minuciosa y un seguimiento riguroso. Existen dependencias esenciales entre cada paso del proceso de desarrollo e implementación de la IA, y comprender estas dependencias es esencial para construir soluciones con IA que sean exitosas, escalable y sostenibles.
Este artículo desglosará cada uno de los pasos esenciales del ciclo de vida de la IA.
Obtenga conocimientos organizados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM.
La primera fase, y posiblemente la más importante, de la gestión del ciclo de vida de la IA es la fase de planificación, en la que identifica el caso de uso de su aplicación de IA: el problema que se pretende resolver con la IA y las tareas específicas que esta puede realizar para contribuir a su resolución. Todas las decisiones posteriores deben referirse a las decisiones tomadas durante el proceso de planificación.
Es esencial ser minucioso y tener en cuenta todas y cada una de las contingencias. Saltarse ciertas consideraciones no ahorra trabajo: solo pospone y exacerba ese trabajo. Se debe incluir y consultar a todos los stakeholders pertinentes en la fase de planificación, tanto para aprovechar su experiencia o perspectiva particulares como para garantizar el consenso sobre cómo van a proceder las cosas a partir de ahora.
Defina el alcance de su proyecto de IA. ¿En qué aspectos de su problema le ayudará o prestará apoyo su solución de IA? ¿Qué aspectos están fuera de los límites?
Defina sus necesidades. Dentro de las áreas problemáticas en las que va a utilizar la IA, ¿qué es exactamente lo que necesita que haga? Es importante comprender qué es factible y qué no, tanto en lo que respecta a las capacidades actuales de la IA como a los recursos disponibles para llevar a cabo este proyecto.
Defina el éxito. Tanto cualitativa como (especialmente) cuantitativamente, ¿qué se considera un resultado exitoso? Establecer métricas de éxito desde el principio permite orientar las decisiones de diseño y guiar el desarrollo y la optimización de su sistema de IA.
Evalúe los riesgos. Identifique cualquier aspecto en el que su solución de IA, tal y como se ha definido hasta ahora, pueda afectar negativamente a su organización o a sus usuarios. Los riesgos éticos, reputacionales y financieros deben identificarse y abordarse antes de pasar a la fase de recopilación de datos, sobre todo teniendo en cuenta que una gestión inadecuada de los datos suele ser la causa de dichos riesgos.
Desde el punto de vista técnico, la calidad y la cantidad de los datos de entrenamiento son el factor más importante para determinar la eficacia de sus modelos de IA.
Tenga en cuenta que todo el machine learning depende del reconocimiento de patrones aplicado. Un modelo de machine learning entrenado utiliza los patrones que ha “aprendido” de sus datos de entrenamiento para inferir el resultado óptimo para una entrada determinada. Es necesario que la calidad de los datos sea suficiente para garantizar que los patrones que aprende coincidan con los de los nuevos datos sobre los que realizará inferencias en aplicaciones del mundo real. Es necesario un volumen de datos suficiente para garantizar que el modelo haya aprendido todos los patrones a los que tendrá que recurrir, así como para evitar el sobreajuste.
Evalúe las fuentes de datos relevantes a su disposición, desde conjuntos de datos de código abierto disponibles en plataformas como Hugging Face o Kaggle hasta web scraping y el uso de los datos propietarios de su organización. Cuando los datos de alta calidad son extremadamente escasos o costosos, los datos sintéticos pueden, en ocasiones, suplir esas carencias.
Los datos sin procesar rara vez están listos para el machine learning: generalmente requieren cierto grado de preprocesamiento antes de su uso en pipelines de entrenamiento de modelos. La ingeniería de características es una parte destacada de este proceso.
El aprendizaje supervisado requiere etiquetar datos, lo que a menudo exige al menos cierto grado de intervención humana manual que consume mucho tiempo (aunque la automatización suele agilizar el proceso). Etiquetar datos en algunos dominios especializados requerirá la entrada de un experto. Incluso los conjuntos de datos que contienen datos preetiquetados deben inspeccionarse para garantizar la precisión y relevancia de las etiquetas para su caso de uso específico.
Los datos extraídos de diferentes fuentes de datos deben normalizarse y uniformarse en términos de unidades y formato: por ejemplo, entrenar un modelo con datos meteorológicos presentados tanto en Celsius como en Fahrenheit conducirá inevitablemente al fracaso.
Los datos no deben descartarse sin más tras el entrenamiento del modelo. Deben almacenarse y mantenerse en caso de que necesite auditar su sistema, explorar problemas de rendimiento, replicar sus modelos o cumplir con los requisitos regulatorios del RGPD o marcos similares.
Un gobierno de datos es un componente esencial de la explicabilidad de la IA, la protección de datos y el cumplimiento normativo, especialmente en los sectores y los casos de uso que implican datos que contienen información confidencial. También es un componente necesario para establecer pipelines de datos para optimizar el suministro de datos escalable, especialmente cuando el flujo de trabajo de la IA utiliza datos propios que se actualizan continuamente.
Lo siguiente es la selección del modelo: elegir la arquitectura del modelo que mejor se adapte a su caso de uso, datos de entrenamiento y recursos computacionales. Existe una enorme variedad de algoritmos de machine learning, que van desde modelos de regresión pequeños y sencillos hasta redes neuronales masivas y de última generación. El modelo más grande y sofisticado no siempre es la elección más sabia: hay tareas para las que los grandes modelos de deep learning son excesivos, e incluso tareas en las que los modelos convencionales de machine learning superan a sus homólogos de deep learning.
Cuando se trata de IA generativa, entrenar LLM y otros tipos de modelos generativos desde cero requiere una inversión masiva en tiempo, datos, hardware y energía. En la mayoría de los casos, la necesidad de un modelo generativo personalizado se satisface mejor afinando un modelo preentrenado. Pero incluso en el ámbito de los modelos predefinidos existe una gran variedad en cuanto a tamaño, arquitectura y capacidades.
Las pruebas de rendimiento son una guía útil para determinar qué modelos destacan en cada aspecto, pero no deben tomarse como una verdad absoluta. Si su problema está bien definido, vale la pena estudiar la viabilidad de desarrollar pruebas de rendimiento personalizadas que reflejen directamente el rendimiento en las tareas específicas que necesitará que realice el modelo. Esto también será útil para la fase de evaluación del modelo más adelante.
Dejando de lado la IA generativa, la mayoría de las soluciones de IA implican entrenar su propio modelo. Nuestro artículo explicativo sobre el entrenamiento de modelos proporciona más información relacionada con el proceso de desarrollo de modelos, desde los diferentes tipos de machine learning hasta la elección de una función de pérdida (o, en el aprendizaje por refuerzo, una función de recompensa) hasta la optimización de los parámetros del modelo (e hiperparámetros). Normalmente se necesita cierto grado de experimentación antes de llegar a la arquitectura y el esquema de aprendizaje ideales.
En última instancia, el objetivo del entrenamiento del modelo es ajustar los parámetros hasta que el rendimiento del modelo en los ejemplos de su conjunto de datos de entrenamiento alcance un umbral aceptable de precisión.
El entrenamiento de modelos es un proceso iterativo y no siempre se lleva a cabo de forma constante y lineal. Es importante guardar periódicamente “puntos de control” de los pesos del modelo a lo largo del proceso de entrenamiento. Sin un sistema de control de versiones, una sola actualización del modelo podría tener consecuencias desastrosas y obligarle a empezar de cero. El control de versiones también es una práctica necesaria para la depuración, la reproducibilidad y la colaboración entre equipos.
Optimizar el rendimiento de un modelo en los datos de entrenamiento no es, en sí mismo, el objetivo fundamental del entrenamiento de modelos. El verdadero objetivo del entrenamiento de modelos es desarrollar un modelo que generalice bien a los nuevos datos que aún no ha visto. Hay que tener cuidado de evitar el sobreajuste, que puede entenderse como el equivalente en el machine learning a “enseñar para el examen”, más cercano a la memorización mecánica que al “conocimiento” real.
La evaluación posterior al entrenamiento es fundamental para confirmar que el modelo se adapta bien a datos no vistos. Este proceso de validación pone a prueba la calidad de los resultados del modelo en un conjunto de datos separado de nuevas entradas que se asemejan a las tareas del mundo real. La validación puede utilizar una variedad mucho mayor de métricas de rendimiento que las adecuadas para las funciones de pérdida que miden la precisión del modelo durante el entrenamiento.
La evaluación y el entrenamiento de modelos suelen constituir dos partes de un ciclo iterativo:
Primero, los modelos se entrenan hasta que la pérdida o la recompensa alcancen un umbral aceptable.
A continuación, se valida el rendimiento del modelo en un nuevo conjunto de tareas, a menudo utilizando diferentes métricas de rendimiento.
Si los resultados de la evaluación del modelo no son satisfactorios, el modelo recibe formación adicional, normalmente con ajustes estratégicos destinados a abordar cualquier deficiencia identificada en la fase de validación.
Una vez que un modelo se ha entrenado y validado correctamente, pasa a la fase de implementación, durante la cual se pone en funcionamiento el modelo en un entorno de producción real y se integra con los sistemas y API existentes. Lo ideal es que, durante la fase de evaluación del modelo, se haya comprobado su rendimiento en tareas que utilicen, o al menos se acerquen, a estos flujos de trabajo del mundo real.
Hay muchas configuraciones a considerar en la implementación del modelo, pero quizás la decisión más importante es el tipo de entorno de implementación en el que operará.
Implementación on-premises: el modelo se ejecuta en hardware físico (normalmente aceleradores de IA) que usted (o su organización) posee y mantiene. Esto proporciona mayor control, pero también requiere mayor inversión inicial.
Implementación en la nube: el modelo se ejecuta en hardware propiedad y operado por proveedores de servicios en la nube de terceros, ubicado físicamente en otro lugar de un gran centro de datos. La implementación en la nube suele ser el camino más rápido hacia la escalabilidad.
Implementación en el edge: el modelo se implementa a través de una red local distribuida de “dispositivos edge”, como sensores o dispositivos de Internet de las cosas (IoT).
Implementación en el dispositivo: el modelo se ejecuta directamente en el dispositivo del usuario final, como un ordenador portátil o un móvil.
Un modelo implementado rara vez debe considerarse un producto inerte y “terminado”. Un gobierno de la IA adecuado implica una monitorización continua de las métricas de rendimiento del modelo y del feedback de los usuarios.
Es casi inevitable que, en una aplicación real, surjan problemas imprevistos y casos extremos, por mucho que se planifique, se pruebe y se realice un red team de antemano. Además, incluso un modelo entrenado de forma óptima podría, con el tiempo, sufrir una degradación del rendimiento debido a problemas como la deriva del modelo.
Por lo tanto, los modelos implementados suelen requerir un reentrenamiento periódico para mantener un rendimiento adecuado y adaptarse a las circunstancias cambiantes. Una vez más, es importante contar con esquemas de versiones bien pensados para depurar, rendir cuentas y realizar actualizaciones de forma segura en los sistemas críticos.
Entrene, valide, ajuste e implemente IA generativa, modelos fundacionales y capacidades de machine learning con IBM watsonx.ai, un estudio empresarial de nueva generación para desarrolladores de IA. Cree aplicaciones de IA en menos tiempo y con menos datos.
Ponga la IA a trabajar en su negocio con la experiencia líder en IA del sector de IBM y junto a su cartera de soluciones.
Reinvente las operaciones y flujos de trabajo críticos añadiendo IA para maximizar las experiencias, la toma de decisiones en tiempo real y el valor empresarial.