¿Qué es el ciclo de vida de la IA?

By Dave Bergmann

Explicación del ciclo de vida de la IA

El ciclo de vida de la IA es un proceso estructurado e iterativo de planificación, entrenamiento, despliegue y mantenimiento de sistemas de IA. Implica no solo el entrenamiento de modelos de machine learning, sino también la recopilación y preparación de datos de entrenamiento, sistemas para evaluar y mejorar el rendimiento del modelo y la integración de modelos entrenados en aplicaciones de IA del mundo real.

El ciclo de vida de la IA abarca todo el proceso, desde la decisión inicial de resolver un problema específico mediante inteligencia artificial hasta el uso activo de un modelo entrenado en un flujo de trabajo real. La noción de ciclos de vida de la IA está estrechamente relacionada con las disciplinas de operaciones de machine learning (MLOps) y sistemas de gestión de IA (AIMS), las cuales implican enfoques sistemáticos para el desarrollo, la gobernanza y el mantenimiento de la IA.

En el concepto de ciclos de vida del desarrollo de la IA es central el hecho de que las soluciones de IA no se diseñan ni despliegan en el vacío: son sistemas dinámicos cuya eficacia sostenida depende de una planificación cuidadosa y un monitoreo diligente. Existen dependencias fundamentales entre cada una de las etapas del proceso de desarrollo e implementación de la IA, y comprender estas dependencias es esencial para crear soluciones impulsadas por IA que sean exitosas, escalables y sostenibles.

En este artículo se analizan cada uno de los pasos esenciales del ciclo de vida de la IA.

Las últimas tendencias de IA presentadas por expertos

Obtenga insights curados sobre las noticias más importantes e intrigantes de la IA. Suscríbase a nuestro boletín semanal Think. Consulte la Declaración de privacidad de IBM .

Definición del problema

La primera fase, y posiblemente la más importante, de la gestión del ciclo de vida de la IA es la fase de planificación, en la que usted identifica el caso de uso de su aplicación de IA: el problema que está utilizando la IA para resolver y las tareas específicas que la IA puede realizar para resolverlo. Todas las decisiones posteriores deben referirse a las decisiones tomadas durante el proceso de planificación.

Es fundamental ser minucioso y tener en cuenta todas las contingencias. Omitir ciertas consideraciones no ahorra trabajo: solo lo pospone y exacerba. Todos los stakeholders relevantes deben incluirse y consultarse en la fase de planificación, tanto para beneficiarse de su experiencia o perspectiva particular como para garantizar un consenso sobre cómo procederán las cosas a partir de aquí.

Defina el alcance de su proyecto de IA. ¿En qué aspectos de su problema funcionará o ayudará su solución de IA? ¿Qué aspectos están fuera de los límites?

Defina sus necesidades. Dentro de las áreas problemáticas para las que empleará la IA, ¿qué necesita exactamente que haga? Es importante comprender qué es factible y qué no, ya sea en términos de capacidades de IA existentes o de los recursos disponibles para llevar a cabo este proyecto.

Defina el éxito. Tanto desde el punto de vista cualitativo como (sobre todo) cuantitativo, ¿qué se considera un resultado satisfactorio? Establecer métricas de éxito de manera temprana les permite guiar las decisiones de diseño y gobernar el desarrollo y la optimización de su sistema de IA.

Evalúe los riesgos. Identifique las formas en que su solución de IA, según su alcance hasta ahora, podría afectar negativamente a su organización o a los usuarios. Los riesgos éticos, reputacionales y financieros deben ser señalados y abordados antes de pasar a la fase de recolección de datos, especialmente teniendo en cuenta que una gestión inadecuada suele ser la fuente de estos riesgos.

Recolección y preparación de datos

Desde el punto de vista técnico, la calidad y la cantidad de los datos de entrenamiento son el factor más importante para determinar la eficacia de sus modelos de IA.

Recopilación de datos

Considere que todo el machine learning se basa en el reconocimiento de patrones aplicado. Un modelo de machine learning entrenado utiliza los patrones que ha “aprendido” de sus datos de entrenamiento para inferir el resultado óptimo para una entrada dada. Es necesario que la calidad de los datos sea suficiente para garantizar que los patrones que aprende coincidan con los de los nuevos datos sobre los que realizará inferencias en aplicaciones del mundo real. Se necesita un volumen de datos suficiente para asegurar que el modelo haya aprendido todos los patrones a los que deberá recurrir, así como para evitar el sobreajuste.

Evalúe las fuentes de datos relevantes disponibles para usted, desde conjuntos de datos de código abierto disponibles a través de plataformas como Hugging Face o Kaggle hasta web scraping para hacer uso de los datos propios de su organización. Cuando los datos de alta calidad son extremadamente escasos o costosos, los datos sintéticos pueden, en ocasiones, suplir esas carencias .

Preparación de datos

Los datos sin procesar rara vez están listos para el machine learning: generalmente requieren cierto grado de preprocesamiento antes de su uso en pipelines de entrenamiento de modelos. La ingeniería de características es una parte destacada de este proceso.

El aprendizaje supervisado requiere el etiquetado de datos, lo que a menudo implica, al menos en cierta medida, una intervención humana manual que lleva tiempo (aunque la automatización suele agilizar el proceso). El etiquetado en algunos dominios de datos especializados requerirá la entrada de expertos. Incluso los conjuntos de datos que contienen datos previamente etiquetados deben inspeccionarse para garantizar la precisión y relevancia de las etiquetas para su caso de uso específico.

Los datos extraídos de diferentes fuentes de datos deben normalizarse y uniformarse en términos de unidades y formato: por ejemplo, entrenar un modelo con datos meteorológicos presentados tanto en grados Celsius como Fahrenheit conducirá inevitablemente al fracaso.

Gobernanza de datos

Los datos no deben descartarse sin más tras el entrenamiento del modelo. Deben almacenarse y mantenerse en caso de que alguna vez necesite auditar su sistema, explorar problemas de rendimiento, replicar sus modelos o cumplir con los requisitos normativos del RGPD o marcos similares.

Una correcta gobernanza de datos es un componente esencial de explicabilidad de la IA, privacidad de datos y cumplimiento normativo, especialmente en industrias y casos de uso que implican datos que contienen información sensible. También es un componente necesario para establecer pipelines de datos para optimizar el abastecimiento de datos escalables, especialmente cuando su flujo de trabajo de IA utiliza datos patentados que se actualizan continuamente.

Selección de modelo

Lo siguiente es la selección del modelo: elegir la arquitectura del modelo que mejor se adapte a su caso de uso, datos de entrenamiento y recursos computacionales. Existe una amplia variedad de algoritmos de machine learning, que van desde modelos de regresión pequeños y sencillos hasta redes neuronales de última generación de gran envergadura. El modelo más grande y elegante no siempre es la elección más sabia: hay tareas para las que los grandes modelos de aprendizaje profundo son excesivos, e incluso tareas en las que los modelos convencionales de machine learning superan a sus contrapartes de aprendizaje profundo.

Cuando se trata de IA generativa, entrenar LLM y otros tipos de modelos generativos desde cero requiere una inversión masiva en tiempo, datos, hardware y energía. En la mayoría de los casos, la mejor forma de satisfacer la necesidad de un modelo generativo personalizado es ajustar un modelo preentrenado. Pero incluso dentro del ámbito de los modelos predefinidos, existe una gran variedad en cuanto al tamaño, la arquitectura y las capacidades de los modelos.

Las evaluaciones de punto de referencia son una guía útil para determinar qué modelos son buenos en qué, pero no deben tomarse como algo absoluto. Si su problema está bien definido, vale la pena explorar la viabilidad de desarrollar puntos de referencia personalizados que reflejen directamente el rendimiento en las tareas específicas que necesitará que realice un modelo. Esto también será útil para la fase de evaluación del modelo más adelante.

Entrenamiento de modelos

Dejando a un lado la IA generativa, la mayoría de las soluciones de IA implicarán entrenar su propio modelo. Nuestro documento explicativo de entrenamiento de modelos proporciona más información sobre el proceso de desarrollo de modelos, desde los diferentes tipos de machine learning hasta la elección de una función de pérdida (o, en aprendizaje por refuerzo, una función de recompensa) y la optimización de los parámetros (e hiperparámetros) de los modelos. Suele ser necesario cierto grado de experimentación antes de llegar a la arquitectura y el esquema de aprendizaje ideales.

En última instancia, el objetivo del entrenamiento de modelos es ajustar los parámetros de estos hasta que el rendimiento de los modelos en los ejemplos de su conjunto de datos de entrenamiento alcance algún umbral aceptable de precisión.

El entrenamiento de modelos es un proceso iterativo y no siempre procede de manera constante y lineal. Es importante guardar periódicamente “puntos de control” de pesos de los modelos durante todo el proceso de entrenamiento. En ausencia de ese control de versiones, una sola actualización de un modelo podría ser desastrosa y obligarlo a empezar de nuevo. El control de versiones también es una práctica imprescindible para la depuración, la reproducibilidad y la colaboración entre equipos.

Evaluación del modelo

Optimizar el rendimiento de un modelo en los datos de entrenamiento no es, en sí mismo, el objetivo fundamental del entrenamiento de modelos. El verdadero objetivo del entrenamiento de modelos es desarrollar un modelo que generalice bien los nuevos datos que aún no ha visto. Se debe tener cuidado para evitar el sobreajuste, que puede entenderse como el equivalente del machine learning de “enseñar a la prueba”, más cercano a la memorización mecánica que al “conocimiento real”.

La evaluación posterior al entrenamiento es esencial para confirmar que el modelo se generaliza bien a datos no vistos. Este proceso de validación prueba la calidad de los resultados del modelo en un conjunto de datos separado de nuevas entradas que se asemejan a tareas del mundo real. La validación puede usar una variedad mucho mayor de métricas de rendimiento que las adecuadas para las funciones de pérdida que miden la precisión de un modelo durante el entrenamiento.

La evaluación y el entrenamiento de modelos suelen constituir dos partes de un ciclo iterativo:

En primer lugar, los modelos se entrenan hasta que la pérdida o la recompensa alcanzan un umbral aceptable.

Luego, el rendimiento del modelo se valida en un nuevo conjunto de tareas, a menudo utilizando diferentes métricas de rendimiento.

Si los resultados de la evaluación del modelo no son satisfactorios, el modelo se somete a un entrenamiento adicional, generalmente, con ajustes estratégicos destinados a abordar cualquier deficiencia identificada en la fase de validación.

AI Academy

Conviértase en un experto en IA

Obtenga el conocimiento para priorizar las inversiones en IA que impulsan el crecimiento del negocio. Comience hoy mismo con nuestra AI Academy gratuita y lidere el futuro de la IA en su organización.

Ver la serie

Despliegue de modelos

Una vez que un modelo ha sido entrenado y validado con éxito, pasa a la fase de despliegue, durante la cual usted pone en funcionamiento el modelo en un entorno de producción real y lo integra con los sistemas y API existentes. Idealmente, la fase de evaluación del modelo ha validado el rendimiento del modelo en tareas que utilizan o al menos se aproximan a estos flujos de trabajo del mundo real.

Hay muchas configuraciones a considerar en el despliegue del modelo, pero quizás la decisión más importante es el tipo de entorno de despliegue en el que operará.

Entornos de despliegue

Despliegue on premises: el modelo se ejecuta en hardware físico, generalmente aceleradores de IA, que usted (o su organización) posee y mantiene. Esto proporciona el mayor control, pero también requiere la mayor inversión inicial.

Despliegue en la nube: el modelo se ejecuta en hardware propiedad de proveedores de la nube y operado por ellos, ubicado físicamente en otro lugar de un centro de datos. El despliegue en la nube suele ser la vía más rápida hacia la escalabilidad.

Despliegue perimetral: el modelo se despliega a través de una red local distribuida de “dispositivos perimetrales”, como sensores o dispositivos del Internet de las cosas (IoT).

Despliegue en el dispositivo: el modelo se ejecuta directamente en el dispositivo del usuario final, como una computadora portátil o un teléfono inteligente.

Monitoreo de modelos

Un modelo desplegado rara vez debe considerarse como un producto inerte “terminado”. La gobernanza adecuado de la IA implica un monitoreo continuo de las métricas de rendimiento del modelo y el feedback de los usuarios.

Es casi inevitable que en una aplicación del mundo real surjan problemas imprevistos y casos extremos, sin importar cuán minuciosamente planee, pruebe y prepare al equipo rojo de antemano. Además, incluso un modelo entrenado de manera óptima podría, con el tiempo, sufrir una degradación del rendimiento debido a problemas como la desviación del modelo.

Por lo tanto, los modelos desplegados suelen requerir un reentrenamiento periódico para mantener un rendimiento adecuado y ajustarse a las circunstancias cambiantes. Una vez más, los esquemas de control de versiones bien pensados son importantes para la depuración, la rendición de cuentas y la realización segura de actualizaciones de sistemas críticos.

Autor

Dave Bergmann

Senior Staff Writer, AI Models

IBM Think

Ciencia de datos y MLOps para líderes de datos

Manténgase alineado con otros líderes en los 3 objetivos clave de MLOps y la IA confiable: confianza en los datos, confianza en los modelos y confianza en los procesos.