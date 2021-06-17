El enfoque de la industria en la IA confiable está siendo impulsado por varias fuerzas: la postura de responsabilidad social corporativa, las preocupaciones en torno al riesgo de reputación y un conjunto creciente de regulaciones. Las organizaciones reconocen que necesitan un enfoque sistemático para garantizar que la IA y el machine learning sean confiables y operativos. Los aspectos de una IA confiable incluyen equidad, robustez, privacidad, explicabilidad y transparencia. Los patrones de caso de uso incluyen la realización de comprobaciones del estado de las aplicaciones existentes y la creación de una infraestructura para la gobernanza de la IA en toda la organización, pero hoy nos centraremos en la puesta en funcionamiento de nuevas aplicaciones.
Las organizaciones necesitan un enfoque sistemático para construir y operacionalizar nuevas aplicaciones de IA de manera fiable. Este enfoque debe tener en cuenta el ciclo de vida de la ciencia de datos y la IA de extremo a extremo. El ciclo de vida de la IA consta de una secuencia de etapas que reúnen varias personas y mejores prácticas. (Véase el informe de O’Reilly Operationalizing IA para obtener una visión general.) Las etapas del ciclo de vida incluyen:
En un escenario ideal, los aspectos de la IA confiable deben abordarse en cada una de estas etapas y no solo al final. Necesitamos medidas de seguridad adecuadas en cada etapa, desde la definición del negocio, la exploración de datos y la creación de modelos hasta la validación, el despliegue, el monitoreo y la gestión continua del modelo. Echemos un vistazo más de cerca a cada etapa y cómo se abordan los diversos aspectos de la IA confiable.
Esta etapa guía la priorización de casos de uso y el desarrollo de un plan de acción de IA. El equipo, compuesto por un stakeholder, un científico de datos, un propietario de los datos, un líder de operaciones y otros roles, primero se enfoca en el caso de uso, definiendo el valor del negocio y especificando los KPI. Luego aborda la tarea técnica, traduciendo el objetivo comercial en tareas específicas de IA para resolver. Por último, el equipo desarrolla un plan de acción estructurado para resolver las tareas técnicas identificadas en apoyo del objetivo empresarial.
Aplicar los principios de Enterprise Design Thinking es una buena práctica para esta etapa. El Design Thinking ayuda a identificar y definir diversos aspectos empresariales y técnicos de sesgo/equidad, robustez, explicabilidad, etc., en el contexto del caso de uso. Esta etapa ayuda a responder preguntas como:
También es importante tomar nota de los datos de la organización y las políticas de IA que el equipo deberá seguir mientras construye estos casos de uso, para evitar desafíos de última hora al intentar validar para el uso en producción.
Esta etapa permite al consumidor de datos encontrar y acceder a conjuntos de datos relevantes. Los equipos de ciencia de datos pueden "comprar datos" en un catálogo central utilizando metadatos o términos comerciales para buscar. Pueden entender los datos, incluyendo su propietario, linaje, relación con otros conjuntos de datos, y así sucesivamente. Es importante proporcionar a los científicos de datos una visión técnica del linaje de datos, para que puedan comprender cada transformación de datos que podría afectar la forma en que crean y utilizan las características.
Con base en esa exploración, pueden solicitar un feed de datos. Una vez aprobados, los conjuntos de datos pueden estar disponibles para el equipo de ciencia de datos en su entorno de desarrollo de ciencia de datos.
Si el equipo necesita trabajar con datos personales regulados, como información de identificación personal (PII) o información de salud protegida (PHI), el administrador de datos o un proveedor de datos debe asegurarse de que los datos compartidos cumplan con las regulaciones a través de la anonimización adecuada.
Los equipos de ciencia de datos exploran y preparan los datos, y construyen, entrenan y prueban sus modelos de IA/ML durante esta etapa. Las actividades durante esta etapa se llevan a cabo mejor como un conjunto de sprints ágiles. Es importante que se verifique el sesgo en los datos en esta etapa, incluso antes de que comience cualquier trabajo de construcción de modelos. Esta es una barrera interior para garantizar la equidad, y estas barandillas pueden instalarse durante y después de los pasos de construcción del modelo. La robustez del modelo, la explicabilidad y otros aspectos pueden considerarse y probarse de forma similar durante esta etapa.
Una vez que estas pruebas se completan con éxito, un pipeline de MLOps permite que el modelo y los activos relacionados se muevan del entorno de desarrollo a un entorno de validación de preproducción.
Esta etapa implica la validación del modelo y el despliegue en producción. Las actividades de validación pueden ser realizadas por un equipo distinto al que construyó el modelo, como el equipo de validación de modelos o gestión de riesgos de modelos de la organización, o una entidad externa.
Este equipo valida la calidad, la solidez, la imparcialidad, etc. y genera informes de validación. Es importante capturar los resultados de la validación para referencia y comparación. También se revisan las hojas de datos de los modelos, las explicaciones locales y globales y otras métricas.
Si el modelo pasa la validación, el equipo de operaciones puede promoverlo al entorno de producción mediante un pipeline de MLOps. El modelo se despliega allí, ya sea para invocación en línea o por lotes.
En esta etapa, el equipo de Operaciones establece la monitorización y gestión continua del modelo de IA/machine learning (ML) en producción. El equipo configura monitores para la recopilación periódica programada de métricas. La calidad, la robustez y la equidad se monitorizan en frecuencias dictadas por las necesidades del negocio. El monitoreo de la desviación de datos y precisión y la generación de explicaciones para transacciones seleccionadas, así como para el comportamiento global, son ejemplos de actividades en curso.
La empresa puede optar por actuar en caso de que los monitores detecten que se ha superado un umbral, que van desde alertas hasta medidas correctivas. Se pueden configurar pasos de mitigación de sesgos o reentrenamiento del modelo para garantizar un comportamiento confiable continuo. Los modelos se pueden dar de baja en función de criterios comerciales o técnicos. Esta etapa establece las barreras de protección más externas para una IA confiable.
Estas etapas del ciclo de vida de la IA encajan en un marco general de gobernanza de la IA para la empresa. Dicho marco permite que múltiples casos de uso sigan las etapas del ciclo de vida de manera constante, independientemente de las herramientas de desarrollo que se utilicen. Ayuda a automatizar la documentación a lo largo del ciclo de vida y proporciona una visión coherente a las distintas partes interesadas.
Poner en funcionamiento una IA confiable requiere que reunamos personas (experiencia), procesos (mejores prácticas) y una plataforma (tecnología). IBM Cloud Pak for Data e IBM Spectrum Fusion proporcionan el marco tecnológico que soporta diversas etapas del ciclo de vida de la IA de extremo a extremo. Puede adaptarse a entornos existentes y complementar las herramientas de desarrollo y despliegue de modelos existentes. La plataforma puede ejecutarse en una amplia variedad de opciones de infraestructura en la nube (IBM, AWS, Azure, GCP, etc.) y on premises, lo que proporciona una verdadera capacidad de nube híbrida.
IBM proporciona un conjunto de ofertas de servicios que reúnen educación, experiencia, mejores prácticas y tecnología para ayudar a los clientes a comenzar a poner en funcionamiento una IA confiable.