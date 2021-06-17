El enfoque del sector en una IA fiable está siendo impulsado por varias fuerzas: la postura de responsabilidad social corporativa, las preocupaciones en torno al riesgo para la reputación y un conjunto creciente de regulaciones. Las organizaciones reconocen que necesitan un enfoque sistemático para garantizar que la IA y el machine learning sean fiables y operativos. Los aspectos de una IA fiable incluyen la imparcialidad, la solidez, la privacidad, la explicabilidad y la transparencia. Los casos de uso incluyen realizar comprobaciones de estado de aplicaciones existentes y crear un marco organizativo para el gobierno de la IA, pero hoy nos centraremos en operacionalizar nuevas aplicaciones.
Las organizaciones necesitan un enfoque sistemático para crear y poner en funcionamiento nuevas aplicaciones de IA de forma fiable. Este enfoque debe tener en cuenta el ciclo de vida integral de la ciencia de datos y la IA. El ciclo de vida de la IA consiste en una secuencia de etapas que reúnen a varios personajes y buenas prácticas. (Consulte el informe de O'Reilly Operacionalizando la IA para obtener una visión general). Las etapas del ciclo de vida incluyen:
En un escenario ideal, los aspectos de la IA fiable deben abordarse en cada una de estas etapas y no solo al final. Necesitamos guardarraíles adecuados en cada etapa, desde la definición del negocio, la exploración de datos y la creación de modelos hasta la validación, implementación, monitorización y gestión continua de modelos. Analicemos más de cerca cada fase y cómo se abordan los distintos aspectos de una IA fiable.
Esta etapa guía la priorización de los casos de uso y el desarrollo de un plan de acción de IA. El equipo —compuesto por un stakeholder empresarial, científico de datos, propietario de datos, líder de operaciones y otros roles— se centra primero en el caso de uso empresarial, definiendo el valor empresarial y especificando los KPI empresariales. A continuación, aborda la tarea técnica y traduce el objetivo empresarial en tareas de IA específicas que resolver. Por último, el equipo desarrolla un plan de acción estructurado para encontrar una solución a las tareas técnicas identificadas en apoyo del objetivo empresarial.
La aplicación de los principios de Enterprise Design Thinking es una buena práctica para esta etapa. El Design Thinking ayuda a identificar y definir diversos aspectos empresariales y técnicos de sesgo/equidad, robustez, explicabilidad, etc., en el contexto del caso de uso. Esta etapa ayuda a responder preguntas como:
También es importante tener en cuenta cualquier política de datos organizativos e IA que el equipo deba seguir al desarrollar estos casos de uso, para evitar cualquier desafío de última hora al intentar validar para uso en producción.
Esta etapa permite al consumidor de datos encontrar y acceder a los conjuntos de datos pertinentes. Los equipos de ciencia de datos pueden "comprar datos" en un catálogo central utilizando metadatos o términos empresariales para buscar. Pueden entender los datos, incluyendo su propietario, linaje, relación con otros conjuntos de datos, y así sucesivamente. Es importante proporcionar a los científicos de datos una visión técnica del linaje de los datos, para que puedan comprender cada transformación de datos que pueda afectar a la forma en que crean y utilizan las funciones.
Basándose en esa exploración, pueden solicitar un feed de datos. Una vez aprobados, los conjuntos de datos pueden estar disponibles para el equipo de ciencia de datos en su entorno de desarrollo de ciencia de datos.
Si el equipo necesita trabajar con datos personales regulados, como información de identificación personal (PII) o información médica protegida (PHI), el administrador de datos o un proveedor de datos debe asegurarse de que los datos compartidos cumplan con las regulaciones mediante la anonimización adecuada.
Los equipos de ciencia de datos exploran y preparan los datos, y construyen, entrenan y prueban sus modelos de IA/ML durante esta etapa. Es mejor realizar las actividades de esta etapa como una serie de sprints ágiles. Es importante comprobar el sesgo de los datos en esta fase, incluso antes de que comience cualquier trabajo de creación de modelos. Se trata de una barrera interna para la equidad, y dichas barreras se pueden colocar durante y después de los pasos de construcción del modelo. La robustez del modelo, la explicabilidad y otros aspectos pueden considerarse y probarse de forma similar durante esta etapa.
Una vez que estas pruebas se completan con éxito, una canalización de MLOps permite que el modelo y los activos relacionados se muevan del entorno de desarrollo a un entorno de validación de preproducción.
Esta etapa implica la validación del modelo y la implementación en producción. Las actividades de validación las puede realizar un equipo que no sea el que creó el modelo, como el equipo de validación del modelo o gestión de riesgos del modelo de la organización o una entidad externa.
Este equipo valida la calidad, la solidez, la imparcialidad, etc. y genera informes de validación. Es importante capturar los resultados de la validación para referencia y comparación. También se comprueban las fichas técnicas de los modelos, las explicaciones locales y globales y otras métricas.
Si el modelo pasa la validación, el equipo de operaciones puede promoverlo al entorno de producción mediante una canalización de MLOps. El modelo se implementa allí, ya sea para invocación online o en lote.
En esta etapa, el equipo de operaciones establece la supervisión y gestión continuas del modelo de IA/ML en producción. El equipo configura los monitores para la recopilación periódica y programada de métricas. La calidad, la robustez y la equidad se monitorizan en frecuencias dictadas por las necesidades del negocio. La monitorización de la desviación de datos y precisión y la generación de explicaciones para transacciones seleccionadas, así como para el comportamiento global, son ejemplos de actividades en curso.
La empresa puede optar por actuar en caso de que los monitores detecten que se ha superado un umbral, desde alertas hasta medidas correctivas. Pueden configurarse pasos de mitigación de sesgos o de reentrenamiento del modelo para garantizar un comportamiento fiable continuado. Los modelos se pueden dar de baja en función de criterios empresariales o técnicos. Esta etapa establece las barreras más externas para una IA fiable.
Estas etapas del ciclo de vida de la IA encajan en un marco general de gobierno de la IA para la empresa. Un marco de este tipo permite que múltiples casos de uso sigan las etapas del ciclo de vida de forma coherente, independientemente de las herramientas de desarrollo que se utilicen. Ayuda a automatizar la documentación a lo largo del ciclo de vida y proporciona una visión coherente a las distintas partes interesadas.
Operacionalizar una IA fiable requiere que reunamos a las personas (experiencia), los procesos (buenas prácticas) y la plataforma (tecnología). IBM Cloud Pak for Data e IBM Spectrum Fusion proporcionan el marco tecnológico que soporta diversas etapas del ciclo de vida de la IA de extremo a extremo. Puede encajar en los entornos existentes y complementar las herramientas existentes de desarrollo y despliegue de modelos. La plataforma puede ejecutarse en una amplia variedad de opciones de infraestructura en la nube (IBM, AWS, Azure, GCP, etc.) y en las instalaciones, lo que proporciona una verdadera capacidad de nube híbrida.
IBM ofrece un conjunto de ofertas de servicios que aúnan formación, experiencia, buenas prácticas y tecnología para ayudar a los clientes a empezar a poner en marcha una IA fiable.