Inicio
Architectures
Híbrida
Gobierno de la IA
El gobierno de la IA es la capacidad de monitorizar y gestionar las actividades de IA dentro de una organización. Incluye procesos y procedimientos para rastrear y documentar el origen de los datos y modelos implementados dentro de la empresa; así como las técnicas utilizadas para entrenar, validar y monitorizar la precisión continua de los modelos. Un gobierno de la IA eficaz ofrece tres resultados principales para las empresas:
Cumplimiento. Ayudamos a garantizar que las soluciones de IA y las decisiones generadas por IA sean coherentes con las prácticas aceptadas por los sectores, los estándares regulatorios y los requisitos legales.
Confianza. Permitir que se confíe en las decisiones tomadas por la IA ayudando a garantizar que los modelos de IA sean explicables y justos.
Eficiencia. Mejorar la velocidad de comercialización y reducir los costes de desarrollo de IA mediante la estandarización y optimización de las prácticas de desarrollo e implementación de IA.
Las empresas que no adopten el gobierno de la IA corren el riesgo de sufrir múltiples consecuencias negativas. El proceso de machine learning es iterativo y requiere colaboración. Sin un buen gobierno y documentación, los científicos de datos o los validadores no pueden estar seguros del linaje de los datos de un modelo o de cómo se construyó el modelo. Lograr resultados puede ser difícil de reproducir. Si los administradores entrenan un modelo con datos incorrectos o incompletos, se podrían destruir meses de trabajo.
La falta de gobierno de la IA también puede resultar en sanciones importantes. A los operadores bancarios se les han impuesto multas de siete cifras por utilizar modelos parciales a la hora de determinar la aptitud para el préstamo. La UE planea añadir regulaciones de IA al Reglamento General de Protección de Datos (RGPD). Las infracciones del RGPD actualmente pueden "dar lugar a una multa de hasta 20 millones de euros, o el 4 % de los ingresos anuales mundiales de la empresa del año financiero anterior, la cantidad que sea mayor".
La reputación de la marca también está en riesgo. Un experimento utilizó software de IA para aprender los patrones de habla de los jóvenes en las redes sociales. Los funcionarios administrativos eliminaron el software rápidamente después de que los trolls de Internet "enseñaran" la herramienta a crear publicaciones racistas, sexistas y antisemitas.
El diagrama anterior muestra los principales componentes de una solución de gobierno de la IA para una solución de IA generativa que utiliza modelos de lenguaje de gran tamaño (LLM).
El gobierno de modelos es el centro de intercambio de información para el gobierno de la IA. Proporciona paneles de control, informes y capacidades de alerta utilizados por el personal de la empresa para garantizar, auditar e informar de que los modelos de IA cumplen los requisitos de imparcialidad, transparencia y cumplimiento. El componente de gobierno de modelos también permite a las empresas establecer criterios de paso y otras políticas que afectan a cuándo y cómo los modelos mover del desarrollo a la producción.
La monitorización de modelos supervisa activamente el resultado de los modelos para garantizar que los modelos sean explicables, justos y cumplan con las normativas, y que sigan siéndolo cuando se implementen. Si los modelos comienzan a desviarse o a mostrar sesgos en sus resultados, el componente de monitorización de modelos los marca para que el personal de operaciones de IA los investigue.
El siguiente diagrama recorre las interacciones de los componentes de alto nivel para cumplir con el gobierno de la IA empresarial.
Los miembros del equipo de gobierno empresarial utilizan el componente de gobierno de modelos para (i) visualizar los modelos de IA (fundacionales y no fundacionales) implementados dentro de la empresa a través de infraestructura privada, hiperescaladores y plataformas basadas en la nube, y (ii) establecer criterios operativos mínimos y otras políticas para que los modelos se implementen y operen dentro de la empresa. Los criterios y controles de políticas se propagan al componente de monitorización de modelos para su posterior monitorización y alerta.
Un desarrollador de modelos sintoniza un modelos de lenguaje de gran tamaño (LLM) y evalúa la respuesta del modelo a los mensajes de prueba. Los resultados de estas pruebas, junto con las estadísticas resumidas, se capturan y propagan al componente de monitorización de modelos, donde se registran para proporcionar el linaje de modelos y datos.
Un validador de modelos revisa los resultados de la puesta a punto y las pruebas y, con la ayuda del componente de monitorización de modelos, los compara con los criterios y controles establecidos por el equipo de gobierno de la empresa. Una vez que se cumplen los criterios y controles, el modelo se aprueba para su uso en producción.
Un desarrollador de modelos utiliza el componente de monitorización de modelos para controlar el rendimiento del modelo a lo largo del tiempo; en concreto, el desarrollador busca garantizar que las respuestas del modelo sigan cumpliendo los criterios empresariales de imparcialidad (ausencia de sesgo), precisión (respuestas correctas) y transparencia (respuestas explicables).
El componente de monitorización de modelos supervisa continuamente los modelos de IA implementados (modelos fundacionales / generativos, así como modelos de machine learning "tradicionales") para capturar estadísticas de precisión y rendimiento.
El componente de monitorización de modelos también captura las instrucciones del usuario y las respuestas del modelo para (i) protegerse aún más contra la deriva del modelo (desviaciones en el sesgo y/o la precisión del modelo), y (ii) para capturar datos de prueba y ayudar a identificar áreas temáticas o dominios de datos en los que sería beneficioso realizar un ajuste adicional.
La correlación actual de IBM watsonx.governance, y las soluciones de IBM OpenPages para el modelo conceptual se muestran en el diagrama siguiente. watsonx.governance monitoriza en tiempo de ejecución los modelos fundacionales que se ejecutan en el conjunto de herramientas integrales de watsonx.ai, on-premises, en infraestructuras basadas en la nube o en plataformas de IA de terceros como Amazon Sagemaker. watsonx.governance también proporciona capacidades para crear, actualizar y gestionar tarjetas modelo, conocidas como hojas de datos de IA dentro de watsonx.governance, y capturar e informar sobre las métricas de rendimiento del modelo. El módulo Model Risk Management de IBM OpenPages proporciona las capacidades de gestión e informes de riesgos, y las capacidades de desarrollo de modelos y gestión de políticas de implementación del gobierno de modelos.
En un futuro próximo, watsonx.governance proporcionará las capacidades tanto de gobierno de modelos como de monitorización de modelos
El gobierno de las soluciones de IA generativa es similar al gobierno de los modelos de IA "tradicionales", pero sus capacidades generativas requieren una gestión más estricta de las entradas y salidas de los modelos que los modelos tradicionales, a fin de protegerse contra indicaciones inapropiadas o malintencionadas y garantizar que los modelos produzcan salidas aceptables y objetivamente correctas. Esta sección ilustra cómo se aplica IBM watsonx.governance a los modelos fundacionales en dos casos de uso principales: gestión del ciclo de vida del modelo, y riesgo del modelo y cumplimiento normativo.
El diagrama anterior ilustra cómo se utiliza watsonx.governance para gestionar el ciclo de vida del modelo desde las pruebas iniciales y la validación hasta la implementación.
Un desarrollador de modelos ajusta un modelo en la solución local de watsonx.ai, el servicio watsonx.ai o en otra plataforma on-premises o basada en la nube y desarrolla y prueba instrucciones con él.
Las instrucciones y los datos de respuesta del modelo, junto con las métricas de rendimiento del modelo como ROUGE, SARI, Chrf y BLEU, se capturan en capturan en la funcionalidad de gestión del inventario de modelos de watsonx.governance. Se capturan varias versiones de las instrucciones y los datos de respuesta para permitir la comparación cruzada y la selección de una combinación de modelo e instrucción que mejor se adapte a los requisitos de la empresa.
Un validador de modelos revisa los resultados de las combinaciones individuales de solicitud y modelo y selecciona una versión para aprobar su implementación en producción.
Los desarrolladores de modelos utilizan la misma capacidad para realizar un seguimiento de las combinaciones de modelo / instrucción y su rendimiento para casos de uso específicos.
A continuación, se muestra el tutorial de componentes para el riesgo de modelo y el cumplimiento normativo dentro de watsonx.governance.
Los miembros del equipo de gobierno de la IA de la empresa determinan y establecen criterios, especificados como mínimos, máximos y variaciones permitidas de las métricas del modelo, como ROUGE, que deben cumplir los modelos en producción. Estos criterios se establecen dentro de la herramienta IBM OpenPages Model Risk Management y luego se propagan a watsonx.governance.
Una instrucción del desarrollador de modelos ajusta y desarrolla solicitudes de prueba contra un modelo fundacional implementado dentro de la solución on-premise de watsonx.ai, el servicio watsonx.ai, o en otra solución on-premise o basada en la nube como Sagemaker.
La información de instrucción y los datos de respuesta del modelo, junto con las métricas de rendimiento del modelo, se transmiten a watsonx.governance, donde las métricas se comparan con los umbrales establecidos por el equipo de gobierno.
Los resultados de la comparación de métricas se transmiten a IBM OpenPages para que el equipo de gobierno los revise y elabore informes. En concreto, si la combinación de instrucción/modelo cumple con todos los criterios establecidos, puede marcarse como lista para la producción o como no portadora de riesgos. Si el modelo cumple solo algunos de los criterios, es posible que se marque como potencialmente de bajo rendimiento y que aún no es adecuado para la producción, en función de lo estricto que haya sido la directiva por parte del equipo de gobierno.
Garantice un mecanismo para operacionalizar la IA con confianza. Es fundamental evaluar el modelo durante el desarrollo y la implementación para que las respuestas de los LLM no sean el resultado de alucinaciones y carezcan de palabras malsonantes que inciten al odio. Asegúrese de que las respuestas del LLM sean explicables, éticas, confiables e imparciales. Las métricas de calidad del LLM son muy diferentes a las de los modelos de IA tradicionales, puesto que el científico de datos puede elegir las métricas correctas de forma coherente.
Las soluciones de IA generativa implementadas deben ser coherentes, sin ningún sesgo o deriva introducida a lo largo del tiempo. No es raro ver a una empresa utilizando una variedad de LLM a través de varias nubes, lo que permite el gobierno centralizado en todos los ámbitos es crítico. Tener un enfoque de gobierno en varios entornos de implementación en varias nubes es una consideración clave.
Garantizar que las aplicaciones de IA generativa implementadas sean actuales y cumplan con las regulaciones de sectores en constante evolución. Obtención de visibilidad de todos los modelos y la salud implementados por la empresa en una vista única.
Asegúrese de que no se utiliza Hate Abuse Profanity en los datos de entrenamiento. También puede indemnizar a la empresa de cualquier uso de datos patentados y, al mismo tiempo, garantizar que no se filtren datos de PII o IP. Poder auditar y obtener el linaje de datos para la solución de IA generativa es clave.
Describe cómo se implementa un modelo RAG de extremo a extremo con capacidades de monitorización y gobierno durante todo el ciclo de vida. Además del componente de gobierno de modelos, también es importante el gobierno de datos. Mostramos cómo al aprovechar los componentes de gobierno de IBM watsonx.governance como AI OpenScale, FactSheets e IBM Open Pages podemos asegurar que las aplicaciones de IA generativa son gestionadas y gobernadas. IBM watsonx Knowledge Catalog permite una gestión adecuada de los datos, incluida la catalogación de datos, el linaje de datos y la gestión de datos PII.
La arquitectura de IA generativa de IBM es la arquitectura de IA generativa completa de IBM en IBM IT Architect Assistant (IIAA), una herramienta de desarrollo y gestión de arquitecturas. Con IIAA, los arquitectos pueden elaborar y personalizar la arquitectura para crear sus propias soluciones de IA generativa.