Inteligencia artificial Automatización de procesos empresariales

Supervisión e insights de agentes, además de métricas de seguridad en watsonx.governance

Publicado 10/03/2025

Autor

Neil Leblanc

watsonx.governance Go-To-Market Lead

IBM

Los líderes de riesgos y cumplimiento, los equipos de seguridad y los propietarios de IA a menudo hacen estas dos preguntas: “¿Puedo ver exactamente lo que están haciendo mis agentes de IA en producción?” “¿Puedo obtener una visión unificada de mi gobernanza de la IA y postura de seguridad de la IA?”

Con watsonx.governance, la respuesta a ambos ahora es sí.

  1. Monitoreo e insights de los agentes: dar a las empresas visibilidad del comportamiento, las acciones y las decisiones de la IA agéntica en la producción.
  2. Métricas de seguridad en la consola de gobernanza: incorporar los insights de Guardium AI Security directamente en sus flujos de trabajo.

En conjunto, estas características ofrecerán una solución integral para la confianza de la IA (política, protección y rendimiento) sin buscar hojas de cálculo ni saltarse pestañas.

Monitoreo de agentes: haga que los agentes sean transparentes y despliegue con confianza

Las empresas están recurriendo a los agentes de IA como la próxima frontera de la productividad. A diferencia de los modelos tradicionales que simplemente generan resultados, los agentes pueden tomar medidas, encadenando tareas y aprovechando múltiples sistemas. Esto abre la puerta a la automatización de flujos de trabajo repetitivos, acelerando la toma de decisiones y liberando a los equipos para que se centren en trabajos de mayor valor.

Pero con esta promesa vienen nuevos riesgos. Los agentes operan con más autonomía, lo que dificulta ver cómo se toman las decisiones y garantizar que se comporten según lo previsto. Hoy en día, el monitoreo suele ser lento, manual y fragmentado, lo que deja a los desarrolladores sin las herramientas que necesitan para confiar, rastrear o ajustar sus sistemas. Y sin una infraestructura de gobernanza escalable, las empresas tienen dificultades para evaluar, controlar y escalar con confianza la IA agéntica.

Para combatir este desafío, en nuestros próximos lanzamientos, watsonx.governance presentará Agent Monitoring and Insights en watsonx.governance. Esta nueva capacidad monitorea las aplicaciones agénticas en producción. Al realizar un seguimiento de las decisiones, los comportamientos y el rendimiento en tiempo real, Agent Insights emite alertas cuando las métricas superan los umbrales. Esto permite una gestión proactiva, una resolución de problemas más rápida y una mayor confianza en los resultados impulsados por los agentes.

Mejoras clave en la gobernanza agentiva

  • Evaluaciones en bucle: métricas actualizadas para evaluar con precisión el rendimiento (calidad y comportamiento) de los agentes de IA. Esto ahorra tiempo al aumentar la eficiencia al ver todas las métricas de rendimiento agregadas a nivel de conversación, interacción y herramienta en un solo lugar, lo cual da una perspectiva completa del rendimiento del agente. 
  • Impulse la calidad y la precisión: en el primer trimestre de 2026, presentaremos insights aplicables en la práctica a través del análisis de causa principal. Esto ayudará a los equipos a tener la capacidad de medir lo que funciona, comparar el rendimiento a lo largo del tiempo y optimizar y ajustar continuamente su IA y sus agentes.
  • Seguimiento de la experimentación en tiempo real: evalúe y compare múltiples ejecuciones de sus aplicaciones agénticas, con todos los cambios, métricas y resultados en un solo lugar. Esto no solo acelera el tiempo de producción (obteniendo estructura y visibilidad del proceso de desarrollo de agentes con todos los cambios, métricas y resultados), sino que también mejora la eficiencia, lo que reduce el ruido al centrarse solo en las métricas que más importan para su proyecto a través de clasificaciones personalizadas adaptadas a las métricas de éxito de su proyecto, lo que garantiza decisiones más rápidas y un rendimiento ajustado de los agentes.
  • Informes: paneles integrados y alertas automatizadas cuando los agentes de IA se salen de los límites de la operación prevista para ayudar a los equipos a probar, adoptar y escalar agentes más rápido. Esto garantiza una gestión proactiva, que impulsa la gestión proactiva con el Agent Insights Dashboard y realiza un seguimiento de las tendencias de rendimiento a lo largo del tiempo. También mitiga el riesgo en tiempo real, ganando confianza al garantizar que se le notifique de inmediato si un agente comete un error o alucina, lo que permite una intervención y corrección oportunas.

Cómo ayuda

  • El riesgo y el cumplimiento garantizan que los agentes se mantengan dentro del alcance aprobado y que las decisiones sean auditables.
  • IA/ML Ops y los desarrolladores solucionan problemas más rápido, mejoran la eficiencia y garantizan resultados confiables.
  • Los líderes empresariales obtienen una mayor confianza para escalar los programas de IA agéntica de manera responsable a escala para extraer el máximo retorno de la inversión (ROI).

Ejemplo del mundo real:

Un agente de IA que automatiza las adquisiciones podría intentar aprobar un contrato de proveedor fuera de su alcance. Con el monitoreo habilitado, esa acción se marca en tiempo real, lo que permite a los equipos investigar, ajustar políticas o refinar el agente antes de que cause problemas posteriores.

Métricas de seguridad: vea los riesgos, decida más rápido

La gobernanza y la seguridad de la IA se han tratado con demasiada frecuencia como flujos de trabajo paralelos. Eso cambia con la nueva integración de Guardium IA Security en la consola watsonx.governance. Los líderes de riesgos y cumplimiento pueden ver la postura de seguridad en vivo directamente donde aprueban y gestionan los casos de uso.

Formas en que unimos la gobernanza y la seguridad:

  • Panel de seguridad por caso de uso: cada caso de uso de IA muestra una tarjeta de seguridad concisa: resultados de análisis de vulnerabilidades y pruebas de penetración, detecciones en tiempo real (por ejemplo, intentos de inyección de instrucciones) y tendencias de 7/30 días.
  • Panel de seguridad a nivel de programa: vista agregada de todos los casos de uso, hallazgos abiertos por gravedad, actividad de ataque a lo largo del tiempo y estado de corrección.
  • Hoja de ruta para ampliar la cobertura: las métricas del primer día se centran en vulnerabilidades, pruebas de penetración y detecciones, con configuraciones erróneas y más señales próximamente.

Cómo ayuda:

  • El riesgo y el cumplimiento aceleran los comentarios con datos de seguridad en vivo que proporcionan visibilidad en tiempo real de las vulnerabilidades críticas.
  • Los equipos de seguridad que utilizan Guardium para un descubrimiento y protección profundos pueden compartir fácilmente métricas clave con los stakeholders en la gobernanza de la IA. Los propietarios de la IA ven métricas aplicables en la práctica vinculadas a sus casos de uso, lo que proporciona una visión completa de las vulnerabilidades y riesgos de seguridad que deben corregirse.

Ejemplo del mundo real:

Un agente de IA que gestiona los tickets de TI está registrado y clasificado por niveles de riesgo en la gobernanza. Guardium lo prueba continuamente para detectar abusos o fugas. Ahora, los hallazgos de alta gravedad, las fechas de las pruebas de penetración y los intentos bloqueados aparecen directamente junto al registro de riesgos, por lo que las aprobaciones se realizan más rápido con todo el contexto.

Una hoja de ruta, una fuente de información

Ambas características nuevas se guían por el mismo principio: su programa de IA debe ejecutarse en una fuente unificada de información. El monitoreo de agentes evolucionará con un catálogo de agentes gobernado, controles de ajuste y una observabilidad más rica para garantizar que los agentes de IA sigan siendo confiables y responsables y estén alineados.

Las métricas de seguridad continuarán expandiéndose más allá de las vulnerabilidades y las detecciones hacia configuraciones erróneas e integraciones más profundas de Guardium.

En conjunto, llevarán la seguridad y la gobernanza a un flujo unificado para que las empresas puedan gobernar y escalar la IA con velocidad, seguridad y confianza.

Prepárese para crear una IA gobernada, segura y confiable

Si ya utiliza watsonx.governance, esté atento al lanzamiento y prepárese para activar estas características en sus casos de uso de IA más críticos a medida que estén disponibles.

 Su equipo de IBM puede ayudarle a identificar el camino correcto y prepararse para construir una IA confiable, segura y gobernada con estas capacidades.

Escale la IA de confianza con watsonx.governance

Aprenda más Escale la IA de confianza con watsonx.governance