Monitorización y conocimiento de agentes, además de métricas de seguridad en watsonx.governance

Dos personas en un escritorio mirando un ordenador portátil con una ventana de la ciudad al fondo

Autor

Neil Leblanc

watsonx.governance Go-To-Market Lead

IBM

Los líderes de riesgos y cumplimiento, los equipos de seguridad y los propietarios de IA suelen hacer estas dos preguntas: "¿Puedo ver exactamente lo que hacen mis agentes de IA en producción?" "¿Puedo obtener una visión unificada de mi gobierno de la IA y mi posición de seguridad?"

Con watsonx.governance, la respuesta a ambas es ahora sí.

  1. Monitorización y conocimiento de los agentes: dar a las empresas visibilidad sobre el comportamiento, las acciones y las decisiones de la IA agéntica en producción.
  2. Métricas de seguridad en la consola de gobierno: aporte de la información de Guardium AI Security directamente a sus flujos de trabajo de gobierno.

Juntas, estas características ofrecerán una solución integral para la confianza de la IA (política, protección y rendimiento) sin persecución de hojas de cálculo ni saltos de tabulación.

Supervisión de agentes: haga que los agentes sean transparentes e implemente con confianza

Las empresas están recurriendo a los agentes de IA como la próxima frontera de la productividad. A diferencia de los modelos tradicionales que simplemente generan resultados, los agentes pueden tomar medidas, encadenando tareas y aprovechando múltiples sistemas. Esto abre la puerta a la automatización de flujos de trabajo repetitivos, acelerando la toma de decisiones y liberando a los equipos para que se centren en trabajos de mayor valor.

Pero esta promesa conlleva nuevos riesgos. Los agentes operan con más autonomía, lo que dificulta ver cómo se toman las decisiones y garantizar que se comportan según lo previsto. Hoy en día, la monitorización suele ser lenta, manual y fragmentada, lo que deja a los desarrolladores sin las herramientas que necesitan para confiar, rastrear o afinar sus sistemas. Y sin una infraestructura de gobierno escalable, las empresas tienen dificultades para evaluar, controlar y escalar con confianza la IA agéntica.

Para hacer frente a este desafío, en nuestros próximos lanzamientos, watsonx.governance introducirá la monitorización y el conocimiento de los agentes en watsonx.governance. Esta nueva capacidad monitoriza las aplicaciones agentivas en producción. Al realizar un seguimiento de las decisiones, los comportamientos y el rendimiento en tiempo real, Agent Insights emite alertas cuando las métricas superan los umbrales. Esto permite una gestión proactiva, una resolución de problemas más rápida y una mayor confianza en los resultados impulsados por los agentes.

Mejoras clave en el gobierno agéntico

  • Evaluaciones en bucle: métricas actualizadas para evaluar con precisión el rendimiento (calidad y comportamiento) de los agentes de IA. Esto ahorra tiempo al aumentar la eficiencia al ver todas las métricas de rendimiento agregadas a nivel de conversación, interacción y herramienta en un solo lugar, dibujando una imagen completa del rendimiento de los agentes. 
  • Impulse la calidad y la precisión: en el primer trimestre de 2026, introduciremos información procesable a través del análisis de causa raíz. Esto ayudará a los equipos a tener la capacidad de medir lo que funciona, comparar el rendimiento con el tiempo, y optimizar y afinar continuamente su IA y sus agentes.
  • Seguimiento de la experimentación en tiempo real: evalúe y compare varias ejecuciones de sus aplicaciones de agencia, con todos los cambios, métricas y salidas en un solo lugar. Esto no solo acelera el tiempo de producción, al aportar estructura y visibilidad al proceso de desarrollo de agentes con todos los cambios, métricas y resultados, sino que también mejora la eficiencia, ya que elimina el ruido al centrarse únicamente en las métricas más importantes para su proyecto mediante clasificaciones personalizadas adaptadas a las métricas de éxito de su proyecto, lo que garantiza decisiones más rápidas y un rendimiento optimizado de los agentes.
  • Informes: paneles de control integrados y alertas automatizadas cuando los agentes de IA se salen de los límites de la operación prevista, para ayudar a los equipos a probar, adoptar y escalar agentes más rápido. Esto garantiza una gestión proactiva, que impulsa la gestión proactiva con el panel de control de Agent Insights y realiza un seguimiento de las tendencias de rendimiento a lo largo del tiempo. También mitiga el riesgo en tiempo real, ganando confianza al garantizar que se le notifique rápidamente si un agente comete un error o alucina, lo que permite una intervención y corrección oportunas.

Cómo ayuda

  • El riesgo y el cumplimiento garantizan que los agentes se mantengan dentro del alcance aprobado y que las decisiones sean auditables.
  • Las operaciones de IA/ML y los desarrolladores solucionan los problemas con mayor rapidez, mejoran la eficiencia y garantizan resultados fiables.
  • Los líderes empresariales obtienen una mayor confianza para escalar los programas de IA agéntica de forma responsable para extraer el máximo ROI.

Ejemplo del mundo real:

Un agente de IA que automatiza las compras podría intentar aprobar un contrato con un proveedor fuera de su alcance. Con la monitorización habilitada, esa acción se marca en tiempo real, lo que permite a los equipos investigar, ajustar políticas o refinar el agente antes de que cause problemas posteriores.

Métricas de seguridad: vea los riesgos, decida más rápido

El gobierno de la IA y la seguridad de la IA se han tratado con demasiada frecuencia como flujos de trabajo paralelos. Eso cambia con la nueva Integración de Guardium IA Security en la consola watsonx.governance. Los líderes de riesgos y cumplimiento pueden ver la posición de seguridad en vivo directamente donde aprueban y administran los casos de uso.

Formas en las que unimos la gobernanza y la seguridad:

  • Panel de seguridad por caso de uso: cada caso de uso de IA muestra una tarjeta de seguridad concisa: resultados de análisis de vulnerabilidades y pruebas de penetración, detecciones en tiempo real (por ejemplo, intentos de inyección de instrucciones) y tendencias de 7/30 días.
  • Panel de control de seguridad a nivel de programa: vista agregada de los casos de uso, hallazgos abiertos por gravedad, actividad de ataque a lo largo del tiempo y estado de corrección.
  • Hoja de ruta para ampliar la cobertura: las métricas del primer día se centran en las vulnerabilidades, las pruebas de penetración y las detecciones, y próximamente habrá errores de configuración y más señales.

Cómo ayuda:

  • El departamento de riesgos y cumplimiento acelera las revisiones con datos de seguridad en tiempo real que proporcionan visibilidad instantánea de las vulnerabilidades críticas.
  • Los equipos de seguridad que utilizan Guardium para un descubrimiento y una protección profundos pueden compartir fácilmente métricas clave con los stakeholders en el gobierno de la IA. Los propietarios de IA ven métricas procesables vinculadas a sus casos de uso, lo que les proporciona una visión completa de las vulnerabilidades y los riesgos de seguridad que deben subsanarse.

Ejemplo del mundo real:

Un agente de IA que gestiona los tickets de TI está registrado y clasificado por niveles de riesgo en el gobierno. Guardium lo prueba continuamente para detectar abusos o fugas. Ahora, los hallazgos de alta gravedad, las fechas de las pruebas de penetración y los intentos bloqueados aparecen directamente junto al registro de riesgos, por lo que las aprobaciones se realizan más rápidamente con todo el contexto.

Una hoja de ruta, una fuente de la verdad

Ambas nuevas características se guían por el mismo principio: su programa de IA debe ejecutarse en una fuente unificada de la verdad. La monitorización de agentes evolucionará con un catálogo de agentes gobernado, controles de ajuste y una observabilidad más rica para garantizar que los agentes de IA sigan siendo fiables, responsables y alineados.

Las métricas de seguridad Continuarán expandiéndose más allá de las vulnerabilidades y las detecciones hacia configuraciones erróneas e integraciones más profundas de Guardium.

Juntos, unirán la seguridad y el gobierno en un flujo unificado para que las empresas puedan gobernar y escalar la IA con rapidez, seguridad y confianza.

Prepárese para crear una IA gobernada, segura y fiable

Si ya utiliza watsonx.governance, esté atento a la versión y prepárese para activar estas características en sus casos de uso de IA más críticos a medida que estén disponibles.

 Su equipo de IBM puede ayudarle a identificar el camino correcto y prepararse para construir una IA gobernada, segura y fiable con estas próximas capacidades.

Escale una IA fiable con watsonx.governance