AI Optimizer for Z proporciona monitoreo avanzado en tiempo real para cargas de trabajo de IA generativa utilizando Prometheus para la recopilación de métricas y Grafana para visualización intuitiva. Realiza un seguimiento de métricas clave, como el rendimiento del token, la latencia por solicitud, la proporción de aciertos de caché, el tiempo hasta el primer token y la utilización de la memoria, junto con un plan para incluir métricas de uso de hardware, como la utilización de GPU/acelerador.

IA Optimizer puede integrarse con el recopilador OpenTelemetry (OTel) cuando se configura con receptores Prometheus. Esto permite una ingesta e interoperabilidad de telemetría perfectas para una observabilidad unificada en entornos híbridos. Estos insights permiten a las organizaciones tomar decisiones informadas sobre la planificación de la capacidad, el enrutamiento de la carga de trabajo, la supervisión del rendimiento y la optimización de la infraestructura, lo que ayuda a evitar el aprovisionamiento excesivo, reducir los costos y mejorar el rendimiento general.