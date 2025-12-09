AI Optimizer for Z proporciona monitorización avanzada en tiempo real para cargas de trabajo de IA generativa utilizando Prometheus para la recopilación de métricas y Grafana para una visualización intuitiva. Rastrea métricas clave como el rendimiento del token, la latencia por solicitud, la relación de impacto de la caché, el tiempo hasta el primer token y la utilización de la memoria, junto con un plan para incluir métricas de uso de hardware como la utilización de GPU/acelerador.

AI Optimizer puede integrarse con el recopilador OpenTelemetry (OTel) cuando se configura con receptores Prometheus. Esto permite una ingesta y una interoperabilidad de telemetría fluidas para una observabilidad unificada en entornos híbridos. Estos conocimientos permiten a las organizaciones tomar decisiones informadas sobre la planificación de la capacidad, el enrutamiento de las cargas de trabajo, la supervisión del rendimiento y la optimización de la infraestructura, lo que ayuda a evitar el exceso de aprovisionamiento, reducir los costes y mejorar el rendimiento general.