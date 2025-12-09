O AI Optimizer for Z oferece monitoramento avançado em tempo real para cargas de trabalho de IA generativa usando o Prometheus para coleta de métricas e o Grafana para visualização intuitiva. Ele monitora as principais métricas, como a taxa de transferência do token, a latência por solicitação, a taxa de acertos do cache, o tempo até o primeiro token e a utilização da memória, juntamente com um plano para incluir métricas de uso de hardware, como a utilização da GPU/acelerador.

O AI Optimizer pode se integrar ao coletor do OpenTelemetry (OTel) quando configurado com receptores Prometheus. Isso permite a ingestão perfeita de telemetria e a interoperabilidade para uma observabilidade unificada em ambientes híbridos. Esses insights permitem que as organizações tomem decisões embasadas sobre planejamento de capacidade, roteamento de carga de trabalho, monitoramento de desempenho e otimização de infraestrutura, ajudando a evitar o provisionamento excessivo, reduzir custos e melhorar o desempenho geral.