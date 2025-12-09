AI Optimizer for Z 通过 Prometheus 进行指标收集，并借助 Grafana 实现直观可视化，为生成式 AI 工作负载提供先进的实时监控功能。它追踪关键指标，如词元吞吐量、单请求延迟、缓存命中率、首词元响应时间及内存利用率，并计划纳入 GPU/加速器利用率等硬件使用指标。

当配置 Prometheus 接收器时，AI Optimizer 可与 OpenTelemetry (OTel) 收集器集成。这实现了无缝遥测数据采集与互操作性，支持跨混合环境的统一可观测性。这些洞察力帮助企业在容量规划、工作负载路由、性能监控和基础设施优化方面做出明智决策，从而避免资源过度配置、降低成本并提升整体性能。