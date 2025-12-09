AI Optimizer for Z menyediakan pemantauan real-time canggih untuk beban kerja gen AI menggunakan Prometheus untuk pengumpulan metrik dan Grafana untuk visualisasi intuitif. Ini melacak metrik utama seperti throughput token, latensi per permintaan, rasio hit cache, time-to-first-token pertama dan pemanfaatan memori, bersama dengan rencana untuk memasukkan metrik penggunaan perangkat keras seperti pemanfaatan GPU/akselerator.

AI Optimizer dapat berintegrasi dengan kolektor OpenTelemetry (OTel) ketika dikonfigurasi dengan penerima Prometheus. Hal ini memungkinkan penyerapan telemetri yang mulus dan interoperabilitas untuk pengamatan terpadu di seluruh lingkungan hybrid. Berbagai insight ini memberdayakan organisasi untuk mengambil keputusan yang tepat terkait perencanaan kapasitas, perutean beban kerja, pemantauan kinerja, dan optimalisasi infrastruktur—sehingga dapat menghindari over-provisioning, menekan biaya, dan meningkatkan kinerja secara keseluruhan.