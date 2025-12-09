L'Optimiseur IA pour Z offre une surveillance en temps réel avancée pour les Workloads d'IA générative en utilisant Prometheus pour la collecte d'indicateurs et Grafana pour une visualisation intuitive. Il suit des indicateurs clés tels que le débit du token, la latence par requête, le taux de réussite du cache, le temps jusqu’au premier token et l’utilisation de la mémoire, ainsi qu’un plan incluant des métriques d’utilisation matérielle telles que l’utilisation du GPU/accélérateur.

AI Optimizer peut s’intégrer au collecteur OpenTelemetry (OTel) lorsqu’il est configuré avec des récepteurs Prometheus. Cela permet une ingestion de télémétrie fluide et une interopérabilité pour unifier l’observabilité à travers les environnements hybrides. Ces informations permettent aux entreprises de prendre des décisions éclairées sur la planification de la capacité, le routage des workloads, la surveillance de la performance et l’optimisation de l’infrastructure, ce qui permet d’éviter le surprovisionnement, de réduire les coûts et d’améliorer la performance globale.