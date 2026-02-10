Conçu pour dimensionner et optimiser l’inférence de l’IA générative
IBM AI Optimizer for Z offre une inférence d’IA haute performance et basée sur des politiques directement sur IBM Z, conçue pour répondre aux exigences de l’IA générative à l’échelle de l’entreprise. Alimentée par l’IBM Spyre Accelerator, la solution apporte une exécution des modèles à faible latence, à haut débit et dotée de capacités de sécurité avancées, sur la plateforme qui exécute les workloads les plus critiques au monde.
Alors que l’IA générative redéfinit les stratégies métier, les entreprises qui s’appuient sur IBM Z font face à une exigence claire : dimensionner l’IA de manière efficace et sécurisée, sans explosion des coûts d’infrastructure. AI Optimizer for Z 2.1 répond à cet enjeu en optimisant l’inférence là où les données et les transactions sont déjà actives (sur Z), réduisant ainsi le délai de création de valeur tout en éliminant les inefficacités qui freinent l’adoption de l’IA.
AI Optimizer for Z est disponible en deux éditions : Advanced et Essentials.
AI Optimizer for Z 2.1 Essentials étend les capacités d’automatisation grâce à l’automatisation transparente de l’installation d’IBM watsonx Assistant for Z 3.1 et d’IBM Software Hub 5.2.
Bénéficiez d’une visibilité complète sur l’inférence de l’IA générative sur IBM Z grâce à une observabilité de niveau entreprise. Les tableaux de bord Prometheus et Grafana intégrés fournissent des analyses approfondies sur :
Cette transparence permet d’éviter le surdimensionnement, de rationaliser la planification des capacités et d’orienter plus intelligemment les investissements en infrastructure.
AI Optimizer for Z 2.1 introduit un modèle de mise en cache par étapes afin d’accélérer l’inférence de l’IA générative :
AI Optimizer enregistre les modèles exécutés sur Spyre afin de les optimiser. Les utilisateurs peuvent configurer leurs propres stratégies de routage ou s’appuyer sur le routeur intelligent intégré, qui prend en compte les performances, la disponibilité et les schémas d’utilisation. Le balisage sémantique permet de regrouper les modèles par cas d’utilisation et d’aligner le routage sur les besoins métier, offrant ainsi une plus grande flexibilité pour les requêtes d’inférence.
Les modèles déployés en dehors d’IBM Z ou de LinuxONE peuvent être enregistrés, balisés, regroupés et surveillés au même titre que les modèles exécutés sur la plateforme. Cela offre une vue opérationnelle unifiée de l’inférence de l’IA générative dans des environnements hybrides, garantissant la cohérence de la gouvernance et du suivi des performances.
AI Optimizer for Z automatise l’installation et la configuration des composants et produits clés de l’IA générative sur IBM Z, tels qu’IBM watsonx Assistant for Z, afin d’assurer une mise en œuvre rapide et fiable. La solution valide l’infrastructure et fournit un tableau de bord d’état de santé pour un suivi simplifié, réduisant la complexité et accélérant le délai de production.
Lorsqu’AI Optimizer for Z s’associe à IBM watsonx Assistant for Z sur l’IBM Spyre Accelerator, les entreprises tirent le meilleur des deux mondes : l’optimisation applicative et l’optimisation de l’inférence, en parfaite synergie. AI Optimizer garantit que chaque requête, chaque inférence et chaque appel de modèle est routé, mis en cache et dimensionné pour une efficacité maximale, tandis que l’Assistant offre des interactions naturelles et conversationnelles aux clients et aux collaborateurs. Exécutées sur l’architecture haute performance et écoénergétique de Spyre, ces deux solutions combinées permettent des réponses plus rapides, une latence réduite et une visibilité de bout en bout, transformant les interactions clients en expériences fluides, intelligentes et alimentées par l’IA, conçues pour l’échelle de l’entreprise.
Simplifiez et transformez la manière dont vos utilisateurs interagissent et gèrent le mainframe grâce à l’IA.
Accélérez l’innovation en matière d’IA à grande échelle grâce à l’infrastructure IBM.