L’environnement IT de TechZone est extrêmement complexe, et il évolue constamment. En moyenne, l’équipe gère 2 600 machines virtuelles (VM) dans le cloud public, 14 000 machines virtuelles sur site et 274 000 conteneurs répartis sur 600 clusters, dont 178 000 pods.
« Nous commençons la semaine en exécutant 12 000 machines virtuelles et en fin de semaine, nous avons 16 000 machines virtuelles distribuées dans un environnement cloud hybride qui inclut Azure, AWS, Red Hat OpenShift, Kubernetes et VMware, » explique Jason Erickson. « Nous sommes confrontés à ce cycle de demande fluctuante chaque semaine. Avant de disposer de Turbonomic, nous n’avions pas une seule source d’information unique capable de nous montrer de manière fiable le nombre de VM que nous avions exécutées dans notre environnement. Nous devrions nous connecter à six ou sept interfaces différentes et rassembler manuellement les données. Nous disposons désormais d’une vue consolidée de l’ensemble de notre environnement (de la couche application à l’infrastructure), mise à jour en temps réel. »
La visibilité complète est une première étape essentielle dans le processus de réduction des coûts de TechZone, mais ce n’est qu’un début. Une équipe très performante ne peut pas examiner et définir manuellement l’allocation optimale des ressources pour un environnement de cette envergure. Ils ont besoin de l’IA et d’un moteur analytique qui examine en permanence leur environnement afin d’identifier les opportunités d’amélioration de l’allocation des ressources et d’agir en conséquence. « Nous ne créons pas tout ce qui est déployé sur TechZone. Nous autorisons la communauté IBM à créer des modèles qui s’exécutent dans notre environnement. Notre équipe de neuf personnes ne peut pas toutes les inspecter manuellement. C’est là que l’IA de Turbonomic peut être utile », explique M. Erickson.
L’équipe TechZone a lancé sa stratégie d’optimisation en se concentrant sur ses environnements Amazon Web Services (AWS) et VMware, ainsi que sur Red Hat® OpenShift® (lien externe à ibm.com). Ils ont commencé par examiner et exécuter manuellement les recommandations de Turbonomic en matière de ressources alimentées par l’IA. « De nombreuses actions non perturbatrices pouvaient par exemple être immédiatement implémentées dans AWS. Nous avons pris de nombreuses mesures pour améliorer les performances du stockage et réduire les coûts en même temps », rappelle M. Erickson. L’équipe a suivi de près l’impact de ses changements de ressources et a continué à les optimiser au fil du temps. Au fur et à mesure que la confiance dans les recommandations a augmenté, l’équipe a commencé à implémenter l’automatisation.