Die IT-Umgebung von TechZone ist äußerst komplex und befindet sich in einem ständigen Wandel. Im Durchschnitt verwaltet das Team 2.600 virtuelle Maschinen (VMs) in der Public Cloud, 14.000 VMs vor Ort und 274.000 Container, die auf 600 Cluster verteilt sind, die 178.000 Pods umfassen.
„Wir beginnen die Woche mit 12.000 laufenden VMs und am Ende der Woche haben wir 16.000 VMs, verteilt über eine Hybrid-Cloud-Umgebung, die Azure, AWS, Red Hat OpenShift, Kubernetes und VMware umfasst“, erklärt Erickson. „Wir durchlaufen diesen Zyklus mit einer schwankenden Nachfrage jede einzelne Woche. Vor Turbonomic hatten wir keine Single-Source-of-Truth (SSOT), die uns zuverlässig zeigen konnte, wie viele VMs in unserer Umgebung ausgeführt wurden. Wir mussten uns bei sechs oder sieben verschiedenen Benutzeroberflächen anmelden und die Daten manuell zusammenstellen. Jetzt haben wir einen konsolidierten Überblick über unsere gesamte Umgebung (von der Anwendungsebene bis hinunter zur Infrastruktur), der in Echtzeit aktualisiert wird.“
Der umfassende Einblick in den gesamten Stack ist ein wichtiger erster Schritt zur Kostensenkung bei TechZone, aber das ist nur der Anfang. Ein Team aus leistungsstarken Mitarbeitern kann die optimale Ressourcenzuordnung für eine Umgebung dieser Größenordnung nicht manuell überprüfen und festlegen. Sie benötigen eine KI- und Analyse-Engine, die ihre Umgebung kontinuierlich überprüft, um Möglichkeiten zur Verbesserung der Ressourcenzuordnung zu erkennen und darauf zu reagieren. „Wir entwickeln nicht alles, was auf TechZone bereitgestellt wird. Wir geben der IBM Community die Möglichkeit, Muster zu erstellen, die in unserer Umgebung ausgeführt werden. Unser neunköpfiges Team kann nicht jedes einzelne von ihnen manuell überprüfen. Hier kann die KI von Turbonomic helfen“, sagt Erickson.
Das Team von TechZone begann seine Optimierungsarbeiten, indem es sich auf seine Amazon Web Services (AWS) und VMware-Umgebungen sowie auf Red Hat® OpenShift® (Link befindet sich außerhalb von ibm.com) konzentrierte. Sie begannen mit der Überprüfung und manuellen Ausführung der KI-gestützten Resourcing-Empfehlungen von Turbonomic. „Es gab viele unterbrechungsfreie Maßnahmen, die beispielsweise sofort in AWS implementiert werden konnten. Wir haben viele Maßnahmen ergriffen, um die Leistung der Speicherung zu verbessern und gleichzeitig die Kosten zu senken“, erinnert sich Erickson. Das Team überwachte die Auswirkungen seiner Änderungen an den Ressourcen genau und optimierte sie im Laufe der Zeit weiter. Als das Vertrauen in die Empfehlungen wuchs, begann das Team, die Automatisierung zu implementieren.