L'ambiente IT di TechZone è estremamente complesso ed è in continuo cambiamento. In media, il team gestisce 2.600 macchine virtuali (VM) nel cloud pubblico, 14.000 VM on-premise e 274.000 container distribuiti su 600 cluster, che includono 178.000 pod.
"Iniziamo la settimana con 12.000 VM in esecuzione ed entro la fine della settimana abbiamo 16.000 VM distribuite in un ambiente cloud ibrido che include Azure, AWS, Red Hat OpenShift, Kubernetes e VMware", spiega Erickson. “Attraversiamo questo ciclo di domanda fluttuante ogni singola settimana. Prima di Turbonomic, non disponevamo di una singola fonte affidabile che potesse mostrarci in modo affidabile quante VM erano in esecuzione nel nostro ambiente. Dovevamo accedere a sei o sette interfacce diverse e mettere insieme manualmente i dati. Ora abbiamo una visione consolidata dell'intero ambiente (dal livello applicativo all'infrastruttura) che viene aggiornata in tempo reale."
La visibilità full-stack è un primo passo fondamentale nel percorso di TechZone per ridurre i costi, ma è solo l'inizio. Un team di persone ad alte prestazioni non può esaminare e stabilire manualmente l'allocazione ottimale delle risorse per un ambiente di queste dimensioni. Hanno bisogno di un motore di intelligenza artificiale e di analytics che esamini continuamente il loro ambiente per identificare e agire sulle opportunità di migliorare l'allocazione delle risorse. "Non creiamo tutto ciò che viene distribuito su TechZone. Permettiamo alla comunità IBM di creare modelli che vengono eseguiti nel nostro ambiente. Il nostro team di nove persone non può ispezionarli manualmente tutti. Ed è proprio qui che l'intelligenza artificiale di Turbonomic può aiutare”, afferma Erickson.
Il team TechZone ha iniziato le proprie attività di ottimizzazione concentrandosi sugli ambienti Amazon Web Services (AWS) e VMware, nonché su Red Hat OpenShift (link esterno a ibm.com). Hanno iniziato esaminando ed eseguendo manualmente le raccomandazioni sulle risorse basate sull'AI di Turbonomic. “Per esempio, c’erano molte azioni senza interruzioni che potevano essere immediatamente implementate in AWS. Abbiamo intrapreso molte azioni per migliorare le prestazioni dello storage e ridurre contemporaneamente i costi", ricorda Erickson. Il team ha monitorato da vicino l'impatto dei cambiamenti nelle risorse e ha continuato con l'ottimizzazione col passare del tempo. Man mano che la fiducia nelle raccomandazioni cresceva, il team ha iniziato a implementare l’automazione.