L'auto-scaling viene utilizzato per garantire che le applicazioni dispongano delle risorse necessarie per mantenere una disponibilità coerente e raggiungere gli obiettivi prestazionali, nonché per promuovere l'uso efficiente delle risorse cloud e ridurre al minimo i costi del cloud. Secondo un white paper del 2023 di Infosys, le organizzazioni che migrano al cloud sprecano circa il 32% dei costi del cloud.1 Grazie alla sua attenzione all'utilizzo efficiente delle risorse, l'auto-scaling è un componente utile per una pratica FinOps di successo.
Quando le organizzazioni configurano l'infrastruttura cloud, forniscono le risorse in base a una "linea di base" di esigenze di risorse di elaborazione, storage e rete. Ma la domanda fluttua, ad esempio, con picchi o cali nel traffico di rete o nell'utilizzo delle applicazioni. Le funzioni di auto-scaling consentono di scalare le risorse per soddisfare la domanda in tempo reale in base a metriche specifiche come l'utilizzo della CPU o la disponibilità della larghezza di banda, senza l'intervento umano.
L'auto-scaling può essere utilizzato per ottimizzare l'allocazione delle risorse attraverso una varietà di mezzi, come lo scaling predittivo, che utilizza dati storici per prevedere la domanda futura, o lo scaling dinamico, che reagisce alle esigenze di risorse in tempo reale, come determinato dalle politiche di auto-scaling di un'organizzazione. Le politiche di auto-scaling automatizzano i cicli di vita delle istanze di cloud computing, avviando e terminando le virtual machine in base alle esigenze per soddisfare la domanda di risorse. L'auto-scaling viene spesso utilizzato in tandem con bilanciamento del carico elastico per sfruttare appieno le risorse cloud disponibili.