Auto-Scaling wird eingesetzt, um sicherzustellen, dass Anwendungen über die Ressourcen verfügen, die sie benötigen, um eine einheitliche Verfügbarkeit zu gewährleisten und Leistungsziele zu erreichen, sowie um die effiziente Nutzung von Cloud-Ressourcen zu fördern und Cloud-Kosten zu minimieren. Laut einem Whitepaper von Infosys aus dem Jahr 2023 verschwenden Unternehmen, die in die Cloud migrieren, etwa 32 % ihrer Cloud-Kosten.1 Da der Fokus auf einer effizienten Ressourcennutzung liegt, ist Auto-Scaling ein nützlicher Bestandteil einer erfolgreichen FinOps-Praxis.
Wenn Unternehmen eine Cloud-Infrastruktur konfigurieren, stellen sie Ressourcen entsprechend einer Basis für den Bedarf an Rechen-, Speicher- und Netzwerkressourcen bereit. Aber die Nachfrage schwankt beispielsweise aufgrund von Spitzen oder Einbrüchen des Netzwerkverkehrs oder der Anwendungsnutzung. Automatische Skalierungsfunktionen ermöglichen die Skalierung von Ressourcen entsprechend der Echtzeitnachfrage nach bestimmten Metriken wie CPU-Auslastung oder Bandbreitenverfügbarkeit, ohne dass ein Mensch eingreifen muss.
Auto-Scaling kann zur Optimierung der Ressourcenzuweisung auf verschiedene Weise eingesetzt werden, z. B. durch prädiktive Skalierung, bei der anhand historischer Daten der künftige Bedarf vorhergesagt wird, oder durch dynamische Skalierung, bei der in Echtzeit auf den Ressourcenbedarf reagiert wird, der durch die Richtlinien des Unternehmens für Auto-Scaling bestimmt wird. Richtlinien für Auto-Scaling automatisieren die Lebenszyklen von Cloud Computing-Instanzen und starten und beenden virtuelle Maschinen nach Bedarf, um den Ressourcenbedarf zu decken. Auto-Scaling wird häufig in Verbindung mit einem elastischen Lastausgleich eingesetzt, um die verfügbaren Cloud-Ressourcen vollständig zu nutzen.