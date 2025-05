O auto-scaling é usado para garantir que as aplicações tenham os recursos necessários para manter a disponibilidade consistente e atingir metas de desempenho, além de promover o uso eficiente de recursos em nuvem e minimizar os custos em nuvem.

De acordo com um white paper de 2023 da Infosys, as Organizações que migram para a nuvem desperdiçam cerca de 32% do custo da nuvem.1 Devido ao seu foco na utilização eficiente de Recursos, o Auto-Scaling é um componente útil em uma prática bem-sucedida de FinOps.

Quando as organizações configuram a infraestrutura de nuvem, elas fornecem recursos de acordo com as necessidades de recursos de computação, armazenamento e rede. Mas a demanda flutua, digamos, com picos ou quedas no tráfego de rede ou uso de aplicativos. As funcionalidades de auto escala permitem ajustar a infraestrutura automaticamente para acompanhar a demanda em tempo real, com base em métricas como uso da CPU ou disponibilidade de banda, sem necessidade de intervenção humana.

O Auto-Scaling pode ser usado para otimizar a alocação de Recursos por meio de diversos meios. Por exemplo, o dimensionamento preditivo utiliza dados históricos para prever a demanda futura. Ou o dimensionamento dinâmico, que reage em tempo real às necessidades de recursos, conforme as políticas de auto scaling da organização.

As políticas de auto-scaling automatizam os ciclos de vida de instâncias de computação em nuvem, iniciando e encerrando virtual machines conforme necessário para ajudar na demanda de recursos. O auto-scaling é frequentemente usado em conjunto com o balanceamento de carga elástico para aproveitar totalmente os recursos de nuvem disponíveis.