O escalonamento para fora geralmente está associado a arquiteturas distribuídas. Há duas formas básicas de escalonamento para fora:

Adicionar capacidade de infraestrutura adicional em blocos de infraestrutura ou nós pré-empacotados (ou seja, hiperconvergentes)

Usar um serviço distribuído que pode recuperar informações de clientes, mas ser independente de aplicação ou serviços, lidando com problemas de desempenho e otimizando recursos de computação em nuvem

Ambas as abordagens são usadas nos provedores de serviços de nuvem (CSPs) contemporâneos, juntamente com o escalonamento vertical (escalonamento para cima) para componentes individuais (computação, memória, rede e armazenamento), para reduzir os custos. O escalonamento horizontal (escalonamento para fora) facilita para os provedores de serviços oferecer "pagamento conforme o crescimento" de infraestrutura e serviços, influenciando as estratégias de preços.

A infraestrutura hiperconvergente tem se tornado cada vez mais popular para uso em nuvem privada e até mesmo em provedores de serviços de nível 2. Essa abordagem não é tão fracamente acoplada quanto outras formas de arquiteturas distribuídas, mas ajuda os gerentes de TI acostumados a arquiteturas tradicionais a fazer a transição para o escalonamento horizontal e a perceber os benefícios de custo associados.

A arquitetura distribuída fracamente acoplada permite o escalonamento de cada parte da arquitetura de forma independente, eliminando efetivamente os gargalos. Isso significa que um grupo de produtos de software pode ser criado e implementado como peças independentes, mesmo que trabalhem juntos para gerenciar um fluxo de trabalho completo. Cada aplicação é composta por uma coleção de serviços abstraídos que podem funcionar e operar de forma independente. Isso permite o escalonamento horizontal no nível de produto, bem como no nível de serviço. Recursos de escalonamento ainda mais granulares podem ser delineados por SLA ou tipo de cliente (por exemplo, cobre, prata ou ouro) ou até mesmo por tipo de API, se houver diferentes níveis de demanda para determinadas APIs. Isso pode promover o uso eficiente d escalonamento dentro de uma determinada infraestrutura.