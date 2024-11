A nuvem pode fazer parecer que, se você tiver orçamento suficiente, terá um poder de computação infinito à sua disposição. No entanto, esse poder de computação vem em fatias. Servidores (físicos e virtuais), contêineres e funções, todos trazem limitações quanto à quantidade de memória que pode ser alocada.

No Linux, o encerramento por memória insuficiente (OOM) é um processo encarregado de impedir que outros processos esgotem coletivamente a memória do host. Se um processo tentar alocar mais memória do que a disponível, o processo com pontuação negativa geral mais alta, com base, por exemplo, na quantidade de memória alocada acima do permitido, receberá um sinal OOM. Isso significa fundamentalmente: "Você saiu da linha. Saia ou faça alguns dos seus processos filhos pararem, ou as luzes se apagarão".

Observe que o processo que aciona o OOM pode não ser o processo que recebe o sinal de OOM. Uma aplicação que não aumentou recentemente seu uso de memória pode, de repente, receber um sinal de OOM porque muitos outros aplicativos foram iniciados no mesmo host.

A mecânica de um sinal de OOM parece rígida, mas na verdade é um mecanismo muito eficaz para evitar o esgotamento da memória nos servidores, especialmente no caso de aplicativos não dimensionados corretamente ou de muitos aplicativos executados em paralelo (ou seja, os hosts não são dimensionados corretamente para a carga de trabalho).

Para plataformas conteinerizadas, como Kubernetes, Cloud Foundry e Nomad, o uso da memória, tanto em termos de dimensionamento adequado das aplicações quanto de quantidade de aplicações a serem executadas a qualquer momento em um servidor, é ainda mais importante. Geralmente, você não planeja em detalhes quais aplicativos estão sendo executados em um único nó. Em muitas configurações, os contêineres serão alocados de acordo com alguma lógica pelo orquestrador. Aplicar o consumo máximo de memória é crítico para contêineres e grupos de controle (cgroups), a base de praticamente todas as tecnologias de contêiner no Linux. Elas também utilizam o sistema matador OOM para garantir que os processos executados no mesmo grupo (ou seja, um contêiner) não aloquem mais memória do que o permitido. Quando os processos em seus contêineres tentam alocar mais memória do que o permitido, alguns serão encerrados, muitas vezes derrubando seus contêineres com eles.

Em escala, tudo é mais difícil, inclusive o dimensionamento. Quanto mais contêineres você executar em seus ambientes, mais difícil será entender quando, como e por que alguns deles ficam inativos. O encerramento por falta de memória pode criar situações não saudáveis para suas aplicações nas quais algo está sempre falhando em algum lugar e depois é reiniciado, criando uma quantidade contínua de erros para seus usuários finais que distorcem seus objetivos de nível de serviço (SLOs) e são muito difíceis de solucionar.