Il cloud può far sembrare che, se si dispone di un budget sufficiente, si abbia a disposizione una potenza di calcolo infinita. Tuttavia, questa potenza di calcolo è disponibile "a fette". Gli host (fisici e virtuali), i container e le funzioni sono tutti soggetti a limitazioni sulla quantità di memoria che è possibile allocare.

Su Linux, l'out-of-memory killer (OOM) è un processo incaricato di impedire ad altri processi di esaurire collettivamente la memoria dell'host. Quando un processo tenta di allocare più memoria di quella disponibile, il processo che ha il punteggio di inattendibilità più alto, in base ad esempio alla quantità di memoria allocata al di sopra di quella consentita, riceverà un segnale OOM. Fondamentalmente, ciò significa: "Così non va bene. Interrompi ciò che stai facendo o fai in modo che alcuni dei tuoi processi secondari si fermino, altrimenti non potrai più proseguire".

Si noti che il processo che attiva l'OOM potrebbe non essere il processo che riceve il segnale OOM. Un'applicazione che non ha aumentato di recente l'utilizzo della memoria può ricevere all'improvviso un segnale OOM perché troppe altre applicazioni sono state avviate sullo stesso host.

La meccanica di un segnale OOM sembra dura, ma in realtà è un meccanismo molto efficace per prevenire l'esaurimento della memoria sugli host, soprattutto nel caso di applicazioni non dimensionate correttamente o di troppe applicazioni in esecuzione in parallelo (ad esempio, gli host non sono dimensionati correttamente per il carico di lavoro).

Per piattaforme containerizzate come Kubernetes, Cloud Foundry e Nomad, l'uso della memoria, sia in termini di dimensionamento appropriato delle applicazioni sia di quante applicazioni eseguire contemporaneamente su un host, è ancora più importante. In genere, non si pianifica nel dettaglio quali applicazioni saranno in esecuzione su un dato nodo. In molte configurazioni, i container verranno assegnati in base a una certa logica dall'orchestratore. L'imposizione del consumo massimo di memoria è fondamentale per i container e i gruppi di controllo (cgroup), che sono alla base di quasi tutte le tecnologie di container su Linux. Utilizzano anche il sistema OOM killer per garantire che i processi in esecuzione nello stesso gruppo (ad esempio un container) non allochino più memoria di quella consentita. Quando i processi nei container tentano di allocare più memoria di quella consentita, alcuni vengono terminati, spesso portando con sé anche i container corrispondenti.

Su larga scala, tutto è più difficile, compreso il dimensionamento. Più container vengono eseguiti nei propri ambienti, più è difficile capire quando, come e perché alcuni di essi si bloccano. L'OOM killer può creare situazioni malsane per le tue applicazioni in cui qualcosa si blocca sempre da qualche parte e poi viene riavviato, creando una serie continua di errori per gli utenti finali che alterano i tuoi obiettivi di livello di servizio (SLO) e sono davvero difficili da risolvere.