La surveillance au niveau des pods est nécessaire pour garantir que chaque pod fonctionne correctement au sein du cluster Kubernetes. Cela implique d’examiner trois types d’indicateurs : les indicateurs Kubernetes, les indicateurs de conteneur et les indicateurs d’application.
1. Indicateurs Kubernetes
La surveillance des indicateurs Kubernetes permet de s’assurer que tous les pods fonctionnent correctement au sein des déploiements Kubernetes.
Nombre d’instances de pod : Si le nombre d’instances pour un pod donné est inférieur au nombre attendu, il se peut que le cluster correspondant soit à court de ressources.
État des pods : Le fait de savoir si les pods sont en cours d’exécution et combien d’entre eux sont en attente, en panne ou ont pris fin apporte un éclairage sur leur disponibilité et leur stabilité.
Redémarrage des pods : Surveiller le nombre de redémarrages d’un pod donné permet d’évaluer la stabilité de l’application au sein du pod. Des redémarrages fréquents peuvent être dus à un problème sous-jacent tel que des pannes ou un manque de ressources.
Utilisation du processeur : La surveillance de la consommation du processeur au niveau des pods permet d’identifier les problèmes de performance potentiels et de s’assurer que les pods disposent de ressources de traitement suffisantes.
Utilisation de la mémoire : La surveillance de la consommation de mémoire au niveau des pods permet de détecter les fuites de mémoire ou l’utilisation excessive de mémoire susceptibles d’affecter la stabilité de l’application.
Utilisation du réseau : La surveillance des octets envoyés/reçus au niveau des pods renseigne sur leurs schémas de communication et permet d’identifier les problèmes de réseau.
Les indicateurs Kubernetes incluent également la vérification de l’état, les données réseau et le déroulement du déploiement en cours (c’est-à-dire le nombre d’instances passées d’une ancienne version à une nouvelle).
2. Indicateurs de conteneur
La surveillance des indicateurs de conteneur de pod permet de déterminer dans quelle mesure les limites de ressources configurées sont respectées. Ces indicateurs vous permettent également de détecter les pods qui sont bloqués dans un CrashLoopBackoff.
Utilisation et régulation du processeur : La surveillance de la consommation du processeur par les conteneurs en cours d’exécution permet d’identifier ceux qui consomment beaucoup de ressources ou qui créent des goulets d’étranglement, ce qui peut affecter les performances globales du cluster. Le suivi des indicateurs de régulation du processeur permet de savoir si les conteneurs sont limités dans leur utilisation du processeur en raison d’un manque de ressources ou de mauvais paramètres de configuration.
Utilisation de la mémoire : La surveillance de la consommation de mémoire des conteneurs en cours d’exécution attire l’attention sur les problèmes qui peuvent affecter la stabilité des conteneurs et les performances globales du système, à savoir les fuites de mémoire, l’utilisation excessive de la mémoire ou l’allocation insuffisante de mémoire.
Trafic et erreurs réseau : La surveillance du trafic réseau des conteneurs, ainsi que des erreurs telles que la perte de paquets ou les échecs de connexion, permet d’évaluer leurs schémas de communication et l’utilisation excessive du réseau ou les pics de trafic inattendus.
3. Indicateurs d’application
La surveillance des indicateurs d’application permet de mesurer les performances et la disponibilité des applications exécutées dans les pods Kubernetes. Ces indicateurs sont généralement développés par l’application Kubernetes elle-même et se rapportent aux règles métier qu’elle traite, par exemple la latence, la réactivité, les taux d’erreur et les temps de réponse.