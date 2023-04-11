Aujourd’hui, la majorité des entreprises qui exécutent des applications stratégiques sur Kubernetes le font dans des environnements à locataires multiples. Ces environnements s’appuient sur la définition de limites pour réguler la consommation des charges de travail des locataires ou pour utiliser des limites pour les chargebacks. Certains développeurs choisissent de définir des limites de CPU ou de GPU pour les tests de référence de leurs applications.
La régulation du processeur, par laquelle le taux de planification des tâches sur les cœurs physiques du processeur diminue par inadvertance, ce qui entraîne souvent une augmentation indésirable du temps de réponse des applications, est la conséquence involontaire de cette conception. Découvrez cet exemple :
Dans la figure ci-dessus, l’utilisation du processeur par un conteneur n’est que de 25 %, ce qui en fait un bon candidat au redimensionnement :
Mais après avoir redimensionné le conteneur (l’utilisation CPU du conteneur est maintenant de 50 %, ce qui n’est pas encore très élevé), le temps de réponse a quadruplé.
Quelle est la situation ? La régulation du processeur se produit lorsque vous configurez une limitation du processeur sur un conteneur, ce qui peut inversement ralentir le temps de réponse de votre application et provoquer un problème de régulation. Même si vous avez plus de ressources qu'il n'en faut sur votre nœud sous-jacent, la charge de travail de votre conteneur sera toujours limitée, car il n'a pas été configuré correctement. En outre, l'impact de la régulation sur les performances peut varier en fonction du processeur physique sous-jacent (Intel, AMD et NVIDIA). Les temps de réponse élevés sont directement corrélés aux périodes de régulation élevée du processeur, et c’est exactement ainsi que Kubernetes a été conçu pour fonctionner.
Pour illustrer cela, imaginez que vous définissiez une limite CPU de 200 ms et que cette limite soit traduite en un quota de groupe dans le système Linux sous-jacent. Le conteneur ne peut utiliser que 20 ms de CPU à la fois (appelé tranche de temps CPU) car la période d'application par défaut n'est que de 100 ms. Si votre tâche prend plus de 20 ms, vous serez limité et il vous faudra 4 fois plus de temps pour la terminer.
En fonction de ce comportement, les performances de l'application en pâtiront en raison de l'augmentation du temps de réponse causée par la régulation et vous lancerez le dépannage pour essayer de trouver le problème.
Si vous effectuez un petit déploiement, vous pourrez peut-être résoudre les problèmes de régulation manuellement.
Tout d’abord, vous devez identifier le pod affecté à l’aide d’outils tels que kubectl. Ensuite, examinez les ressources et les limites du pod pour vous assurer qu’elles sont définies de manière appropriée. Vérifiez si les processus gourmands en ressources s’exécutant à l’intérieur du conteneur sont susceptibles d’être à l’origine de la régulation et analysez l’utilisation et les limites de l’unité centrale.
Si la régulation du processeur persiste, envisagez une mise à l’échelle automatique horizontale du pod pour distribuer la charge de travail sur plus de pods, ou ajustez les ressources de nœuds du cluster pour répondre aux demandes. Surveillez et affinez en permanence les paramètres des ressources pour optimiser les performances et éviter les problèmes de régulation.
Dans un déploiement plus important, il est peu probable que cette approche évolue ou persiste à mesure que vous ajoutez des pods.
La régulation du processeur est un indicateur clé de performance des applications en raison de la corrélation directe entre le temps de réponse et la régulation du processeur. C’est une excellente nouvelle pour vous, car vous pouvez obtenir cet indicateur directement auprès de Kubernetes et OpenShift.
Pour maintenir les temps de réponse de votre application, éviter de limiter le processeur et continuer à avoir une application à performance élevée, vous devez d’abord comprendre que lorsque la régulation du processeur se produit, vous ne pouvez pas vous fier uniquement à l’utilisation des cœurs du processeur. Vous devez prendre en compte toutes les dépendances en matière d’analytique et de ressources qui ont un impact sur la performance de l’application. IBM Turbonomic a intégré ces considérations dans sa plateforme analytique.
Pour déterminer les actions de redimensionnement des conteneurs, Turbonomic analyse systématiquement quatre dimensions :
Turbonomic peut déterminer les limites de CPU qui réduiront le risque de régulation et permettra à vos applications de fonctionner sans encombre. Cela est lié à la puissance de l’ajout de la régulation du processeur en tant que dimension qui permet à la plateforme d’analyser et de gérer les compromis qui apparaissent. L’ajout de la dimension de la régulation du processeur garantira de faibles temps de réponse des applications.
En plus de cela, Turbonomic génère des actions pour déplacer vos pods et faire évoluer vos clusters (comme tout le monde le sait, c’est un défi de pile complète). Les clients ont la possibilité de voir les KPI et de poser la question : « Lequel de mes services est limité ? » Cela leur permet également de comprendre l’historique de la régulation du processeur pour chaque service et de se rappeler que chaque service est directement corrélé au temps de réponse des applications, offrant ainsi aux utilisateurs des fenêtres précieuses sur les performances de leur système.
Dans le contexte Kubernetes, l’un des principaux avantages de Turbonomic est sa capacité à identifier et à corriger rapidement les conséquences imprévues d’une stratégie de plateforme plutôt que de demander au client de repenser sa stratégie de plateforme à locataires multiples. Non seulement Turbonomic peut surveiller les indicateurs de régulation du CPU, mais la plateforme peut également redimensionner automatiquement votre limite de CPU et ramener la régulation à un niveau gérable.
IBM Turbonomic peut vous aider à optimiser simultanément vos dépenses et vos performances liées au cloud. Vous pouvez automatiser de façon continue, en temps réel et sans intervention humaine les actions d’optimisation qui permettent d’utiliser de manière proactive et la plus efficace possible les ressources de calcul, de mémoire, de stockage et de réseau de vos applications à chaque couche de la pile.
