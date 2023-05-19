Cela fait un an et demi que nous avons mis en place la fonctionnalité de dimensionnement des processeurs de conteneurs pour IBM Turbonomic, et elle a attiré beaucoup d'attention, pour de bonnes raisons. Comme nous l'avons illustré dans notre premier article de blog, le fait de fixer une mauvaise limite au processeur tue silencieusement les performances de votre application, qui fonctionne littéralement comme prévu.
Turbonomic visualise les indicateurs de régulation et, plus important encore, prend en compte la régulation lors de la recommandation du dimensionnement limite de l'unité centrale. Nous pouvons non seulement exposer ce tueur silencieux de performances, mais Turbonomic prescrira la valeur limite du processeur pour réduire son impact sur les performances de vos applications conteneurisées.
Dans ce nouveau billet, nous allons parler d'une amélioration significative de la façon dont nous mesurons le niveau de régulation. Avant cette amélioration, notre indicateur de régulation était calculé sur la base du pourcentage de périodes de régulation. Avec une telle mesure, la régulation était sous-estimée pour les applications ayant une faible limite de processeur et surestimée pour celles avec une limite de processeur élevée. Cela a eu pour conséquence de surévaluer les applications à haute limite, alors que nous orientions notre prise de décision vers les applications à basse limite afin de réduire la régulation et de garantir leur performance.
Dans cette récente amélioration, nous mesurons la régulation en fonction du pourcentage du temps limité. Dans cet article, nous allons vous montrer comment fonctionne cette nouvelle mesure et pourquoi elle corrigera à la fois la sous-estimation et la surestimation mentionnées ci-dessus :
Si vous regardez cette vidéo de démonstration, vous pouvez voir une illustration similaire de la régulation. Là, il s’agit d’une application conteneur à unité d’exécution unique avec une limite de processeur de 0,4 cœur (ou 400 m). La limite de 400 m dans Linux est traduite en un quota de processeur de cgroup de 40 ms par 100 ms, qui est la période d'application de quota par défaut dans Linux que Kubernetes adopte. Cela signifie que l'application ne peut utiliser que 40 ms de temps de processeur par période de 100 ms avant d'être limitée à 60 ms. Ce processus se répète quatre fois pour une tâche de 200 ms (comme celle illustrée ci-dessous) et s'achève finalement au cours de la cinquième période sans être limitée. Dans l'ensemble, la tâche de 200 ms prend
100 x 4 + 40 = 440 ms, soit plus de deux fois le temps réel de processeur nécessaire :
Linux fournit les indicateurs suivants relatifs à la régulation, que cAdvisor surveille et transmet à Kubernetes :
|Indicateur Linux
|Indicateur cAdvisor
|Valeur (dans l’exemple ci-dessus)
|Explication
|nr_periods
|container_cpu_cfs_periods_total
|5
|Il s’agit du nombre de périodes exécutables. Dans cet exemple, il y en a cinq.
|nr_throttled
|container_cpu_cfs_throttled_periods_total
|4
|Elle n’est limitée que pendant quatre des cinq périodes exécutables. Au cours de la cinquième période, la requête est effectuée et n’est donc plus limitée.
|throttled_time
|container_cpu_cfs_throttled_seconds_total
|240 ms
|Pour les quatre premières périodes, elle s’exécute pendant 40 ms et est limitée pendant 60 ms. Par conséquent, le temps total de limitation est de 60 ms x 4 = 240 ms.
Faites défiler pour voir le tableau complet
Comme mentionné au début, nous mesurions le niveau de limitation en pourcentage de périodes exécutables qui sont limitées. Dans l’exemple ci-dessus, ce serait
4 / 5 = 80 %.
Cette mesure présente un biais important. Prenons l’exemple d’une deuxième application de conteneurs avec une limite de CPU de 800 Mo, comme illustré ci-dessous. Une tâche dont le temps de traitement est de 400 ms s’exécutera pendant 80 ms, puis sera limitée pendant 20 ms au cours de chacune des quatre premières périodes d’exécution de 100 ms. Elle sera ensuite achevée au cours de la cinquième période. Avec la méthode actuelle de mesure du niveau de limitation, on arrivera au même pourcentage : 80 %. Mais il est clair que cette deuxième application souffre beaucoup moins que la première. Elle est limitée pendant seulement
20 ms x 4 = 80 ms au total, soit une fraction du temps d’exécution du CPU, qui est de 400 ms. Le niveau de limitation de 80 % actuellement mesuré est beaucoup trop élevé pour refléter la situation réelle de cette application.
Nous avions besoin d’un meilleur moyen de mesurer la limitation, et nous l’avons créé :
Avec la nouvelle méthode, nous mesurons le niveau de limitation en tant que pourcentage de temps limité par rapport au temps total entre l’utilisation du CPU et la limitation. Voici les nouvelles mesures des deux applications ci-dessus :
|Application
|Temps de limitation
|Temps d’exécution total
|Pourcentage de temps de limitation
|Première
|240 ms
|200 ms + 240 ms = 440 ms
|240 ms / 440 ms = 55 %
|Deuxième
|80 ms
|400 ms + 80 ms = 480 ms
|80 ms / 480 ms = 17 %
Ces deux pourcentages, 55 % et 17 %, sont plus logiques que les 80 % du début. En plus de différencier les deux scénarios d’application, leurs valeurs respectives reflètent mieux l’impact réel de la limitation, comme vous pouvez le visualiser sur les deux graphiques. Intuitivement, la nouvelle mesure peut être interprétée comme le degré d’amélioration/de réduction de la durée de la tâche que l’on peut atteindre en supprimant la limitation. Pour la première application, nous pouvons réduire la durée totale de la tâche de 240 ms (55 % du total). Pour la deuxième application, c’est seulement 17 % si nous supprimons la limitation, soit une réduction moins importante que celle obtenue pour la première application.
Vous trouverez ci-dessous quelques données permettant de comparer les mesures de limitation calculées à l’aide des périodes de limitation et de la version axée sur le temps.
Pour un conteneur dont les limites de processeur sont faibles, la mesure axée sur le temps indique des pourcentages de limitation bien plus élevés que l’ancienne version, qui n’utilise que les périodes de limitation, comme prévu.
À mesure que les limites du processeur augmentent, les mesures axées sur le temps reflètent à nouveau avec précision des pourcentages de limitation inférieurs. Inversement, l’ancienne version présente un pourcentage de limitation beaucoup plus élevé, ce qui peut entraîner un redimensionnement agressif malgré une limite de processeur suffisamment élevée.
|Nombre de cœurs
|Limite du processeur
|Périodes limitées
|Nombre total de périodes
|Ancienne moyenne
|Temps de limitation (ms)
|Utilisation totale (ms)
|Nouvelle moyenne
|throttling-auto/low-cpu-high-throttling-77b6b5f84c-p97v8/kube-rbac-proxy-main
|10
|20
|21
|75
|28
|2,884.59
|76.23
|97.42537968
|throttling-auto/low-cpu-high-throttling-77b6b5f84c-p97v8/low-cpu-high-throttling-spec
|10
|20
|64
|148
|43.24324324
|9,690.95
|170.8
|98.26808196
|monitoring/kube-state-metrics-6c6f446b4-hrq7v/kube-rbac-proxy-main
|12
|20
|339
|567
|59.78835979
|43,943.63
|827.91
|98.15081538
|throttling-auto/low-cpu-high-throttling-77b6b5f84c-njptn/kube-state-metrics
|12
|100
|360
|8154
|4.415011038
|17,296.02
|21,838.65
|44.19615579
|dummy-ns/beekman-change-reconciler-5dbdcdb49b-sg2f9/beekman-2
|10
|200
|8202
|8563
|95.78418778
|488,921.77
|168,961.80
|74.31737012
|dummy-ns/beekman-change-reconciler-5dbdcdb49b-5mktb/beekman-2
|12
|200
|8576
|8586
|99.88353133
|554,103.75
|171,659.58
|76.34771956
|quota-test/cpu-quota-1-7f84f77bc5-ztdbm/cpu-quota-1-spec
|12
|500
|3531
|8566
|41.2211067
|59,267.71
|357,274.10
|14.22851472
|turbo/kubeturbo-arsen-170-203-599fbdcff6-vbl55/kubeturbo-arsen-170-203-spec
|10
|1000
|101
|1739
|5.807935595
|6,300.33
|32,319.39
|16.31375702
|default/nri-bundle-newrelic-logging-v8fqb/newrelic-logging
|12
|1300
|1
|8250
|0.012121212
|11.86
|177,353.93
|0.00668406
Cette nouvelle mesure de la limitation est disponible depuis la version 8.7.5 d’IBM Turbonomic. De plus, dans la version 8.8.2, nous permettons également aux utilisateurs de personnaliser la tolérance de limitation maximale pour chaque application ou groupe d’applications, car nous savons que chaque application a des besoins différents en matière de tolérance à la limitation. Par exemple, les applications sensibles au temps de réponse, comme les applications de services Web, peuvent avoir une tolérance plus faible, tandis que les applications par lots comme les tâches volumineuses de machine learning peuvent avoir une tolérance beaucoup plus élevée. Désormais, les utilisateurs peuvent configurer le niveau comme ils le souhaitent.
Vous souhaitez mettre l’IA au service de votre entreprise ? Découvrez comment IBM® Cloud et Red Hat facilitent la personnalisation, le déploiement et la mise à l’échelle de l’IA. Le tout en une seule session ! Participez au webinaire et bâtissez votre voie vers la réussite de l’IA.
Ce rapport IDC montre comment les entreprises relèvent les défis les plus complexes de la migration vers le cloud et ce qui fonctionne.
Explorez le Magic Quadrant 2024 pour les CDBMS et repérez les fournisseurs qui proposent des écosystèmes de données haute performance et adaptés à l’hybride.
En appliquant IBM Watson Discovery, watsonx Assistant et watsonx.ai sur IBM Cloud, l’entreprise d’EdTech a non seulement amélioré l’expérience d’apprentissage de ses clients, mais a également obtenu des avantages métier significatifs.
Découvrez les solutions de migration vers le cloud d’IBM, conçues pour rationaliser votre parcours en la matière. Découvrez les différents types de migration, les stratégies et les avantages qui favorisent l’efficacité, l’évolutivité et l’innovation.
Explorez les principales différences entre les solutions de cloud public, privé et hybride d’IBM. Identifiez le modèle de cloud qui répond le mieux aux besoins de votre entreprise en termes de flexibilité, de sécurité et d’évolutivité.
Créez votre compte IBM Cloud gratuit et accédez à plus de 40 produits toujours gratuits, y compris les API IBM Watson.
Déverrouillez de nouvelles fonctionnalités et stimulez l’agilité de votre entreprise grâce aux services de conseil d’IBM Cloud. Découvrez comment co-créer des solutions, accélérer la transformation numérique et optimiser les performances grâce à des stratégies de cloud hybride et à des partenariats d’experts.
Libérez tout le potentiel de l’IA et du cloud hybride avec la plateforme sécurisée et évolutive d’IBM. Commencez par explorer nos solutions adaptées à l’IA ou créez un compte pour accéder à des produits et services toujours gratuits.