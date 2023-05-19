自我们为 IBM Turbonomic 推出支持节流感知的容器 CPU 规格设定功能以来，已过去一年半时间，该功能获得了广泛关注，这是有充分理由的。正如我们在首篇博客文章中所阐述的，设置错误的 CPU 限制会悄无声息地扼杀您的应用性能，而这恰恰是按设计进行的。
Turbonomic 能够可视化节流指标，更重要的是，它会在建议 CPU 限制规格时将节流因素纳入考量。我们不仅能揭示这一隐形的性能杀手，Turbonomic 还会提供 CPU 限制值建议，以最大程度降低其对您容器化应用性能的影响。
在这篇新文章中，我们将探讨我们在节流水平测量方式上的一项重大改进。在此改进之前，我们的节流指标是基于节流周期的百分比计算的。采用这种测量方法，对于 CPU 限制较低的应用，节流会被低估；而对于 CPU 限制较高的应用，节流则被高估。这导致我们在调整决策以最大程度减少节流并保障低限制应用的性能时，会过于激进地扩大高限制应用的规格。
在最近的这项改进中，我们基于节流时间的百分比来测量节流。在本文中，我们将向您展示这种新的测量方法如何运作，以及它为何能纠正上述的低估和高估问题：
如果您观看此演示视频，可以看到类似的节流图示。其中展示的是一个 CPU 限制为 0.4 核（或 400 毫核）的单线程容器应用。在 Linux 中，400 毫核的限制被转换为 cgroup 的 CPU 配额：每 100 毫秒周期内可使用 40 毫秒 CPU 时间——这是 Kubernetes 采用的 Linux 默认配额执行周期。这意味着该应用在每个 100 毫秒周期内只能使用 40 毫秒 CPU 时间，随后便会遭受 60 毫秒的节流。对于一个 200 毫秒的任务（如下文所示），此过程会重复四次，最终在第五个周期内完成且未受节流。总体而言，该 200 毫秒的任务耗时
100 毫秒 * 4 + 40 毫秒 = 440 毫秒完成，超出实际所需 CPU 时间的两倍以上：
Linux 提供以下与节流相关的指标，由 cAdvisor 监控并反馈给 Kubernetes：
|Linux 指标
|cAdvisor 指标
|数值（基于以上示例）
|含义
|nr_periods
|container_cpu_cfs_periods_total
|5
|这是可运行周期的数量。在示例中，共有五个周期。
|nr_throttled
|container_cpu_cfs_throttled_periods_total
|4
|在五个可运行周期中，仅其中四个周期发生了节流。在第五个周期，请求已完成，因此不再被节流。
|throttled_time
|container_cpu_cfs_throttled_seconds_total
|240 毫秒
|在前四个周期中，每个周期运行 40 毫秒并被节流 60 毫秒。因此，总节流时间为 60 毫秒 * 4 = 240 毫秒。
滚动查看完整表格
如前文所述，我们以往将节流水平衡量为遭受节流的可运行周期百分比。在上述示例中，该值为
4/5 = 80%。
这种测量方法存在明显偏差。假设第二个容器应用的 CPU 限制为 800 毫核，如下图所示。一个需要 400 毫秒处理时间的任务，将在前四个 100 毫秒的执行周期中，每个周期运行 80 毫秒随后被节流 20 毫秒。最终在第五个周期完成。若采用当前的节流水平测量方法，会得到相同的百分比：80%。但显然，第二个应用所受影响远小于第一个应用。其节流总时间仅为
20 毫秒 * 4 = 80 毫秒，仅占 400 毫秒 CPU 运行时间的一小部分。当前测得的 80% 节流水平过高，无法真实反映该应用的实际状况。
我们需要一种更好的节流测量方法，于是我们创造了：
采用新方法后，我们通过节流时间占 CPU 使用与被节流总时长的百分比来衡量节流水平。以下是上述两个应用的新测量结果：
|应用程序
|节流时间
|总可运行时间
|节流时间百分比
|首个应用
|240 毫秒
|200 毫秒 + 240 毫秒 = 440 毫秒
|240 毫秒/440 毫秒 = 55%
|第二个应用
|80 毫秒
|400 毫秒 + 80 毫秒 = 480 毫秒
|80 毫秒/480 毫秒 = 17%
这两个数字——55% 与 17%——比原先的 80% 更符合实际。它们不仅是区分两种应用场景的不同数值，其各自的大小也更准确地反映了节流的真实影响，正如您从两幅图中可以直观感受到的。从直觉上理解，新测量方法可解读为：若消除节流，整体任务时间能够改善/缩短的程度。对第一个应用而言，我们可将总任务时间减少 240 毫秒（占总时间的 55%）。而对第二个应用，即使消除节流也仅能减少 17% 的时间——其影响远不如第一个应用显著。
在下文中，您将看到一些数据，用于比较基于节流周期与基于时间的两种节流测量结果。
对于 CPU 限制较低的容器，基于时间的测量方法（如预期那样）显示出比仅使用节流周期的旧方法更高的节流百分比。
随着 CPU 限制的提高，基于时间的测量再次准确反映出更低的节流百分比。相反，旧版本则显示出明显偏高的节流百分比，这可能导致即使 CPU 限制已足够高，仍会触发过于激进的规格上调操作。
|内核数量
|CPU 限制
|节流周期数
|总周期数
|旧平均值
|节流时间（毫秒）
|总使用时间（毫秒）
|新平均值
|throttling-auto/low-cpu-high-throttling-77b6b5f84c-p97v8/kube-rbac-proxy-main
|10
|20
|21
|75
|28
|2,884.59
|76.23
|97.42537968
|throttling-auto/low-cpu-high-throttling-77b6b5f84c-p97v8/low-cpu-high-throttling-spec
|10
|20
|64
|148
|43.24324324
|9,690.95
|170.8
|98.26808196
|monitoring/kube-state-metrics-6c6f446b4-hrq7v/kube-rbac-proxy-main
|12
|20
|339
|567
|59.78835979
|43,943.63
|827.91
|98.15081538
|throttling-auto/low-cpu-high-throttling-77b6b5f84c-njptn/kube-state-metrics
|12
|100
|360
|8154
|4.415011038
|17,296.02
|21,838.65
|44.19615579
|dummy-ns/beekman-change-reconciler-5dbdcdb49b-sg2f9/beekman-2
|10
|200
|8202
|8563
|95.78418778
|488,921.77
|168,961.80
|74.31737012
|dummy-ns/beekman-change-reconciler-5dbdcdb49b-5mktb/beekman-2
|12
|200
|8576
|8586
|99.88353133
|554,103.75
|171,659.58
|76.34771956
|quota-test/cpu-quota-1-7f84f77bc5-ztdbm/cpu-quota-1-spec
|12
|500
|3531
|8566
|41.2211067
|59,267.71
|357,274.10
|14.22851472
|turbo/kubeturbo-arsen-170-203-599fbdcff6-vbl55/kubeturbo-arsen-170-203-spec
|10
|1000
|101
|1739
|5.807935595
|6,300.33
|32,319.39
|16.31375702
|default/nri-bundle-newrelic-logging-v8fqb/newrelic-logging
|12
|1300
|1
|8250
|0.012121212
|11.86
|177,353.93
|0.00668406
这项全新的节流测量功能已于 IBM Turbonomic 8.7.5 版本提供。此外，在 8.8.2 版本中，我们还允许用户为每个独立应用或应用组自定义最大节流容忍度，因为我们充分认识到不同应用对节流的耐受需求各不相同。例如，对响应时间敏感的应用（如 Web 服务类应用）容忍度可能较低，而批处理类应用（如大型机器学习任务）则可能具有更高的容忍度。现在，用户可以根据需要自行配置期望的节流容忍水平。
