IBM® Turbonomic을 위한 스로틀링 인식 컨테이너 CPU 크기 조정 기능을 출시한 지 1년 반이 지났으며, 그만한 이유가 있을 정도로 많은 관심을 받고 있습니다. 첫 번째 블로그 게시물에서 설명한 대로 잘못된 CPU 제한을 설정하면 애플리케이션 성능이 조용히 저하되고 문자 그대로 설계된 대로 작동합니다.
Turbonomic은 스로틀링 지표를 시각화하며, 더 중요한 것은 CPU 제한 크기 조정을 권장할 때 스로틀링을 고려한다는 것입니다. Turbonomic은 이 조용한 성능 저해 요소를 드러낼 수 있을 뿐만 아니라 컨테이너식 애플리케이션 성능에 미치는 영향을 최소화하기 위해 CPU 제한 값을 지정합니다.
이 새로운 게시물에서는 스로틀링 수준을 측정하는 방식의 상당한 개선에 대해 이야기하려고 합니다. 이러한 개선 이전에는 제한 지표가 제한 기간의 백분율을 기준으로 계산되었습니다. 이러한 측정을 통해 CPU 제한이 낮은 애플리케이션의 경우 전송률 저하가 과소평가되고 CPU 제한이 높은 애플리케이션의 경우 과대평가되었습니다. 그 결과 스로틀링을 최소화하고 성능을 보장하기 위해 하한 애플리케이션으로 의사 결정을 조정하면서 상한 애플리케이션의 규모를 너무 과감하게 늘렸습니다.
이 최근 개선 사항에서는 스로틀링된 시간의 비율을 기반으로 스로틀링을 측정합니다. 이 글에서는 이 새로운 측정이 어떻게 작동하는지, 그리고 왜 위에서 언급한 과소평가와 과대평가 모두를 바로잡을 수 있는지 보여드리겠습니다.
이 데모 비디오를 보면 비슷한 스로틀링 그림을 볼 수 있습니다. CPU 제한이 0.4코어(또는 400m)인 단일 스레드 컨테이너 앱이 있습니다. Linux의 400m 제한은 100ms당 40ms의 cgroup CPU 할당량으로 변환되며, 이는 Kubernetes가 채택한 Linux의 기본 할당량 적용 기간입니다. 즉, 앱은 60ms 동안 스로틀링되기 전에 각 100ms 기간에 40ms의 CPU 시간만 사용할 수 있습니다. 이 작업은 아래 표시된 것과 같이 200ms 작업의 경우 4회 반복되며, 마지막으로 다섯 번째 기간에 스로틀링 없이 완료됩니다. 전체적으로 200ms 작업은 완료하는 데
100 * 4 + 40 = 440ms가 소요되며, 이는 실제 필요한 CPU 시간의 두 배 이상입니다.
Linux는 cAdvisor가 모니터링하고 Kubernetes에 공급하는 스로틀링과 관련된 다음과 같은 지표를 제공합니다.
|Linux 지표
|cAdvisor 지표
|값(위 예시에서)
|설명
|nr_periods
|container_cpu_cfs_periods_total
|5
|실행 가능한 기간의 수입니다. 이 예에는 5개가 있습니다.
|nr_throttled
|container_cpu_cfs_throttled_periods_total
|4
|실행 가능한 5개의 기간 중 4개의 기간 동안만 스로틀링됩니다. 5번째 기간에는 요청이 완료되어 더 이상 스로틀링되지 않습니다.
|throttled_time
|container_cpu_cfs_throttled_seconds_total
|240ms
|처음 4개 기간은 40ms 동안 실행되고 60ms 동안 제한됩니다. 따라서 총 스로틀링 시간은 60ms * 4 = 240ms입니다.
스크롤하여 전체 표 보기
처음에 언급했듯이 스로틀링 수준은 실행 가능한 기간 중 스로틀링되는 기간의 비율로 측정했습니다. 위의 예에서는
4/5 = 80%입니다.
이 측정에는 상당한 편향이 존재합니다. 아래와 같이 CPU 제한이 800m인 두 번째 컨테이너 애플리케이션을 생각해 보세요. 처리 시간이 400ms인 작업은 80ms를 실행한 후 처음 네 번의 100ms 강제 주기마다 각각 20ms씩 제한됩니다. 그런 다음 5번째 기간에 완료됩니다. 현재 스로틀링 수준을 측정하는 방법을 사용하면 동일한 비율인 80%에 도달하게 됩니다. 하지만 분명한 것은 두 번째 앱은 첫 번째 앱보다 성능이 훨씬 떨어집니다. 총
20ms * 4 = 80ms 동안만 스로틀링되며, 이는 400ms의 CPU 실행 시간 중 일부에 불과합니다. 현재 측정된 80% 스로틀링 수준은 이 앱의 실제 상황을 반영하기에는 너무 높습니다.
스로틀링을 측정하는 더 나은 방법이 필요했고, 저희는 이를 만들었습니다.
새로운 방식에서는 스로틀링 수준을 CPU 사용과 스로틀링 사이의 총 시간 대비 스로틀링된 시간의 비율로 측정합니다. 위의 두 앱에 대한 새로운 측정값은 다음과 같습니다.
|애플리케이션
|스로틀링 시간
|총 실행 가능 시간
|스로틀링 시간 비율
|첫 번째
|240ms
|200ms + 240ms = 440ms
|240ms / 440ms = 55%
|두 번째
|80ms
|400ms + 80ms = 480ms
|80ms / 480ms = 17%
이 두 수치(55%와 17%)는 원래의 80%보다 더 의미가 있습니다. 두 가지 숫자가 두 가지 애플리케이션 시나리오를 구분하는 것일 뿐만 아니라, 각각의 값은 두 그래프에서 시각화할 수 있듯이 제한의 실제 영향을 더 적절하게 반영합니다. 직관적으로, 새로운 측정값은 스로틀링을 없애면 전체 작업 시간을 얼마나 개선하거나 줄일 수 있는지로 해석할 수 있습니다. 첫 번째 앱의 경우 전체 작업 시간을 240ms(전체의 55%)까지 줄일 수 있습니다. 두 번째 앱의 경우 스로틀링을 제거하면 17%에 불과해 첫 번째 앱만큼 크지 않습니다.
아래에서 스로틀링 기간을 사용하여 계산된 스로틀링 측정값과 시간 기반 버전을 비교하는 몇 가지 데이터를 확인할 수 있습니다.
CPU 제한이 낮은 컨테이너의 경우, 예상대로 스로틀링 기간만 사용하는 이전 버전에 비해 시간 기반 측정에서 훨씬 더 높은 스로틀링 비율이 나타납니다.
CPU 제한이 높아질수록 시간 기반 측정값은 다시 낮은 스로틀링 비율을 정확하게 반영합니다. 반대로 이전 버전은 스로틀링 비율이 훨씬 더 높기 때문에 CPU 제한이 충분히 높음에도 불구하고 공격적으로 크기를 조정할 수 있습니다.
|코어 수
|CPU 제한
|스로틀링 기간
|총 기간
|이전 평균
|스로틀링 시간(ms)
|총 사용량(ms)
|새로운 평균
|throttling-auto/low-cpu-high-throttling-77b6b5f84c-p97v8/kube-rbac-proxy-main
|10개
|20
|21
|75
|28
|2,884.59
|76.23
|97.42537968
|throttling-auto/low-cpu-high-throttling-77b6b5f84c-p97v8/low-cpu-high-throttling-spec
|10개
|20
|64
|148
|43.24324324
|9,690.95
|170.8
|98.26808196
|monitoring/kube-state-metrics-6c6f446b4-hrq7v/kube-rbac-proxy-main
|12
|20
|339
|567
|59.78835979
|43,943.63
|827.91
|98.15081538
|throttling-auto/low-cpu-high-throttling-77b6b5f84c-njptn/kube-state-metrics
|12
|100
|360
|8154
|4.415011038
|17,296.02
|21,838.65
|44.19615579
|dummy-ns/beekman-change-reconciler-5dbdcdb49b-sg2f9/beekman-2
|10개
|200
|8202
|8563
|95.78418778
|488,921.77
|168,961.80
|74.31737012
|dummy-ns/beekman-change-reconciler-5dbdcdb49b-5mktb/beekman-2
|12
|200
|8576
|8586
|99.88353133
|554,103.75
|171,659.58
|76.34771956
|quota-test/cpu-quota-1-7f84f77bc5-ztdbm/cpu-quota-1-spec
|12
|500
|3531
|8566
|41.2211067
|59,267.71
|357,274.10
|14.22851472
|turbo/kubeturbo-arsen-170-203-599fbdcff6-vbl55/kubeturbo-arsen-170-203-spec
|10개
|1000
|101
|1739
|5.807935595
|6,300.33
|32,319.39
|16.31375702
|default/nri-bundle-newrelic-logging-v8fqb/newrelic-logging
|12
|1300
|1
|8250
|0.012121212
|11.86
|177,353.93
|0.00668406
이 새로운 스로틀링 측정은 IBM Turbonomic 릴리스 8.7.5부터 사용할 수 있습니다. 또한 릴리스 8.8.2에서는 애플리케이션마다 스로틀링을 허용하는 측면에서 서로 다른 요구 사항이 있다는 것을 충분히 인식하고 있으므로 사용자가 각 개별 애플리케이션 또는 애플리케이션 그룹에 대한 최대 스로틀링 허용 오차를 사용자 지정할 수 있습니다. 예를 들어, 웹 서비스 애플리케이션과 같이 응답 시간에 민감한 애플리케이션은 허용 오차가 낮을 수 있지만 대규모 머신 러닝 작업과 같은 배치 애플리케이션은 허용 오차가 훨씬 높을 수 있습니다. 이제 사용자는 원하는 수준을 구성할 수 있습니다.
