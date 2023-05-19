タグ
IBM Turbonomic向けにスロットリングを意識したコンテナCPUサイジング主要な機能をリリースしてから早くも一年半が経ちました。この機能は、多くの注目を集めていますが、これには理由があります。最初のブログ記事で説明したように、間違ったCPU制限を設定することは、アプリケーションのパフォーマンスを静かに低下させ、文字通り「設計どおりに」動作してしまうのです。

Turbonomicはスロットリングのメトリクスを可視化するだけでなく、CPU制限の推奨値を決定する際にスロットリングを考慮します。単に静かにパフォーマンスを低下させる原因を明らかにするだけでなく、Turbonomicはコンテナ化アプリケーションのパフォーマンスへの影響を最小限に抑えるCPU制限値も提示します。

本記事では、スロットリングのレベルを測定する方法における大幅な改善について解説します。従来は、スロットリング指標を「スロットルされた期間の割合」に基づいて計算していました。この測定方法では、CPU制限が低いアプリケーションではスロットリングが過小評価され、CPU制限が高いアプリケーションでは過大評価されてしまいます。その結果、低制限アプリケーションのパフォーマンスを保証するためにスロットリングを最小化しようと意思決定を調整する過程で、高制限アプリケーションのサイズを過剰に大きく設定してしまうことがありました。

今回の改善では、「スロットリングされた時間の割合」に基づいてスロットリングを測定します。本記事では、この新しい測定方法の仕組みと、前述の過小評価・過大評価の問題をどのように解消するのかを解説します。

  • CPUスロットリングの概要
  • 従来のバイアスのある方法：期間ベースのスロットリング測定
  • 新しいバイアスのない方法：時間ベースのスロットリング測定
  • ベンチマーク成果
  • リリース

CPUスロットリングの概要

このデモ動画をご覧いただくと、スロットリングの様子を同様に確認できます。動画では、CPU制限が0.4コア（400m）のシングルスレッドコンテナアプリケーションが示されています。Linuxでは、この400mの制限はcgroupのCPUクオータとして100msあたり40msに変換されます。これはKubernetesが採用するLinuxのデフォルトのクオータ適用期間です。つまり、このアプリは100msごとの期間でCPU時間を40msしか使用できず、残りの60msはスロットルされます。この動作が200msのタスク（下図のようなタスク）の場合、4回繰り返され、最終的に5回目の期間でスロットルされることなく完了します。結果として、200msのタスクの実際のCPU時間よりも長く、100 * 4 + 40 = 440ms かかることになります。

 

CPUスロットリングの概要

Linuxは、スロットリングに関連する次のメトリクスを提供しており、cAdvisorが監視してKubernetesに送信します。

Linux MetriccAdvisor Metric値（上記の例）解説
nr_periodscontainer_cpu_cfs_periods_total5実行可能な期間の数です。例では5期間あります。
nr_throttledcontainer_cpu_cfs_throttled_periods_total4実行可能な5期間のうち4期間だけスロットルされます。5回目の期間ではリクエストが完了するため、スロットルされません。
throttled_timecontainer_cpu_cfs_throttled_seconds_total240ms最初の4期間では、40ms実行され、60msにわたってスロットルされます。したがって、スロットル時間の合計は 60ms * 4 = 240msです。

スクロールして表全体を表示

従来のバイアスのある方法：期間ベースのスロットリング測定

冒頭で述べたように、従来はスロットリングのレベルを「スロットルされた実行可能期間の割合」として測定していました。上記の例では、4 / 5 = 80% となります。

しかし、この測定には大きなバイアス（偏り）があります。次に、CPU制限が800mの別のコンテナアプリケーションを考えてみましょう。下図のように、400ミリ秒の処理時間のタスクは、80ミリ秒で実行され、その後、100ミリ秒の最初の4つの強制期間ごとに20ミリ秒スロットルされます。その後、5回目の期間でタスクは完了します。従来のスロットリングレベル測定方法では、同じパーセンテージ（80％）として計算されます。しかし明らかに、この2つ目のアプリは1つ目のアプリよりも影響が小さいです。スロットル時間は合計わずか20ミリ秒 * 4 = 80ミリ秒で、これは400ミリ秒のCPU実行時間のほんの一部に過ぎません。従来の測定で得られる80％というスロットリングレベルは、高すぎてこのアプリの実態を反映していません。

より適切なスロットリング測定方法が必要であり、その方法を開発しました。

期間ベースのスロットリング測定

新しい/バイアスのない方法：時間ベースのスロットリング測定

新しい方法では、スロットリングレベルを「CPU使用時間とスロットルされた時間を合わせた合計時間に対するスロットルされた時間の割合」として測定します。上記2つのアプリケーションにおける新しい測定結果は以下の通りです。

アプリケーションスロットルされた時間実行可能総時間スロットルされた時間の割合
1つ目240ms200ms + 240ms = 440ms240ms / 440ms = 55%
2つ目80ms400ms + 80ms = 480ms80ms / 480ms = 17%
スクロールして表全体を表示
 

55％と17％のこれら2つの数値は、元の80％よりも妥当です。これらは2つのアプリケーション・シナリオを区別する2つの異なる数値であるだけでなく、2つのグラフから視覚化できるように、それぞれの値はスロットリングの真の影響をより適切に反映しています。直感的には、新しい測定値は、スロットリングを排除することで全体的なタスク時間をどの程度改善/短縮できるかとして解釈できます。1つ目のアプリでは、全体のタスク時間を240ミリ秒（全体の55%）短縮できます。2つ目のアプリでは、スロットリングをなくしても全体時間の17%に過ぎず、1つ目ほどの影響はありません。

ベンチマーク成果

以下に、スロットリング期間を使用して計算されたスロットリング測定値と時間ベースのバージョンを比較するデータを示します。

CPU制限が低いコンテナでは、時間ベースの測定のほうが、従来のスロットル期間のみを使用する方法よりも、はるかに高いスロットリング割合を示します。これは予想どおりです。

CPU制限が上がるにつれて、時間ベースの測定は再び低いスロットリング割合を正確に反映します逆に、古いバージョンではスロットリングの割合がはるかに高いため、CPU制限が十分に高いにもかかわらず、過剰なサイズアップが発生する可能性があります。

コア数CPU制限スロットル期間合計期間従来の平均スロットル時間（ミリ秒/ms）総使用時間（ミリ秒/ms）新しい平均
throttling-auto/low-cpu-high-throttling-77b6b5f84c-p97v8/kube-rbac-proxy-main10202175282,884.5976.2397.42537968
throttling-auto/low-cpu-high-throttling-77b6b5f84c-p97v8/low-cpu-high-throttling-spec10206414843.243243249,690.95170.898.26808196
monitoring/kube-state-metrics-6c6f446b4-hrq7v/kube-rbac-proxy-main122033956759.7883597943,943.63827.9198.15081538
throttling-auto/low-cpu-high-throttling-77b6b5f84c-njptn/kube-state-metrics1210036081544.41501103817,296.0221,838.6544.19615579
 dummy-ns/beekman-change-reconciler-5dbdcdb49b-sg2f9/beekman-2102008202856395.78418778488,921.77168,961.8074.31737012
 dummy-ns/beekman-change-reconciler-5dbdcdb49b-5mktb/beekman-2122008576858699.88353133554,103.75171,659.5876.34771956
 quota-test/cpu-quota-1-7f84f77bc5-ztdbm/cpu-quota-1-spec125003531856641.221106759,267.71357,274.1014.22851472
 turbo/kubeturbo-arsen-170-203-599fbdcff6-vbl55/kubeturbo-arsen-170-203-spec10100010117395.8079355956,300.3332,319.3916.31375702
default/nri-bundle-newrelic-logging-v8fqb/newrelic-logging121300182500.01212121211.86177,353.930.00668406
スクロールして表全体を表示

リリース

この新しいスロットリング測定機能は、IBM Turbonomic 8.7.5以降で利用可能です。さらに、8.8.2のリリースでは、各アプリケーションまたはアプリケーショングループごとに最大スロットリング許容度をカスタマイズできるようになりました。これは、アプリケーションごとにスロットリング耐性のニーズが異なることを十分に考慮したものです。たとえば、Webサービスのようなレスポンス時間に敏感なアプリケーションは許容度が低く、機械学習の大規模バッチ処理のようなアプリケーションはより高い許容度を持つ場合があります。現在では、ユーザーが希望するレベルに応じて設定できるようになっています。

