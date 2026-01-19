MTTFは、同一品目の母集団の故障までの平均稼働時間を表します。最も単純な形式では、MTTFはすべての資産の合計稼働時間を資産の故障の合計数で割ります。

「合計稼働時間」は各品目が故障するまで（または観測が停止するまで）の寿命の合計であり、「故障数」は実際に故障した品目の数です。

MTTF = 全品目の合計稼働時間 / 故障の合計数

コンテナ・クラスターを例にとってみましょう。

コンテナは、通常は修復されない一時的なインスタンスです。コンテナがクラッシュしたり、異常が発生した場合、コンテナ・オーケストレーション・ツール（Kubernetesなど）はそのコンテナを破棄し、新しいコンテナをスピン・アップします。

50個の同一のアプリケーション・コンテナでステートレスなWebサービスを実行しているITチームは、各コンテナの実行時間（作成から障害まで）を測定し、それを失敗したコンテナの数で割ることでMTTFを計算できます。アセスメントの結果、チームは50個のコンテナのグループが合計200時間実行され、その過程で5個のコンテナに障害が発生したことを発見しました。

MTTF = 200時間の稼働時間 / 5回の故障 = 40時間

このクラスターのコンテナのMTTFは40時間です。

MTTFは実際のユースケースにおいて完璧かつ正確な公式ではないため、DevOpsチームは一般的にコンポーネントの耐久性の近似として、また他のインシデント管理KPI（たとえば 平均修理時間（MTTR）やMTBF）の文脈で使用します。MTTFはこの場合、チームがコンテナ・クラスターに毎日何回の再起動が必要になるかを見積もる際の参考にすることができるため、クラスターのサイジングと自動スケーリングのリソースを適切に割り当てることができます。

ただし、故障データや運用データが正確であればあるほど、またチームがより多くのデータを含めるほど、MTTFの計算はより正確になります。