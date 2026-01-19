El MTTF representa el tiempo operativo promedio hasta la falla para una población de elementos idénticos. En su forma más simple, el MTTF divide el tiempo total de funcionamiento de todos los activos por el número total de fallas de activos.

Donde “horas de funcionamiento totales” es la suma de la vida útil de cada elemento hasta que falla (o hasta que se detenga la observación), y “número de fallas” es el número de elementos que realmente fallaron:

MTTF = Total de horas de funcionamiento de todos los elementos/Número total de fallas

Tomemos como ejemplo un clúster de contenedores.

Los contenedores son instancias efímeras que normalmente no se reparan. Cuando un contenedor falla o deja de funcionar correctamente, las herramientas de orquestación de contenedores (como Kubernetes) simplemente destruyen el contenedor y crean uno nuevo.

Un equipo de TI que ejecuta un servicio web sin estado en 50 contenedores de aplicaciones idénticos puede calcular el MTTF midiendo cuánto tiempo se ejecuta cada contenedor (desde la creación hasta la falla) y dividiéndolo por la cantidad de contenedores fallidos. En su evaluación, el equipo descubre que el grupo de 50 contenedores funcionó durante un total de 200 horas, y cinco contenedores fallaron en el proceso.

MTTF = 200 horas de tiempo de funcionamiento/5 fallas = 40 horas

El MTTF para los contenedores de este clúster es de 40 horas.

El MTTF no es una fórmula perfecta ni exacta para los casos de uso del mundo real, por lo que los equipos de DevOps generalmente lo utilizan como una aproximación de la durabilidad de los componentes y en el contexto de otros KPI de gestión de incidentes, como el tiempo medio de reparación (MTTR) y el MTBF. En este caso, el MTTF puede ayudar a los equipos a estimar cuántos reinicios necesitará el clúster de contenedores cada día, para que puedan asignar el tamaño del clúster y los recursos de autoescalado de forma adecuada.

Sin embargo, cuanto más precisos sean los datos operativos y de fallas, y cuantos más datos incluyan los equipos, más precisos serán los cálculos de MTTF.