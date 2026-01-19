El MTTF representa el tiempo medio de funcionamiento hasta el fallo de una población de elementos idénticos. En su forma más simple, el MTTF divide el tiempo total de funcionamiento de todos los activos entre el número total de fallos de los activos.

Donde el “total de horas de funcionamiento” es la suma de la vida útil de cada elemento hasta el fallo (o hasta que se detiene la observación), y el “número de fallos” es el número de elementos que realmente fallaron:

MTTF = Total de horas de funcionamiento de todos los elementos/Número total de fallos

Pongamos como ejemplo un clúster de contenedores.

Los contenedores son instancias efímeras que no suelen repararse. Cuando un contenedor se bloquea o pasa a estar en mal estado, las herramientas de orquestación de contenedores (como Kubernetes) simplemente destruyen el contenedor y hacen girar uno nuevo.

Un equipo de TI que ejecute un servicio web sin estado en 50 contenedores de aplicación idénticos puede calcular el MTTF midiendo el tiempo de ejecución de cada contenedor (desde la creación hasta el fallo) y dividiéndolo por el número de contenedores fallidos. En su evaluación, el equipo concluye que el grupo de 50 contenedores funcionó durante un total de 200 horas, con cinco contenedores fallando en el proceso.

MTTF = 200 horas de tiempo de funcionamiento/5 fallos = 40 horas

El MTTF para los contenedores de este clúster es de 40 horas.

El MTTF no es una fórmula perfecta ni exacta para los casos de uso del mundo real, por lo que los equipos de DevOps generalmente lo utilizan como una aproximación de la durabilidad de los componentes y en el contexto de otros KPI de gestión de incidentes, como el tiempo medio de reparación (MTTR) y el MTBF. El MTTF puede, en este caso, ayudar a los equipos a estimar cuántos reinicios requerirá el clúster de contenedores cada día, para que puedan asignar el tamaño del clúster y los recursos de autoescalado de forma adecuada.

Sin embargo, cuanto más precisos sean los datos de fallos y operativos, y cuantos más datos incluyan los equipos, más precisos serán los cálculos de MTTF.