Las compañías dependen cada día de diversos sistemas y equipamiento para mantener sus operaciones funcionando sin problemas. Pero todos los sistemas inevitablemente requieren mantenimiento. Podría ser software intangible, como una red de servicios de TI que ha acumulado suficientes errores para romper una característica importante, lo que hace que los desarrolladores se apresuren a buscar un arreglo. O podría ser una pieza de equipamiento físico, como una máquina de helados en un restaurante de comida rápida con una junta tórica rota.
Eventualmente, todo se descompone, desde los sistemas de TI multisitio hasta las bombillas individuales. El tiempo de inactividad no planificado puede tener consecuencias catastróficas, y depende de los ingenieros y técnicos de mantenimiento de las instalaciones planificar con anticipación para que se tomen medidas rápidas para rectificar una falla. El objetivo es minimizar el tiempo de inactividad, reduciendo los costos asociados con la pérdida de productividad, los ingresos o la insatisfacción del cliente.
El tiempo de inactividad se puede minimizar de muchas maneras. Por ejemplo, las empresas pueden tratar de reducir la cantidad de tiempo que lleva reparar un equipamiento al tener suficientes piezas de repuesto accesibles para los técnicos en el sitio. O bien, pueden observar los procesos de reparación para encontrar formas más rápidas de realizar reparaciones o formas más rápidas de notificar a los técnicos. Además, pueden invertir en herramientas de mejor rendimiento con una vida útil más larga para reducir la cantidad de reparaciones necesarias.
Pero para entender cómo mejorar la fiabilidad de los sistemas y componentes, primero debemos ser capaces de medir su fiabilidad. El tiempo medio de reparación (MTTR),también conocido como tiempo medio hasta la recuperación, y el tiempo medio entre fallos (MTBF) son dos métricas de fallo comúnmente empleadas para medir la fiabilidad de sistemas o productos dentro del campo del mantenimiento de las instalaciones. Aunque estas siglas están relacionadas, tienen significados diferentes y se utilizan para responder a preguntas diferentes.
Primero, repasemos el MTBF.
Boletín de la industria
Manténgase al día sobre las tendencias más importantes e intrigantes de la industria sobre IA, automatización, datos y más con el boletín Think. Consulte la Declaración de privacidad de IBM.
Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.
El MTBF es un indicador clave de rendimiento (KPI) que representa el tiempo promedio entre dos fallas consecutivas de un sistema o producto. MTBF es una medida de confiabilidad, y se usa comúnmente en el contexto de garantías, planificación de mantenimiento y desarrollo de productos. Tenga en cuenta que MTBF, que se refiere a elementos reparables, no debe confundirse con el término estrechamente relacionado, tiempo medio de falla (MTTF), que se refiere a activos que no son reparables y deben reemplazarse en lugar de repararse.
El cálculo del MTBF utiliza esta fórmula:
MTBF = Tiempo total de funcionamiento/Número de fallas durante un periodo determinado
Por ejemplo, si un producto se usa durante 1000 horas y falla 3 veces durante ese periodo, el MTBF sería: 1000 horas/3 fallos = 333.3 horas
Esto significa que, en promedio, se puede esperar que el producto falle después de 333.3 horas de uso.
El MTBF es útil para determinar la vida útil esperada de un producto y puede ayudar a los fabricantes a planificar el mantenimiento o el reemplazo. Sin embargo, no toma en cuenta cuánto tiempo se tarda en reparar un producto después de que falla, lo cual puede ser una consideración importante en algunas aplicaciones.
Ahí es donde entra en juego MTTR.
El MTTR es el tiempo promedio que se tarda en reparar un sistema o producto después de que ha fallado. El MTTR se utiliza para medir la confiabilidad de un sistema o producto desde el punto de vista de la reparación. El MTTR suele incluir el tiempo que lleva notificar a los equipos de mantenimiento, permitir que el equipo se enfríe para su reparación, solucionar el problema, volver a montar cualquier equipo o sistema relevante y realizar pruebas antes de reiniciar la producción.
El objetivo del MTTR es minimizar el tiempo de inactividad causado por fallas y reducir los costos asociados con las reparaciones.
Así es como se calcula el MTTR:
MTTR = Tiempo de inactividad total/Número total de fallas durante un tiempo específico
Por ejemplo, si en el último año un sistema falla 5 veces, dando como resultado un total de 10 horas de tiempo de inactividad (incluyendo el tiempo de reparación), el MTTR sería: 10 horas/5 reparaciones = 2 horas
Esto significa que, en promedio, se tarda dos horas en reparar el sistema después de que se produce una falla.
El MTTR es útil para determinar la eficiencia de las operaciones de mantenimiento y puede ayudar a identificar áreas en las que se pueden realizar mejoras.
El tiempo medio entre fallas (MTBF) y el tiempo medio de reparación (MTTR) responden diferentes preguntas y tienen diferentes aplicaciones. El MTBF y el MTTR existen en una familia de KPI que incluyen el tiempo medio de respuesta, el tiempo medio para detectar (MTTD) y el tiempo medio de reconocimiento (MTTA), entre otros.
El MTBF es una medida de cuánto tiempo se espera que funcione un sistema o producto antes de que falle, y se utiliza para planificar el mantenimiento o el reemplazo. El MTTR es una medida de cuánto tiempo se tarda en reparar un sistema o producto después de que falla, y se utiliza para minimizar el tiempo de inactividad y reducir los costos de reparación.
El MTBF no tiene en cuenta el período de tiempo que lleva reparar un producto después de que falla, mientras que el MTTR no tiene en cuenta el tiempo total entre fallas.
En muchos casos de uso, ambas métricas pueden utilizarse en conjunto para obtener una imagen más completa de la mantenibilidad general de un sistema o producto. Por ejemplo, en una planta de fabricación, el MTBF podría usarse para determinar la vida útil esperada de una máquina y planificar el reemplazo, mientras que el MTTR podría usarse para optimizar los programas de mantenimiento de esa máquina y maximizar el tiempo de actividad total.
En el contexto del desarrollo de software, el MTBF podría usarse para medir la estabilidad de un sistema y planificar actualizaciones o arreglos, mientras que el MTTR podría usarse para optimizar el proceso de desarrollo y reducir el tiempo que lleva solucionar problemas.
Mejorar el MTBF y el MTTR para reducir el tiempo de inactividad puede ser un proceso complejo que implica identificar y abordar las causas principales de las fallas del sistema, optimizar las operaciones de mantenimiento e implementar mejoras en los procesos de diseño y fabricación.
Hoy en día, las grandes organizaciones utilizan sistemas computarizados de gestión de mantenimiento (CMMS) para ayudarse a gestionar sus procesos de mantenimiento. Un CMMS suele ofrecer características como gestión de órdenes de trabajo, programación de mantenimiento preventivo, gestión de inventario, gestión de activos e informes.
IBM® Maximo es un software de gestión de activos empresariales que incluye capacidades integrales de CMMS. Maximo es una plataforma única e integrada basada en nubes que emplea inteligencia artificial (IA), IoT y analytics para optimizar el rendimiento, extender el ciclo de vida del activo y reducir los costos de los cortes. Una herramienta relacionada, IBM® Instana Observability, ofrece observabilidad completa, con el objetivo de ayudar a los usuarios a optimizar y democratizar la prevención de incidentes.
Ambos productos le darán la visibilidad de sus activos y operaciones que necesitará para tomar decisiones más inteligentes basadas en datos, lo que en última instancia dará como resultado menos averías y menos tiempo de inactividad.
Suscríbase al boletín Think