RTO (Objetivo de tiempo de recuperación) explicado

Por IBM Services

¿Qué es el RTO (Objetivo de tiempo de recuperación)?

Los RTO representan la cantidad de tiempo que una aplicación puede estar inactiva sin resultar en un daño significativo para el negocio y el tiempo que el sistema necesita para recuperarse. Este proceso de recuperación incluye las medidas que los equipos de TI deben tomar para devolver la aplicación y sus datos a como estaban antes del desastre. Para aplicaciones de gran prioridad, un RTO puede significar segundos sin problemas, siempre y cuando el departamento de TI haya invertido en servicios de conmutación por error. Los RTO requieren que su departamento de TI primero organice sus aplicaciones en función de su prioridad y riesgo de pérdidas comerciales. Posteriormente, TI les asigna a estas aplicaciones la cantidad adecuada de recursos de su empresa, principalmente tiempo, dinero e infraestructura de TI.

Determinación de un RTO

Los RTO se utilizan para medir el tiempo que tarda el departamento de TI en recuperar los datos después de un desastre. Para su base de evaluación, los RTO representan las necesidades generales de su negocio y determinan cuánto tiempo este puede sobrevivir sin infraestructura y servicios de TI. Los RTO primero deben adaptarse a lo que su departamento de TI puede hacer. Los administradores de TI necesitan comprender detalladamente los diferentes tipos de velocidades de restauración para calcular un RTO que satisfaga las necesidades de su empresa. Por ejemplo, no puede tener un RTO de una hora si el tiempo de restauración mínimo posible es de dos horas.

Debido a que el proceso implica restaurar todas las operaciones de TI, los RTO suelen ser complicados. Su departamento de TI puede agilizar parte del proceso de recuperación automatizando tanto como sea posible. El RTO puede ser más costoso que un RPO granular, y un RTO exigente implica toda su infraestructura empresarial y no solo los datos. El costo de lograr un RTO o RPO se corresponde con la priorización de aplicaciones y datos de su departamento de TI. TI prioriza las aplicaciones y los datos en función de sus ingresos y riesgos. Si los datos de una aplicación están regulados, la pérdida de datos de esa aplicación podría resultar en grandes multas, independientemente de la frecuencia con la que se utilice dicha aplicación.

Obtención de un RTO o RPO de casi cero

Aunque los RTO y RPO varían en relación con la aplicación y la prioridad de los datos, es increíblemente costoso para cualquier empresa lograr un RTO o RPO de casi cero en todas sus aplicaciones. Solo se puede conseguir un RTO con 100 % de tiempo de actividad y un RPO con nula pérdida de datos si se invierte en la réplica de datos continua y en entornos virtuales.

Ejemplo de un RTO

Un ejemplo de RTO es la recuperación granular de elementos. En este ejemplo, un usuario de una empresa con mucha actividad elimina un e-mail importante y vacía la carpeta Papelera. Esta empresa utiliza Microsoft Exchange como una aplicación esencial y su departamento de TI continuamente respalda los cambios a nivel delta en Exchange junto con una aplicación de copia de seguridad que cuenta con copia de seguridad y recuperación granulares. Este recurso permite al departamento de TI recuperar rápidamente el e-mail importante en solo cinco minutos, en lugar de tener que restaurar una máquina virtual completa por un solo correo.

¿Qué es el objetivo de tiempo de recuperación (RTO) y cómo impacta la recuperación de desastres de su empresa?

Recuperación de desastres y RTO

Cortes de electricidad. Robos. Servidores y discos duros dañados. Ciberataques y ransomware. Tornados, terremotos y huracanes. Hay muchos tipos diferentes de desastres que pueden causar estragos en su negocio si no está preparado. Debido a que estos desastres a menudo son inevitables, tener una infraestructura de TI sólida y establecer objetivos de punto y tiempo de recuperación regulares es esencial para apoyar su recuperación. Es posible que su departamento de TI realice una conmutación por error de una aplicación y replique sus datos para evitar una pérdida, sin embargo, para ello requiere recursos sustanciales. Su departamento de TI necesita establecer un RTO basado en sus aplicaciones más importantes, así como en el presupuesto y los recursos asignados a estas.

¿Qué es el RPO y cómo se diferencia del RTO?

Los RTO coinciden con los objetivos de punto de recuperación (RPO), una medición del tiempo de la falla, desastre o pérdida similar. Los RPO calculan cuándo sus datos estuvieron disponibles por última vez, probablemente la copia de seguridad más reciente. Los RPO y los RTO son conceptos fundamentales para la continuidad del negocio y son métricas necesarias para determinar con qué frecuencia su empresa debería programar sus copias de seguridad de datos.

Orquestación de resiliencia y recuperación de desastres

Existen muchos retos para diseñar una estrategia de recuperación de desastres, especialmente para una recuperación ante desastres en entornos de TI híbridos. Estos desafíos incluyen, aunque no exclusivamente:

  • Las cargas de trabajo desplegadas en distintos entornos
  • Las interdependencias entre la infraestructura de TI y las aplicaciones
  • El regreso de todos los dispositivos, componentes y aplicaciones al RPO y la restauración completa del funcionamiento del negocio
  • El retraso aún mayor en la restauración del sistema debido al orden incorrecto de recuperación de sistemas y aplicaciones.

¿Cómo se puede desarrollar y ofrecer una estrategia de recuperación de desastres exitosa pese a los obstáculos? La recuperación de algunas aplicaciones importantes en pocas horas es tradicionalmente posible con el equipo de TI adecuado, pero requiere una gran cantidad de recursos valiosos. Hoy en día se necesitan mayores RTO y RPO y una recuperación del sistema donde se puedan restaurar varias aplicaciones importantes rápidamente. Ahora es posible minimizar el impacto de una interrupción y realizar una recuperación en cuestión de minutos. La automatización es crucial, ya que permite a los programas de recuperación de desastres escalar mediante la automatización de flujos de trabajo en diferentes aplicaciones de forma rápida y confiable a través de una migración a entornos híbridos.

La tecnología de orquestación de resiliencia actual le ayuda a implementar exitosamente su estrategia de recuperación de desastres y a reducir las demandas de tiempo de inactividad de la producción y la exposición empresarial que se generan por las interrupciones. En términos de preparación, la orquestación de resiliencia ayuda a las empresas a realizar pruebas de recuperación de desastres exitosas con menos personal. La orquestación de resiliencia también ayuda a estas organizaciones a reducir aún más su preparación y validación de pruebas de recuperación de desastres. Una de las ventajas principales de la tecnología de orquestación de resiliencia es su capacidad para funcionar en entornos físicos, virtuales y de nube, al mismo tiempo que conserva información de la aplicación. Como los usuarios finales esperan cada vez más parámetros de acuerdos de autoservicio y de bajo nivel de servicio para los servicios en la nube, las estrategias de orquestación de resiliencia son esenciales para las empresas modernas que buscan adoptar entornos de nube.