¿Cómo funciona un plan de recuperación tras desastre (DR)?

Un plan de recuperación tras desastre (DR) es un documento formal creado por una organización que contiene instrucciones detalladas sobre cómo responder a incidentes no planificados como, por ejemplo, desastres naturales, interrupciones de suministro eléctrico, ciberataques y cualquier otro suceso disruptivo. El plan contiene estrategias sobre cómo minimizar los efectos de un desastre, para que una organización siga en funcionamiento o pueda reanudar rápidamente sus principales operaciones.

Las disrupciones pueden provocar pérdidas de ingresos, daños a la marca y clientes insatisfechos. Cuanto mayor sea el tiempo de recuperación, mayor será el impacto empresarial adverso. Por lo tanto, un buen plan de recuperación tras desastre debería permitir una rápida recuperación de las disrupciones, independientemente del origen de la disrupción.

Dé soporte a la continuidad de negocio con la recuperación tras desastre en cloud en cuestión de minutos después de una interrupción con Disaster recovery as a service (DRaaS)

Explore DRaaS

Un plan de DR es más especializado que un plan de continuidad de negocio y no cubre necesariamente todas las contingencias de procesos de negocio, activos, recursos humanos y business partners.

Una solución de DR eficaz suele abordar todos los tipos de disrupciones de funcionamiento, no solo los principales desastres naturales o provocados por el ser humano, que hacen que una ubicación no esté disponible. Las disrupciones pueden incluir interrupciones de suministro eléctrico, interrupciones de telefonía, pérdida temporal de acceso a las instalaciones debido a una amenaza de bomba, un "posible incendio" o un incendio, inundación o suceso de otro tipo no destructivo y de bajo impacto. Un plan de DR debe organizarse por tipo de desastre y ubicación. Debe contener scripts (instrucciones) que pueda implementar cualquier persona.

Antes de los años 70, la mayoría de organizaciones solo tenían que preocuparse de hacer copias de sus registros en papel. La planificación de la recuperación tras desastre fue adquiriendo importancia en los 70 a medida que las empresas empezaron a depender más de las operaciones basadas en ordenadores. Por aquel entonces, la mayoría de sistemas eran mainframes basados en lotes. Se puede cargar otro mainframe externo desde las cintas de copia de seguridad, dependiendo de la recuperación del sitio primario.

En 1983, el gobierno de EE. UU. exigió que los bancos nacionales debían tener un plan de copia de seguridad comprobable. Después se exigió a muchas otras industrias, ya que comprendieron las importantes pérdidas financieras asociadas a las interrupciones a largo plazo.

En los años 2000, las empresas eran aún más dependientes de los servicios digitales en línea. Con la introducción del big data, el cloud, los medios móviles y las redes sociales, las empresas tuvieron que hacer frente a la captura y el almacenamiento de cantidades ingentes de datos a un ritmo exponencial. Aumentó la complejidad de los planes de DR para tener en cuenta cantidades mucho mayores de almacenamiento de datos de una miríada de dispositivos. La llegada del cloud computing en los años 2010 redujo la complejidad de la recuperación tras desastre al permitir que las organizaciones externalizasen sus planes y soluciones de recuperación tras desastre, lo que también se conoce como recuperación tras desastre como servicio (DRaaS).

Otra tendencia actual que subraya la importancia de un plan detallado de recuperación tras desastre es la creciente sofisticación de los ciberataques. Las estadísticas del sector muestran que muchos ataques permanecen sin detectarse más de 200 días. Con tanto tiempo para ocultarse en una red, los atacantes pueden implementar malware que se infiltra en los conjuntos de copias de seguridad, llegando a infectar incluso los datos de recuperación. Los ataques pueden permanecer latentes durante semanas o meses, lo que permite propagar el malware por todo el sistema. Incluso después de que se detecte el ataque, puede ser extremadamente difícil eliminar un malware que se ha extendido tanto en toda la organización.

Cada segundo cuenta: Recuperación rápida para la entrega de paquetes

La disrupción del negocio debido a un ciberataque puede tener un impacto devastador en una organización. Por ejemplo, la ciberinterrupción en una empresa de mensajería puede interrumpir las operaciones en toda su cadena de suministro, lo que supone una pérdida financiera y de reputación. En el mundo actual digitalmente tan dependiente, cada segundo de interrupción cuenta.


¿Por qué es importante tener un plan de DR?

La necesidad urgente de mejorar la experiencia del cliente y el resultado de negocio está aumentando la tendencia de adoptar un entorno multicloud híbrido en las empresas. No obstante, el entorno multicloud híbrido aumenta la complejidad de la infraestructura y los riesgos potenciales que requieren la gestión de habilidades y herramientas especializadas. Como resultado de la complejidad, las organizaciones están sufriendo interrupciones frecuentes y fallos del sistema, junto con ciberataques, falta de habilidades y errores de proveedores. El impacto de negocio de las interrupciones o el tiempo de inactividad no planificado es extremadamente alto, más aún en un entorno multicloud híbrido. Aumentar la resiliencia en un entorno multicloud híbrido requiere un plan de recuperación tras desastre que incluya habilidades especializadas, una estrategia integrada y tecnologías avanzadas, además de la coordinación para la protección y la recuperación de datos. Las organizaciones deben tener una resiliencia empresarial integral con tecnología de coordinación para mitigar los riesgos de continuidad de negocio en el entorno multicloud híbrido, lo que permite a las empresas cumplir sus objetivos de transformación digital

Otras razones clave por las que una empresa desea un plan de recuperación tras desastre detallado y probado incluyen:

  • Minimizar las interrupciones de las operaciones normales.
  • Limitar el alcance de la disrupción y el daño.
  • Minimizar el impacto económico de la interrupción.
  • Establecer con antelación medios alternativos de funcionamiento.
  • Capacitar al personal con procedimientos de emergencia.
  • Proporcionar una restauración rápida y fluida del servicio.

Para cumplir las expectativas actuales de las operaciones de continuidad de negocio, las organizaciones deben poder restaurar sistemas fundamentales en cuestión de minutos, si no segundos después de una disrupción.


¿Cómo utilizan las organizaciones un plan de recuperación tras desastre (DR)?

Muchas organizaciones intentan desarrollar sus estrategias de plan de recuperación tras desastre cuanto antes para abordar los entornos de TI híbridos actuales y las complejas operaciones de negocio. En un mundo 24/7 siempre activo, una organización puede conseguir una ventaja competitiva —o perder cuota de mercado— en función la rapidez con la que pueda reponerse tras un desastre y recuperar los servicios empresariales básicos.

Algunas organizaciones utilizan servicios externos de consultoría de recuperación tras desastre y continuidad empresarial para responder a las necesidades de una empresa de contar con evaluaciones, planificación y diseño, implementación, pruebas y gestión de programas de resiliencia completa.

Hay servicios proactivos como, por ejemplo, IBM IT Infrastructure Recovery Services, que ayudan a las empresas a superar las disrupciones con soluciones de DR de TI flexibles y rentables.

Con el aumento de los ciberataques, las empresas están cambiando de un enfoque de recuperación tradicional/manual a un enfoque de resiliencia automatizado y definido por software. El enfoque de IBM Cyber Resilience Services utiliza tecnologías avanzadas y mejores prácticas para evaluar los riesgos, priorizar y proteger aplicaciones y datos cruciales para la empresa. Estas soluciones DR pueden ayudar a las empresas a recuperar la TI rápidamente durante y después de un ciberataque.

Otras empresas recurren a servicios de copia de seguridad basados en cloud como, por ejemplo, IBM Disaster Recovery as a Service (DRaaS), para proporcionar una réplica continua de las aplicaciones esenciales, la infraestructura, los datos y los sistemas, que permite una rápida recuperación tras una interrupción de TI. También hay opciones de servidor virtual como, por ejemplo, IBM Cloud Virtualized Server Recovery, para proteger los servidores esenciales en tiempo real. Esto permite una rápida recuperación de las aplicaciones en un IBM Resiliency Center, para mantener las empresas operativas durante periodos de mantenimiento o un tiempo de inactividad inesperado.

Para un número cada vez mayor de organizaciones, la solución incluye la coordinación de resiliencia, un enfoque basado en cloud que utiliza la automatización de la recuperación tras desastre y un conjunto de herramientas de gestión de continuidad diseñadas específicamente para entornos de TI híbridos. Por ejemplo, IBM Resiliency Orchestration permite proteger las dependencias de los procesos de negocio en aplicaciones, datos y componentes de infraestructura. Aumenta la disponibilidad de las aplicaciones empresariales para que las empresas puedan acceder a la información detallada o de alto nivel necesaria en relación con el Objetivo de punto de recuperación (RPO), el Objetivo de tiempo de recuperación (RTO) y el estado general de la continuidad de TI desde un panel de control centralizado.

En un mundo siempre activo como el actual, su empresa no puede permitirse tiempos de inactividad, que pueden dar como resultado pérdidas de ingresos, daños a la reputación y sanciones regulatorias. Descubra cómo IBM Cloud Resiliency Orchestration permite transformar la gestión de recuperación de TI mediante la automatización para simplificar el proceso de recuperación tras desastre, aumentar la eficiencia del flujo de trabajo y reducir el tiempo de prueba de riesgos, costes y sistemas.


¿Cómo se utiliza un plan de recuperación tras desastre (DR) en la industria?

Hyundai Heavy Industries (HHI) se enfrentó a esa dura realidad cuando sufrió un terremoto de magnitud 5,8 en 2016. Como el centro de copia de seguridad de la compañía estaba ubicado cerca de la sede en Ulsan City, Corea, el terremoto sirvió como una llamada de atención para que HHI examinara sus sistemas de recuperación tras desastre y determinara el grado de preparación para una gama completa de posibles interrupciones.

En 2016, un terremoto demostró lo cerca que un desastre natural puede estar de dañar la infraestructura de TI esencial de Hyundai. El liderazgo de TI respondió rápidamente, trabajando con IBM Business Resiliency Services para implementar una sólida solución de recuperación tras desastre con un centro de datos remoto.


¿Cuáles son los pasos clave de un plan de recuperación tras desastre (DR)?

El objetivo de un plan de recuperación tras desastre (DR) es garantizar que una organización pueda responder a un desastre u otra emergencia que afecte a los sistemas de información, y minimizar el efecto en las operaciones de negocio.IBM ha creado una plantilla para producir un plan básico de recuperación tras desastre. A continuación, se muestran los pasos recomendados que se encuentran en la plantilla de DR. Una vez que ha preparado la información, se recomienda almacenar el documento en una ubicación segura y accesible fuera del sitio.

Paso 1: Objetivos principales. El primer paso es perfilar a grandes rasgos los principales objetivos de un plan de recuperación tras desastre.

Paso 2: Personal. Registre el personal de procesamiento de datos. Incluya una copia del organigrama con el plan.

Paso 3: Perfil de aplicación. Enumere las aplicaciones e indique si son esenciales y si son un activo fijo.

Paso 4: Perfil de inventario. Indique el fabricante, el modelo, el número de serie, el coste y si cada artículo es de propiedad o arrendado.

Paso 5: Procedimientos de copia de seguridad de servicios de información. Incluya información como: "Los destinatarios de diario se cambian a las ________ y a las ________". Y: "Los objetos modificados en las siguientes bibliotecas y directorios se guardan a las ____".

Paso 6: Procedimientos de recuperación tras desastre. Para cualquier plan de DR, deben abordarse estos tres elementos:

  • Procedimientos de respuesta de emergencia para documentar la respuesta de emergencia apropiada a un incendio, desastre natural o cualquier otra actividad con el fin de proteger vidas y limitar los daños.
  • Procedimientos de operaciones de copia de seguridad para garantizar que las tareas operativas de procesamiento de datos esenciales se puedan realizar después de la disrupción.
  • Procedimientos de acciones de recuperación para facilitar la rápida restauración de un sistema de tratamiento de datos tras un desastre.

Paso 7: Plan de DR para el sitio móvil. El plan debe incluir un plan de configuración del sitio móvil, un plan de desastre de comunicación (incluidos los diagramas de cableado) y un diagrama de servicio eléctrico.

Paso 8: Plan DR para un hot site. Un plan de hot site alternativo debe proporcionar un sitio alternativo (de reserva). El sitio alternativo tiene un sistema de copia de seguridad de uso temporal, que se utiliza mientras se restablece el sitio de inicio.

Paso 9: Restauración de todo el sistema. Para que el sistema vuelva al estado en el que estaba antes del desastre, utilice los procedimientos para recuperarse después de una pérdida completa del sistema que se indican en Gestión de sistemas: Copia de seguridad y recuperación.

Paso 10: Proceso de reconstrucción. El equipo de gestión debe evaluar los daños y comenzar la reconstrucción de un nuevo centro de datos.

Paso 11: Prueba de la recuperación tras desastre y el plan de ciberrecuperación. En una planificación de contingencia satisfactoria, es importante probar y evaluar el plan de DR regularmente. Las operaciones de procesamiento de datos son de naturaleza volátil, lo que provoca cambios frecuentes en el equipo, los programas y la documentación. Debido a estas acciones, es fundamental considerar el plan como un documento cambiante.

Paso 12: Reconstrucción del sitio del desastre. Este paso debe incluir un plan de planta del centro de datos, las necesidades de hardware actuales y las posibles alternativas, así como la superficie del centro de datos, los requisitos de energía y los requisitos de seguridad.

Paso 13: Registro de cambios del plan. Mantenga el plan de DR actualizado. Mantenga registros de los cambios en la configuración, las aplicaciones y las planificaciones y los procedimientos de copia de seguridad.