¿Cómo funciona un plan de recuperación de desastres (DR)?

Un plan de recuperación de desastres (DR) es un documento formal creado por una empresa que contiene instrucciones detalladas acerca de cómo responder a incidentes no planificados como desastres naturales, cortes de electricidad, ataques cibernéticos y cualquier otro evento disruptivo. El plan incluye estrategias para minimizar los efectos de un desastre y permitir que una organización continúe operando o reanude rápidamente las operaciones importantes.

Las interrupciones pueden provocar pérdidas de ingresos, daños a la reputación de la marca y clientes insatisfechos. Y mientras más largo sea el tiempo de recuperación, mayor será el impacto empresarial negativo. Por lo tanto, un buen plan de recuperación de desastres debería permitir una rápida recuperación de las interrupciones, independientemente de la fuente de estas.

Apoye la continuidad del negocio con recuperación de desastres en la nube en minutos luego de una interrupción con la recuperación de desastres como servicio (DRaaS)

Explore DRaaS

Un plan de DR es más específico que un plan de continuidad de negocio y no cubre necesariamente todas las contingencias para procesos empresariales, activos, recursos humanos y socios comerciales.

Una solución de DR exitosa suele abordar todos los tipos de interrupción de operaciones y no solamente las principales catástrofes naturales o provocadas por el hombre que hacen que una ubicación no esté disponible. Las interrupciones pueden incluir cortes de electricidad, cortes de la red telefónica, pérdida temporal de acceso a una instalación debido a amenazas de bomba, un "posible incendio" o un incendio no destructivo de bajo impacto, inundación u otro evento. Un plan de DR debería estar organizado por tipo de desastre y ubicación. Debe contener scripts (instrucciones) que cualquier persona pueda implementar.

Antes de los años 70, la mayoría de las organizaciones solo tenían que preocuparse por hacer copias de sus registros en papel. La planificación de la recuperación de desastres cobró relevancia en los años 70 a medida que las empresas comenzaron a depender más de las operaciones basadas en computadoras. En ese momento, la mayoría de los sistemas eran mainframes orientados por lotes y se podía cargar otro mainframe fuera del sitio desde cintas de copia de seguridad, en espera de recuperación del sitio principal.

En 1983, el gobierno de los EE. UU. ordenó que los bancos nacionales debían tener un plan de copia de seguridad. Muchas otras industrias le siguieron, ya que comprendieron las importantes pérdidas financieras asociadas a las interrupciones a largo plazo.

Para los años 2000, las empresas se habían vuelto aún más dependientes de los servicios digitales en línea. Con la introducción del big data, la nube, los medios móviles y las redes sociales, las empresas tuvieron que ingeniárselas para recolectar y almacenar grandes cantidades de datos a un ritmo exponencial. Los planes de DR tenían que ser mucho más complejos para responder a cantidades mucho mayores de almacenamiento de datos de un sinnúmero de dispositivos. La llegada de la computación en la nube en la década del 2010 ayudó a reducir esta complejidad de la recuperación de desastres al permitir a las organizaciones tercerizar sus planes y soluciones de recuperación de desastres, lo que se conoce como recuperación de desastres como servicio (DRaaS).

Otra tendencia actual que enfatiza la importancia de un plan detallado de recuperación de desastres es la creciente sofisticación de los ataques cibernéticos. Estadísticas de la industria muestran que muchos ataques no se detectan hasta más de 200 días después de que ocurren. Con tanto tiempo escondidos en una red, los atacantes pueden plantar malware que encuentra los conjuntos de copias de seguridad y puede infectar incluso los datos de recuperación. Los ataques pueden permanecer inactivos durante semanas o meses, lo que permite que el malware se propague por todo el sistema. Incluso después de que se detecta un ataque, puede ser extremadamente difícil eliminar el malware tan extendido en toda una organización.

Cada segundo cuenta: Recuperación rápida para entrega de paquetes

La interrupción del negocio debido a un ataque cibernético puede tener un impacto devastador para las empresas. Por ejemplo, la disrupción cibernética en una empresa de entrega de paquetería puede interrumpir las operaciones en toda su cadena de suministro, lo que lleva a una pérdida financiera y daño a su reputación. Y en el mundo digital de hoy en día, cada segundo de esa interrupción cuenta.


¿Por qué un plan de DR es importante?

La gran necesidad de obtener experiencias del cliente y resultados empresariales superiores está impulsando la tendencia creciente de empresas que adoptan la multinube híbrida. Sin embargo, la multinube híbrida crea complejidad de infraestructura y posibles riesgos que requieren habilidades y herramientas especializadas para gestionarlos. Como resultado de esta complejidad, las organizaciones están sufriendo interrupciones frecuentes y fallos del sistema, junto con ataques cibernéticos, falta de habilidades y falta de suministro. El impacto empresarial de las interrupciones o el tiempo de inactividad no planificado es extremadamente alto, más aún en un entorno de multinube híbrida. Tener resiliencia en una multinube híbrida requiere un plan de recuperación de desastres que incluya habilidades especializadas, estrategias integradas y tecnologías avanzadas, incluida la orquestación de protección y recuperación de datos. Las empresas deben tener una resiliencia completa y contar con tecnología de orquestación para ayudar a reducir los riesgos de continuidad del negocio en la multinube híbrida y así lograr sus objetivos de transformación digital.

Otras razones relevantes por las que una empresa debería implementar un plan detallado y comprobado de recuperación de desastres incluyen:

  • Minimizar las interrupciones de las operaciones normales.
  • Limitar el alcance de las interrupciones y los daños.
  • Minimizar el impacto económico de las interrupciones.
  • Establecer con antelación medios alternativos de operación.
  • Capacitar al personal con procedimientos de emergencia.
  • Proporcionar una restauración del servicio rápida y exenta de problemas.

Para satisfacer las expectativas actuales de las operaciones empresariales continuas, las organizaciones deben poder restaurar los sistemas importantes en cuestión de minutos, si no en segundos luego de una interrupción.


¿Cómo utilizan las empresas un plan de recuperación de desastres (DR)?

Muchas organizaciones se esfuerzan por desarrollar sus estrategias de plan de recuperación de desastres lo suficientemente rápido como para abordar los entornos de TI híbridos actuales y las complejas operaciones empresariales. En un mundo disponible 24/7, una empresa puede obtener una ventaja competitiva, o perder participación en el mercado, dependiendo de la rapidez con la que pueda recuperarse de un desastre y restaurar los servicios empresariales básicos.

Algunas empresas utilizan servicios de consultoría de recuperación de desastres y continuidad del negocio para abordar sus necesidades de realizar evaluaciones, planificación y diseño, implementación, pruebas y gestión completa de programas de resiliencia.

Hay servicios proactivos, como IBM IT Infrastructure Recovery Services, para ayudar a las empresas a superar las interrupciones con soluciones de DR flexibles y rentables.

Con el aumento de los ataques cibernéticos, las empresas están evolucionando de un enfoque de recuperación tradicional/manual a un enfoque de resiliencia automatizado y definido por software. El enfoque IBM Cyber Resilience Services utiliza tecnologías avanzadas y mejores prácticas para ayudar a evaluar los riesgos, priorizar y proteger aplicaciones y datos empresariales importantes. Estas soluciones de DR pueden ayudar a las organizaciones a recuperarse rápidamente durante y después de un ciberataque.

Otras empresas recurren a servicios de copia de seguridad basados en la nube, como IBM Disaster Recovery as a Service (DRaaS) de IBM para obtener replicación continua de aplicaciones, infraestructura, datos y sistemas importantes para una rápida Recuperación tras una interrupción de TI. También hay opciones de servidores virtuales, como IBM Cloud Virtualized Server Recovery para proteger los servidores esenciales en tiempo real. Esto permite una rápida recuperación de sus aplicaciones en un IBM Resiliency Center para mantener las empresas operativas durante periodos de mantenimiento o un tiempo de inactividad inesperado.

Para un gran número de empresas, la solución es la orquestación de resiliencia, un enfoque basado en la nube que utiliza la automatización de recuperación de desastres y un conjunto de herramientas de gestión de continuidad diseñadas específicamente para entornos de TI híbridos. Por ejemplo, IBM Resiliency Orchestration ayuda a proteger las dependencias de procesos empresariales en aplicaciones, datos y componentes de infraestructura. Aumenta la disponibilidad de las aplicaciones empresariales para que las empresas puedan acceder a la inteligencia de alto nivel o en profundidad en relación con el objetivo de punto de recuperación (RPO), objetivo de tiempo de recuperación (RTO) y el rendimiento general de la continuidad de TI desde un panel de control centralizado.

En el mundo actual, su empresa no puede permitirse tiempo de inactividad, ya que puede resultar en pérdida de ingresos, daño a la reputación y sanciones regulatorias. Descubra cómo IBM Cloud Resiliency Orchestration puede ayudarle a transformar su gestión de recuperación de TI a través de la automatización para simplificar el proceso de recuperación de desastres, aumentar la eficiencia del flujo de trabajo y reducir riesgos, costos y tiempo de pruebas de sistemas.


¿Cómo se usa un plan de recuperación de desastres (DR) en la industria?

Hyundai Heavy Industries (HHI) se enfrentó a esa dura realidad cuando en el 2016 ocurrió un terremoto de magnitud 5.8. Debido a que el centro de copia de seguridad de la compañía se ubicaba cerca de la sede en la ciudad de Ulsan, en Corea, el terremoto sirvió como una llamada de atención para que HHI examinara sus sistemas de recuperación de desastres y determinara la preparación para una amplia gama de posibles interrupciones.

En el 2016, un terremoto mostró la gran probabilidad de que un desastre natural podría dañar la infraestructura de TI esencial de Hyundai. El equipo de TI respondió rápidamente y trabajó con IBM Business Resiliency Services para implementar una sólida solución de recuperación de desastres con un centro de datos remoto.


¿Cuáles son los pasos clave de un plan de recuperación de desastres (DR)?

El objetivo de un plan de recuperación de desastres es garantizar que una empresa pueda responder a un desastre u otra emergencia que afecte a los sistemas de información y minimizar el efecto en las operaciones empresariales. IBM ha creado una plantilla para diseñar un plan básico de recuperación de desastres. A continuación se muestran los pasos sugeridos. Una vez que haya preparado la información, se recomienda que almacene el documento en un lugar seguro y al que pueda acceder de forma remota.

Paso 1: Objetivos principales Delinear de forma general los objetivos principales de un plan de recuperación de desastres.

Paso 2: Personal Registrar el personal que procesa los datos. Incluir una copia del organigrama con el plan.

Paso 3: Perfil de la aplicación Hacer una lista de las aplicaciones y si son importantes y un activo fijo.

Paso 4: Perfil del inventario Registrar el fabricante, el modelo, el número de serie, el costo y si cada artículo es alquilado o propio.

Paso 5: Procedimientos de copia de seguridad Incluir información como: "Los receptores de registros se cambian en ________ y en ________". Y: "Los objetos cambiados en las siguientes bibliotecas y directorios se guardan en ____".

Paso 6: Procedimientos de recuperación de desastres Cualquier plan de DR debe abordar estos tres elementos:

  • Procedimientos de respuesta a emergencias para documentar la respuesta a emergencias adecuada para un incendio, desastre natural o cualquier otro evento con el fin de proteger vidas y limitar los daños.
  • Procedimientos de operaciones de copia de seguridad para garantizar que las tareas operacionales esenciales de procesamiento de datos se pueden realizar después de una interrupción.
  • Procedimientos de recuperación para facilitar la rápida restauración de un sistema de procesamiento de datos después de un desastre.

Paso 7: Plan de DR para el sitio móvil El plan debe incluir un plan de configuración del sitio móvil, un plan de desastre de comunicación (incluidos los diagramas del cableado) y un diagrama del servicio eléctrico.

Paso 8: Plan de DR para sitio duplicado de respaldo Un plan de sitio duplicado debe proporcionar un sitio alternativo (copia de seguridad). El sitio alternativo tiene un sistema de copia de seguridad para uso temporal mientras que el sitio principal se reestablece.

Paso 9: Restauración de todo el sistema Para que el sistema vuelva a la forma en que estaba antes del desastre, se deben utilizar los procedimientos de recuperación después de una pérdida completa del sistema en Administración de sistemas: Copia de seguridad y recuperación.

Paso 10: Proceso de reconstrucción El equipo de gestión debe evaluar los daños y comenzar la reconstrucción de un nuevo centro de datos.

Paso 11: Prueba del plan de recuperación de desastres y recuperación cibernética Para un plan de contingencia exitoso, es importante probar y evaluar el plan de DR regularmente. Las operaciones de procesamiento de datos son volátiles, lo que resulta en cambios frecuentes en el equipo, los programas y la documentación. Estas acciones hacen que sea vital considerar el plan como un documento en constante cambio.

Paso 12: Reconstrucción del sitio del desastre Este paso debe incluir un plano del centro de datos, las necesidades de hardware actuales y posibles alternativas, además de la superficie cuadrada del centro de datos, los requerimientos de energía y los requisitos de seguridad.

Paso 13: Registro de cambios en el plan Mantenga su plan de DR actualizado. Registre los cambios en la configuración, las aplicaciones y las planificaciones y procedimientos de copia de seguridad.