¿Qué es la recuperación ante desastres (DR)?

Una captura de un empresario que usa un ordenador en su escritorio en una oficina moderna

Autores

Stephanie Susnjara

Staff Writer

IBM Think

Ian Smalley

Staff Editor

IBM Think

¿Qué es la recuperación ante desastres (DR)?

La recuperación ante desastres (DR) es un marco que consiste en tecnología de TI y buenas prácticas diseñadas para prevenir o minimizar la pérdida de datos y las interrupciones del negocio derivadas de eventos catastróficos.

Abarca desde fallos de equipos y cortes de luz locales hasta ataques criminales o militares, ciberataques y desastres naturales.

Muchas empresas, especialmente las pequeñas y medianas organizaciones, descuidan el desarrollo de un plan de recuperación ante desastres (DRP) fiable y práctico plan de recuperación ante desastres (DRP). Sin un plan de este tipo, tienen poca protección contra el impacto de los grandes eventos disruptivos.

El coste del tiempo de inactividad no planificado hace que la protección contra la pérdida de datos sea esencial. Según una investigación de Splunk y Oxford Economics, el coste medio del tiempo de inactividad puede llegar a costar hasta 9000 USD por minuto (o 540 000 USD por hora) para las organizaciones empresariales. Para las instituciones financieras y de atención sanitaria de alto riesgo que manejan datos confidenciales, el tiempo de inactividad puede suponer costes superiores a cinco millones de dólares por hora1. La planificación de la recuperación ante desastres puede mitigar significativamente estos riesgos.

La recuperación ante desastres implica elaborar estrategias, planificar, implementar la tecnología adecuada e implementar pruebas continuas. Si bien las copias de seguridad de los datos son un componente crítico, un proceso de copia de seguridad y recuperación por sí solo no constituye un plan integral de recuperación ante desastres.

La recuperación ante desastres también implica garantizar que se dispone de almacenamiento y computación adecuados para mantener unos procedimientos sólidos de conmutación por error y recuperación. La conmutación por error es el proceso de descargar cargas de trabajo a copias de seguridad para que los procesos de producción y las experiencias del usuario final se vean interrumpidas lo menos posible. La conmutación por recuperación implica volver a los sistemas primarios originales.

Las últimas novedades sobre tecnología, respaldadas por conocimientos de expertos

Manténgase al día sobre las tendencias más importantes e intrigantes del sector en materia de IA, automatización, datos y mucho más con el boletín Think. Consulte la Declaración de privacidad de IBM.

¡Gracias! Se ha suscrito.

Su suscripción se enviará en inglés. Encontrará un enlace para darse de baja en cada boletín. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

¿Qué es la continuidad del negocio y la recuperación ante desastres?

La recuperación ante desastres para la continuidad del negocio (BCDR) es un proceso que ayuda a su organización a reanudar las operaciones comerciales normales cuando ocurre un desastre. La continuidad del negocio y la recuperación ante desastres presentan muchas similitudes, pero son dos enfoques distintos.

Aunque a veces se hace referencia al BCDR como gestión de emergencias en las empresas, difiere significativamente de los programas gubernamentales como la Agencia Federal para el Manejo de Emergencias (FEMA). Estos programas se centran en emergencias civiles y proporcionan seguridad pública y asistencia en caso de desastre a toda la comunidad, en lugar de TI y operaciones organizativas.

Mixture of Experts | 12 de diciembre, episodio 85

Descifrar la IA: resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el bullicio de la IA para ofrecerle las últimas noticias y conocimientos al respecto.

Planificación de continuidad del negocio vs. planificación de recuperación ante desastres 

La planificación de la continuidad del negocio (BCP) consiste en sistemas y procesos que garantizan que todas las áreas de una empresa puedan mantener las operaciones esenciales o reanudarlas rápidamente en caso de crisis o emergencia.

La planificación de la recuperación ante desastres es un subconjunto de la planificación de la continuidad del negocio que se centra en la recuperación de la infraestructura de TI y los sistemas. Implica un plan de recuperación ante desastres (DRP) que traza los pasos de recuperación de un evento inesperado. Las empresas dependen de los DRP para gestionar diversas situaciones de desastre (por ejemplo, desastres naturales, ransomware, ataques de malware).

Siete pasos clave en la planificación de la recuperación ante desastres

Los siguientes siete pasos son fundamentales para una planificación eficaz de la recuperación ante desastres:

  1. Realizar un análisis de impacto empresarial (BIA)
  2. Analizar el riesgo
  3. Priorizar aplicaciones
  4. Dependencias de documentos
  5. Establecer objetivos de RTO, RPO y RCO
  6. Factor en cuestiones de cumplimiento normativo
  7. Implementar pruebas y revisiones continuas

1. Realizar un análisis de impacto empresarial (BIA)

La creación de un plan integral de recuperación ante desastres comienza con un análisis de impacto empresarial (BIA). Al realizar este análisis, creará una serie de escenarios detallados de desastres. Estos escenarios pueden usarse para predecir el tamaño y el alcance de las pérdidas que sufriría en caso de que ciertos procesos empresariales se vieran interrumpidos. Por ejemplo, ¿qué ocurre si un incendio destruye su call center de servicio de atención al cliente? ¿O un terremoto ha sacudido su sede?

Este análisis le permite identificar las funciones empresariales más críticas y determinar cuánto tiempo de inactividad puede tolerar cada una de ellas. Con esta información en mano, puede comenzar a crear un plan para mantener las operaciones más críticas en diversos escenarios.

La planificación de la recuperación ante desastres de TI debe basarse en la planificación de la continuidad del negocio y apoyarla. ¿Y si, por ejemplo, su plan de continuidad del negocio exige que los representantes del servicio de atención al cliente trabajen desde casa tras un incendio en un call center? ¿Qué tipos de recursos de hardware, software y TI tendrían que estar disponibles para respaldar ese plan?

2. Analizar el riesgo

Evaluar la probabilidad y las posibles consecuencias de los riesgos que enfrenta su empresa es un componente crucial de una estrategia de recuperación ante desastres. A medida que los ciberataques y el ransomware son cada vez más frecuentes, es crítico comprender los riesgos generales de ciberseguridad a los que se enfrentan hoy en día todas las empresas. Además, es importante comprender los riesgos específicos de su sector y ubicación geográfica.

Para diversos escenarios, incluyendo desastres naturales, fallos de equipos, amenazas internas, sabotaje y errores de empleados, es importante evaluar sus riesgos y considerar el impacto global en su negocio.

Hágase las siguientes preguntas: 

  • ¿Qué pérdidas financieras sufrirías por oportunidades de venta perdidas o interrupciones en actividades generadoras de ingresos?
  • ¿Qué tipo de daños sufriría la reputación de su marca? ¿Cómo se vería afectada la satisfacción del cliente?
  • ¿Cómo se vería afectada la productividad de los empleados? ¿Cuántas horas de trabajo podrían perderse?
  • ¿Qué riesgos podría plantear el incidente para la salud o la seguridad humanas?
  • ¿Se vería afectado el progreso hacia alguna iniciativa u objetivo empresarial? ¿Cómo?

3. Priorizar las aplicaciones

No todas las cargas de trabajo son igualmente críticas para la capacidad de su empresa de mantener las operaciones, y el tiempo de inactividad es mucho más tolerable para algunas aplicaciones que para otras.

Separe sus sistemas y aplicaciones de TI en tres niveles, en función del tiempo que pueda permitirse tenerlos inactivos y de la gravedad de las consecuencias de la pérdida de datos:

  1. De misión crítica: aplicaciones cuyo funcionamiento es esencial para la supervivencia de su empresa.
  2. Importante: aplicaciones para las que podría tolerar tiempo de inactividad relativamente corto.
  3. No esenciales: aplicaciones que podría reemplazar temporalmente con procesos manuales o prescindir de ellas.

4. Documentar dependencias

El siguiente paso en la planificación de la recuperación ante desastres es crear un inventario completo de sus activos de hardware y software. Es esencial comprender las interdependencias críticas de aplicación en esta etapa. Si una aplicación de software deja de funcionar, ¿cuáles más se verán afectadas?

Diseñar modelos de resiliencia de datos y recuperación ante desastres en los sistemas cuando se crean inicialmente es la mejor manera de gestionar las interdependencias de las aplicaciones. En las arquitecturas actuales basadas en microservicios, es muy habitual encontrar procesos que no se pueden iniciar cuando otros sistemas o procesos están inactivos, y viceversa.

Es difícil recuperarse de esta situación. También es vital descubrir estos problemas cuando tenga tiempo de desarrollar planes alternativos para sus sistemas y procesos, antes de que se produzca un desastre real.

5. Establecer objetivos de RTO, RPO y RCO

Al considerar sus análisis de riesgo e impacto empresarial, debería poder establecer múltiples objetivos. Estos objetivos incluyen el tiempo que tardarían los sistemas en volver a estar en línea, la cantidad de datos que puede permitirse perder y la cantidad de daños o desviaciones de datos que puede tolerar.

  • Su objetivo de tiempo de recuperación (RTO) es el tiempo máximo que debería tardar en restaurar el funcionamiento de una aplicación o sistema tras una interrupción del servicio.
  • Su objetivo de punto de recuperación (RPO) es la antigüedad máxima de los datos que deben recuperarse para que su empresa reanude sus operaciones habituales. Para algunas empresas, perder incluso unos minutos de datos puede ser catastrófico, mientras que otras en otros sectores pueden tolerar ventanas más largas.
  • Su objetivo de coherencia de recuperación (RCO) es una métrica utilizada en los servicios de protección de datos. Esta métrica indica el número de entradas inconsistentes en los datos empresariales de los procesos o sistemas recuperados que se toleran en situaciones de recuperación ante desastres. Describe la integridad de los datos empresariales en entornos de aplicación complejos.

6. Tener en cuenta las cuestiones de cumplimiento de la normativa

Todo el software y las soluciones de recuperación ante desastres que haya establecido su empresa deben satisfacer todos los requisitos de seguridad y protección de datos a los que esté obligado. Esto significa que todos los sistemas de copia de seguridad de datos y conmutación por error deben diseñarse para cumplir con los mismos estándares para garantizar la confidencialidad e integridad de los datos que sus sistemas principales.

Al mismo tiempo, varias normas reguladoras estipulan que todas las empresas deben mantener planes de recuperación ante desastres y continuidad del negocio. La Ley Sarbanes-Oxley (SOX), por ejemplo, exige que todas las empresas públicas de EE. UU. mantengan copias de todos los registros comerciales durante un mínimo de cinco años.

El incumplimiento de esta normativa (incluyendo el descuido de establecer y probar sistemas de data backup adecuados) puede conllevar importantes sanciones económicas para las empresas, incluso penas de cárcel para sus líderes.

7. Implementar pruebas y revisiones continuas

En pocas palabras, si su plan de recuperación ante desastres no se ha probado, no se puede confiar en él. Todos los empleados con responsabilidades relevantes deben participar en el ejercicio de prueba de recuperación ante desastres, que puede implicar el mantenimiento de las operaciones desde el sitio de conmutación por error durante un período específico.

Si realizar pruebas exhaustivas de recuperación ante desastres está fuera de su presupuesto o capacidades, también puede programar un simulacro de los procedimientos de prueba. Sin embargo, es menos probable que este tipo de pruebas revelen anomalías o puntos débiles en los procedimientos de DR (especialmente la presencia de interdependencias de aplicaciones no descubiertas anteriormente) que una prueba completa.

A medida que sus activos de hardware y software cambian con el tiempo, debe asegurarse de que su plan de recuperación ante desastres se actualice adecuadamente. Por ello, es importante revisar y modificar periódicamente el plan de forma continua.

 Haga clic aquí para ver un ejemplo de un plan de recuperación ante desastres.

Beneficios de la recuperación ante desastres

La recuperación ante desastres ofrece beneficios esenciales, incluyendo:

  • Continuidad del negocio: ayuda a las empresas a reanudar sus operaciones normales tras un acontecimiento imprevisto.

  • Alta disponibilidad (HA): garantiza una alta disponibilidad al habilitar una conmutación por error automatizada o rápida a un sistema redundante cuando falla el sistema principal.

  • Reducción del tiempo de inactividad: restaura los sistemas y aplicaciones esenciales, proporcionando una interrupción mínima.

  • Ahorro de costes: reduce las pérdidas financieras asociadas al tiempo de inactividad y a la pérdida de datos.

  • Mayor seguridad de los datos y cumplimiento de la normativa: permite a las empresas salvaguardar sus datos y cumplir las leyes de privacidad y las normativas de los sectores.

  • Confianza del cliente reforzada: mantiene la confianza del cliente garantizando una prestación de servicios coherente y manteniendo seguros los datos de los clientes, incluso durante fallos del sistema o desastres.

Tipos de soluciones de recuperación ante desastres

La recuperación ante desastres incluye los siguientes tipos de tecnologías y soluciones:

  • Sitios de recuperación ante desastres
  • Copias de seguridad
  • Replicación basada en instantáneas
  • Cloud DR
  • Recuperación ante desastres como servicio (DRaaS)

Sitios de recuperación ante desastres

Crear su propio centro de datos de recuperación ante desastres implica lograr un equilibrio entre varios objetivos que compiten entre sí.

Sin embargo, debe almacenarse una copia de sus datos en algún lugar que esté lo suficientemente lejos geográficamente de sus oficinas centrales u oficinas. De esta manera, los mismos eventos sísmicos, amenazas ambientales u otros peligros que afectan a su sitio principal no pueden destruir permanentemente sus datos.

Al mismo tiempo, las copias de seguridad almacenadas fuera del sitio tardan más en restaurarse en comparación con las ubicadas en las instalaciones del sitio principal. Además, la latencia de la red puede ser aún mayor a distancias más largas.

 

Copias de seguridad

Las copias de seguridad y la restauración son la base sobre la que se construye cualquier plan sólido de recuperación ante desastres.

  • Tape y discos primitivos: en el pasado, la mayoría de las empresas utilizaban cintas y discos giratorios (por ejemplo, unidades de disco duro (HDD) para realizar copias de seguridad. Mantenían varias copias de sus datos y almacenaban al menos una en una ubicación externa.
  • Copias de seguridad modernas basadas en disco: a medida que las organizaciones se alejaron de la cinta, los sistemas basados en disco se convirtieron en el estándar para el almacenamiento de copias de seguridad, ofreciendo capacidades más rápidas. Las soluciones modernas basadas en discos utilizan unidades de disco duro o unidades de estado sólido (SSD) en configuraciones de almacenamiento local, NAS o SAN. Este cambio redujo drásticamente los tiempos de recuperación en comparación con los sistemas basados en cintas.

Replicación basada en instantáneas

Una copia de seguridad instantánea de una base de datos captura el estado actual de una aplicación o disco en un momento determinado. Al escribir solo los datos modificados desde la última instantánea, este método puede ayudar a proteger los datos y conservar el espacio de almacenamiento.

Las instantáneas pueden replicarse en otras ubicaciones o almacenarse en la nube para fines de recuperación ante desastres.

Cloud DR (recuperación ante desastres en la nube)

Cloud DR utiliza infraestructura y servicios basados en la nube para realizar copias de seguridad y recuperar datos y aplicaciones, eliminando la necesidad de mantener centros de datos secundarios físicos.

Le permite proteger los datos de las aplicaciones y toda la infraestructura de servidores, incluidas las máquinas físicas o máquinas virtuales (VM) que utilicen la configuración de nube pública o de proveedor de servicios dedicado. Puede configurar los calendarios de las copias de seguridad en función de sus necesidades específicas.

Las soluciones de copia de seguridad en la nube también pueden integrarse con plataformas de virtualización como VMware o soluciones de copia de seguridad nativas de la nube. Estos enfoques ofrecen una escalabilidad flexible y una optimización de los costes a medida que evolucionan sus demandas de almacenamiento y apoyan a las organizaciones que se encuentran en proceso de migración a la nube

Recuperación ante desastres como servicio (DRaaS)

La recuperación ante desastres como servicio (DRaaS) es una solución de terceros basada en la nube que proporciona protección de datos y capacidades de recuperación ante desastres bajo demanda y de pago por uso.

DRaaS es una de las ofertas de servicios de TI gestionados más populares y de rápido crecimiento disponibles en la actualidad. Un estudio del sector de 2023 proyectó que el mercado de DRaaS crecería de 10 700 millones de dólares a 26 500 millones de dólares en 2028 a una tasa de crecimiento anual compuesta2.

Con DRaaS, su proveedor de servicios documenta los RTO y RPO en un acuerdo de nivel de servicio (SLA) que describe sus límites de tiempo de inactividad y las expectativas de recuperación de aplicaciones.

Las ofertas de DRaaS también suelen incluir operaciones de recuperación de aplicaciones basadas en la nube. Este enfoque supone un importante ahorro de costes en comparación con el mantenimiento de recursos de hardware dedicados redundantes en su propio centro de datos. Existen contratos en los que se paga una cuota por mantener las capacidades de recuperación ante fallos, además de los costes por uso de los recursos consumidos en una situación de recuperación ante desastres. De este modo, su proveedor normalmente asume toda la responsabilidad de configurar y mantener el entorno de conmutación por error.

DRaaS vs. DR

Si ya ha elaborado una solución de recuperación ante desastres on-premises, puede ser difícil evaluar los costes y los beneficios de mantenerla frente a la transición a una suscripción mensual de DRaaS.

La mayoría de las soluciones de DR en las instalaciones incurren en costes de hardware, energía, mano de obra para mantenimiento y administración, software y conectividad de red. Además de los gastos de capital iniciales que implica la configuración inicial de su entorno de DR, tiene que presupuestar las actualizaciones de software periódicas.

Como su solución de DR debe seguir siendo compatible con su entorno de producción principal, debes asegurarse de que su solución de DR tenga las mismas versiones de software. Dependiendo de los detalles de su acuerdo de licencia, podría duplicar efectivamente sus costes de software.

Si está pensando en soluciones de DRaaS de terceros, asegúrese de que el proveedor tiene la capacidad de realizar copias de seguridad interregionales y en varios sitios. Si un fenómeno meteorológico significativo (por ejemplo, un huracán) afectara a la ubicación de su oficina principal, ¿estaría el sitio de conmutación por error lo suficientemente lejos como para no verse afectado por la tormenta?

Si muchos de los clientes de su proveedor en su área se vieran afectados simultáneamente, ¿tendría su proveedor capacidad suficiente para satisfacer sus necesidades combinadas? Está confiando en que su proveedor de DRaaS cumplirá con los RTO y los RPO en tiempos de crisis, así que busque un proveedor de servicios con una sólida reputación de fiabilidad.

Para obtener una visión comparativa de ambas soluciones, consulte: "Disaster recovery as a service (DRaaS) versus disaster recovery (DR): Which do you need?

Recuperación ante desastres e IA

La integración de la inteligencia artificial (IA) está transformando la recuperación ante desastres con características que mejoran la detección de amenazas, automatizan la respuesta a incidentes y agilizan la gestión en entornos híbridos y multinube.

En el informe "Cost of a Data Breach" de 2025 de IBM, los costes globales medios disminuyeron de 4,88 millones de dólares a 4,44 millones de dólares, lo que representa una disminución del 9 %. Según el informe, las organizaciones pudieron identificar y contener una vulneración en un tiempo medio de 241 días, el más bajo en nueve años.

La IA en la recuperación ante desastres ofrece los siguientes beneficios clave:

  • Análisis predictivo: los modelos de IA analizan los datos históricos para predecir posibles fallos o violaciones de seguridad antes de que se produzcan. Este proceso permite el análisis predictivo y apoya la mitigación de riesgos.
  • Monitorización en tiempo real: los algoritmos del sistema de machine learning (ML) ayudan a monitorizar el estado de la infraestructura en tiempo real. Las alertas ayudan a los equipos a detectar anomalías y evitar tiempos de inactividad o pérdidas de datos.
  • Respuestas automatizadas: la automatización impulsada por IA puede ofrecer procedimientos de recuperación más rápidos que la intervención humana, reduciendo significativamente el RTO y el RPO.
  • Asistencia de IA generativa: los modelos de lenguaje de gran tamaño (LLM) mejoran los flujo de trabajo de DR al analizar los registros para analizar la causa raíz, generar automáticamente la documentación de los incidentes y proporcionar interfaces de conversación para facilitar una recuperación rápida. Este proceso ayuda a los equipos a traducir los datos en pasos que se puede ejecutar
Soluciones relacionadas
IBM Storage Defender

Proteja sus datos de las amenazas cambiantes, independientemente de dónde estén almacenados, con copias de seguridad, detección de amenazas basada en IA y una rápida recuperación.

Explore Storage Defender
Recuperación y copia de seguridad de datos de almacenamiento

Acelere los procesos empresariales de copia de seguridad y recuperación para ayudar a recuperar datos y servicios de TI rápidamente para cargas de trabajo en las instalaciones y en la nube. 

Explore las soluciones de copia de seguridad y recuperación
Soluciones de recuperación ante desastres en la nube

Proteja sus datos con un plan de recuperación ante desastres en la nube y reduzca el riesgo de tiempo de inactividad.

Explore la recuperación ante desastres en la nube
Dé el siguiente paso

Proteja sus datos y disponga de sus cargas de trabajo con una detección temprana de amenazas, capas de protección y una rápida recuperación. Descubra cómo IBM Storage Defender puede ayudarle a proteger su cadena de suministro de información.

Explore Storage Defender Solicite una demostración en directo
Notas a pie de página