¿Qué es la recuperación ante desastres (DR)?

Una captura de un empresario que usa una computadora en su escritorio en una oficina moderna

Autores

Stephanie Susnjara

Staff Writer

IBM Think

Ian Smalley

Staff Editor

IBM Think

¿Qué es la recuperación ante desastres (DR)?

La recuperación ante desastres (DR) es un marco que consiste en tecnologías de TI y mejores prácticas diseñadas para prevenir o minimizar la pérdida de datos y las interrupciones del negocio derivadas de eventos catastróficos.

Abarca todo, desde fallas de equipamiento y cortes de energía locales hasta ataques criminales o militares, ciberataques y desastres naturales.

Muchas empresas, especialmente las pequeñas y medianas, descuidan el desarrollo de un plan de recuperación ante desastres (DRP) confiable y práctico. Sin un plan de este tipo, tienen poca protección contra el impacto de grandes eventos disruptivos.

El costo del tiempo de inactividad no planificado hace que la protección contra la pérdida de datos sea esencial. Según una investigación de Splunk y Oxford Economics, el costo promedio del tiempo de inactividad puede costar hasta 9000 USD por minuto (o 540 000 USD por hora) para las organizaciones empresariales. Para las instituciones financieras y de atención médica de alto riesgo que manejan datos confidenciales, el tiempo de inactividad puede resultar en costos superiores a 5 millones de dólares por hora.1 La planificación de recuperación ante desastres puede mitigar significativamente estos riesgos.

La recuperación ante desastres implica la elaboración de estrategias, la planificación, el despliegue de tecnología adecuada y la implementación de pruebas continuas. Si bien las copias de seguridad de los datos son un componente crítico, un proceso de copia de seguridad y recuperación por sí solo no constituye un plan integral de recuperación ante desastres.

La recuperación ante desastres también implica garantizar que se disponga de almacenamiento y computación adecuados para mantener procedimientos sólidos de conmutación por error y conmutación por recuperación. La conmutación por error es el proceso de descargar cargas de trabajo a sistemas de respaldo para que los procesos de producción y las experiencias del usuario final se vean lo menos interrumpidos posible. La conmutación por recuperación implica volver a los sistemas primarios originales.

Las últimas noticias tecnológicas, respaldadas por los insights de expertos

Manténgase al día sobre las tendencias más importantes e intrigantes de la industria sobre IA, automatización, datos y más con el boletín Think. Consulte la Declaración de privacidad de IBM.

¡Gracias! Ya está suscrito.

Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.

¿Qué es la recuperación ante desastres para la continuidad del negocio (BCDR)?

La recuperación ante desastres para la continuidad de negocio (BCDR) es un proceso que ayuda a su organización a reanudar las operaciones comerciales normales cuando ocurre un desastre. La continuidad de negocio y la recuperación ante desastres tienen muchas similitudes, pero son dos enfoques distintos.

Si bien la BCDR a veces se denomina gestión de emergencias en las empresas, difiere significativamente de los programas de gobierno como la Federal Emergency Management Agency (FEMA). Estos programas se centran en emergencias civiles y brindan seguridad pública y asistencia en casos de desastre a toda la comunidad, en lugar de TI y operaciones organizacionales.

Mixture of Experts | 12 de diciembre, episodio 85

Decodificación de la IA: Resumen semanal de noticias

Únase a nuestro panel de ingenieros, investigadores, responsables de producto y otros profesionales de talla mundial que se abren paso entre el revuelo de la IA para ofrecerle las últimas noticias e insights al respecto.

Planificación de la continuidad de negocio frente a la planificación de recuperación ante desastres 

La planificación de la continuidad de negocio (BCP) consiste en sistemas y procesos que garantizan que todas las áreas de una empresa puedan mantener las operaciones esenciales o reanudarlas rápidamente en caso de crisis o emergencia.

La planificación de la recuperación ante desastres es un subconjunto de la planificación de la continuidad de negocio que se centra en la recuperación de la infraestructura y los sistemas de TI. Implica un plan de recuperación ante desastres (DRP) que traza los pasos de recuperación de un evento inesperado. Las empresas dependen de los DRP para gestionar diversas situaciones de desastre (por ejemplo, desastres naturales, ransomware, ataques de malware).

Siete pasos clave en la planificación de recuperación ante desastres

Los siguientes siete pasos son fundamentales para una planeación eficaz de la recuperación ante desastres:

  1. Realizar un análisis de impacto empresarial (BIA)
  2. Analizar el riesgo
  3. Priorizar las aplicaciones
  4. Documentar las dependencias
  5. Establecer objetivos de RTO, RPO y RCO
  6. Tener en cuenta los problemas de cumplimiento normativo
  7. Implementar pruebas y comentarios continuos

1. Realizar un análisis de impacto en el negocio (BIA)

La creación de un plan integral de recuperación ante desastres comienza con un análisis de impacto empresarial (BIA). Al realizar este análisis, va a crear una serie de escenarios de desastre detallados. Estos escenarios se pueden utilizar para predecir el tamaño y el alcance de las pérdidas en las que incurriría en caso de que se interrumpieran determinados procesos empresariales. Por ejemplo, ¿qué sucede si un incendio destruye su centro de atención telefónica? ¿O si un terremoto afectara a su sede central?

Este análisis le permite identificar las funciones empresariales críticas y determinar cuánto tiempo de inactividad puede tolerar cada una de ellas. Con esta información a mano, puede comenzar a crear un plan para mantener las operaciones críticas en varios escenarios.

La planificación de recuperación ante desastres de TI debe basarse en la planificación de continuidad de negocio y apoyarla. ¿Qué sucede si, por ejemplo, su plan de continuidad de negocio requiere que los representantes de atención al cliente trabajen desde casa después de un incendio en el centro de atención telefónica? ¿Qué tipos de hardware, software y recursos de TI deberían estar disponibles para respaldar ese plan?

2. Analizar el riesgo

Evaluar la probabilidad y las posibles consecuencias de los riesgos que enfrenta su empresa es un componente crucial de una estrategia de recuperación ante desastres. A medida que los ciberataques y el ransomware se vuelven más frecuentes, es crítico comprender los riesgos generales de ciberseguridad que enfrentan todas las empresas hoy en día. Además, es importante comprender los riesgos específicos de su industria y ubicación geográfica.

Para diversos escenarios, incluyendo desastres naturales, fallas de equipamiento, amenazas de usuarios internos, sabotaje y errores de empleados, es importante evaluar sus riesgos y considerar el impacto global en su negocio.

Hágase las siguientes preguntas: 

  • ¿Qué pérdidas financieras sufriría debido a la pérdida de oportunidades de venta o a la interrupción de las actividades generadoras de ingresos?
  • ¿Qué tipo de daño sufriría la reputación de su marca? ¿Cómo se vería afectada la satisfacción del cliente?
  • ¿Cómo se vería afectada la productividad de los empleados? ¿Cuántas horas de trabajo podrían perderse?
  • ¿Qué riesgos podría plantear el incidente para el estado o la seguridad humanas?
  • ¿Se vería afectado el progreso hacia alguna iniciativa u objetivo empresarial? ¿Cómo?

3. Priorizar las aplicaciones

No todas las cargas de trabajo son igualmente críticas para la capacidad de su empresa para mantener las operaciones, y el tiempo de inactividad es mucho más tolerable para algunas aplicaciones que para otras.

Separe sus sistemas y aplicaciones de TI en tres niveles, en función del tiempo que pueda permitirse tenerlos inactivos y la gravedad de las consecuencias de la pérdida de datos:

  1. De misión crítica: aplicaciones cuyo funcionamiento es esencial para la supervivencia de su empresa.
  2. Importantes: Aplicaciones para las que podría tolerar un tiempo de inactividad relativamente corto.
  3. No esenciales: aplicaciones que podría reemplazar temporalmente con procesos manuales o prescindir de ellas.

4. Documentar dependencias

El siguiente paso en la planificación de la recuperación ante desastres es crear un inventario completo de sus activos de hardware y software. Es esencial comprender las interdependencias críticas de aplicación en esta etapa. Si una aplicación de software deja de funcionar, ¿qué otras se verán afectadas?

Diseñar modelos de resiliencia de los datos y recuperación ante desastres en los sistemas cuando se crean inicialmente es la mejor manera de gestionar las interdependencias de la aplicación. Es muy común con las arquitecturas actuales basadas en microservicios descubrir procesos que no se pueden iniciar cuando otros sistemas o procesos están inactivos, y viceversa.

Esta situación es difícil de superar. También es fundamental detectar estos problemas cuando se dispone de tiempo para desarrollar planes alternativos para los sistemas y procesos, antes de que se produzca un desastre real.

5. Establecer objetivos de RTO, RPO y RCO

Al considerar sus análisis de riesgo e impacto empresarial, debería poder establecer múltiples objetivos. Estos objetivos incluyen cuánto tiempo llevaría volver a poner los sistemas en línea, cuántos datos puede permitirse perder y cuánta corrupción o desviación de datos puede tolerar.

  • El objetivo de tiempo de recuperación (RTO) es el tiempo máximo que debe tardarse en restaurar el funcionamiento de una aplicación o un sistema tras una interrupción del servicio.
  • Su objetivo de punto de recuperación (RPO) es la antigüedad máxima de los datos que deben recuperarse para que su empresa reanude las operaciones regulares. Para algunas empresas, perder incluso unos minutos de datos puede ser catastrófico, mientras que otras en otras industrias podrían tolerar ventanas más largas.
  • Su objetivo de coherencia de recuperación (RCO) es una métrica utilizada en los servicios de protección de datos. Esta métrica indica cuántas entradas incoherentes en los datos empresariales de procesos o sistemas recuperados son tolerables en situaciones de recuperación ante desastres. Describe la integridad de los datos empresariales en entornos de aplicaciones complejos.

6. Tener en cuenta los problemas de cumplimiento normativo

Todo el software y las soluciones de recuperación ante desastres que su empresa haya establecido deben satisfacer cualquier requerimiento de seguridad y protección de datos que se le exija cumplir. Significa que todas las copias de seguridad y sistemas de conmutación por error deben estar diseñados para cumplir con los mismos estándares para garantizar la confidencialidad e integridad de los datos que sus sistemas primarios.

Al mismo tiempo, varias normas reguladoras estipulan que todas las empresas deben mantener planes de recuperación ante desastres y de continuidad de negocio. La Ley Sarbanes-Oxley (SOX), por ejemplo, exige que todas las empresas que cotizan en bolsa en Estados Unidos mantengan copias de todos los registros comerciales durante un mínimo de cinco años.

El incumplimiento de esta normativa (incluyendo el descuido de establecer y probar sistemas de copia de seguridad adecuados) puede conllevar importantes resultados económicos para las empresas, incluso penas de cárcel para sus líderes.

7. Implementar pruebas y comentarios continuos

En pocas palabras: si su plan de recuperación ante desastres no ha sido probado, no es confiable. Todos los empleados con responsabilidades relevantes deben participar en el ejercicio de prueba de recuperación ante desastres, que puede implicar mantener las operaciones desde el sitio de conmutación por error durante un período específico.

Si realizar pruebas exhaustivas de recuperación ante desastres está fuera de su presupuesto o capacidades, también puede programar un simulacro de los procedimientos de prueba. Sin embargo, es menos probable que este tipo de pruebas revelen anomalías o debilidades en sus procedimientos de DR, especialmente la presencia de interdependencias de aplicaciones previamente no descubiertas, que una prueba completa.

A medida que sus activos de hardware y software cambian con el tiempo, debe asegurarse de que su plan de recuperación ante desastres se actualice en consecuencia. Por ello, es importante revisar y modificar periódicamente el plan de forma continua.

Haga clic aquí para ver un ejemplo de plan de recuperación ante desastres.

Beneficios de la recuperación ante desastres

La recuperación ante desastres ofrece beneficios esenciales, incluyendo:

  • Continuidad de negocio: ayuda a las empresas a reanudar sus operaciones normales después de un evento imprevisto.

  • Alta disponibilidad (HA): garantiza una alta disponibilidad al habilitar una conmutación por error automatizada o rápida a un sistema redundante cuando falla el sistema principal.

  • Reducción del tiempo de inactividad: restaura los sistemas y aplicaciones esenciales, lo que minimiza las interrupciones.

  • Ahorro de costos: reduce las pérdidas financieras asociadas con el tiempo de inactividad y la pérdida de datos.

  • Mayor seguridad y cumplimiento normativo de los datos: permite a las empresas proteger sus datos y cumplir con las leyes de privacidad y las normativas de las industrias.

  • Fortalecimiento de la confianza del cliente: mantiene la confianza del cliente al garantizar una prestación de servicios constante y mantener seguros los datos del cliente, incluso durante fallas del sistema o desastres.

Tipos de soluciones de recuperación ante desastres

La recuperación ante desastres incluye los siguientes tipos de tecnologías y soluciones:

  • Sitios de recuperación ante desastres
  • Copias de seguridad
  • Replicación basada en instantáneas
  • DR en la nube
  • Recuperación ante desastres como servicio (DRaaS)

Sitios de recuperación ante desastres

Construir su propio centro de datos de recuperación ante desastres implica encontrar un equilibrio entre varios objetivos en competencia.

Sin embargo, una copia de sus datos debe almacenarse en algún lugar que esté lo suficientemente lejos de sus oficinas centrales u oficinas. De esta manera, los mismos eventos sísmicos, amenazas ambientales u otros peligros que afectan su sitio principal no pueden destruir permanentemente sus datos.

Al mismo tiempo, las copias de seguridad almacenadas fuera del sitio tardan más en restaurarse en comparación con las ubicadas on premises en el sitio principal. Además, la latencia de la red puede ser aún mayor a distancias más largas.

 

Copias de seguridad

La copia de seguridad y la restauración sirven como base sobre la cual se construye cualquier plan estable de recuperación ante desastres.

  • Tape y discos antiguos: en el pasado, la mayoría de las empresas utilizaban cintas y discos giratorios (por ejemplo, unidades de disco duro (HDD)) para realizar copias de seguridad. Mantuvieron varias copias de sus datos y almacenaron al menos una en una ubicación externa.
  • Copias de seguridad modernas basadas en disco: a medida que las organizaciones se alejaban de la cinta, los sistemas basados en disco se convirtieron en el estándar para el almacenamiento de respaldo, ofreciendo capacidades más rápidas. Las soluciones modernas basadas en discos utilizan unidades de disco duro o unidades de estado sólido (SSD) en configuraciones de almacenamiento local, NAS o SAN. Este cambio redujo drásticamente los tiempos de recuperación en comparación con los sistemas basados en cintas.

Replicación basada en instantáneas

Una copia de seguridad instantánea de una base de datos captura el estado actual de una aplicación o disco en un momento determinado. Al escribir solo los datos modificados desde la última instantánea, este método puede ayudar a proteger los datos mientras se conserva el espacio de almacenamiento.

Las instantáneas se pueden replicar en otras ubicaciones o almacenarse en la nube para fines de recuperación ante desastres.

DR en la nube (recuperación ante desastres en la nube)

La recuperación ante desastres en la nube (DR en la nube) utiliza infraestructura y servicios basados en la nube para realizar copias de seguridad y recuperar datos y aplicaciones, eliminando la necesidad de mantener centros de datos secundarios físicos.

Le permite proteger los datos de la aplicación y toda la infraestructura del servidor, incluidas las máquinas físicas o máquinas virtuales (VM) que utilizan la nube pública o la configuración de un proveedor de servicios dedicado. Puede configurar los horarios de las copias de seguridad según sus necesidades específicas.

Las soluciones de respaldo en la nube también pueden integrarse con plataformas de virtualización como VMware o soluciones de respaldo nativas de la nube. Estos enfoques ofrecen una escalabilidad flexible y una optimización de costos a medida que evolucionan sus necesidades de almacenamiento, y dan soporte a las organizaciones que están llevando a cabo la migración a la nube

Recuperación ante desastres como servicio (DRaaS)

La recuperación ante desastres como servicio (DRaaS) es una solución de terceros basada en la nube que proporciona protección de datos y capacidades de DR bajo demanda y de pago por uso.

DRaaS es una de las ofertas de servicios de TI gestionados más populares y de rápido crecimiento disponibles en la actualidad. Un estudio de la industria de 2023 proyectó que el mercado de DRaaS crecería de 10.7 mil millones de dólares a 26.5 mil millones de dólares para 2028 a una tasa de crecimiento anual compuesta.2

Con DRaaS, su proveedor de servicios documenta los RTO y RPO en un acuerdo de nivel de servicio (SLA) que describe sus límites de tiempo de inactividad y expectativas de recuperación de aplicaciones.

Las ofertas de DRaaS también suelen incluir operaciones de recuperación de aplicaciones basadas en la nube. Este enfoque ofrece importantes ahorros de costos en comparación con el mantenimiento de recursos de hardware dedicados redundantes en su propio centro de datos. Hay contratos en los que paga una tarifa por mantener las capacidades de conmutación por error, más los costos por uso de los recursos consumidos en una situación de recuperación ante desastres. De este modo, su proveedor normalmente asume toda la responsabilidad de configurar y mantener el entorno de conmutación por error.

DRaaS frente a DR

Si ya creó una solución de recuperación ante desastres (DR) en sus instalaciones, puede ser un desafío evaluar los costos y los beneficios de mantenerla en comparación con la transición a una suscripción mensual de DRaaS.

La mayoría de las soluciones de DR on premises incurren en costos de hardware, energía, mano de obra para mantenimiento y administración, software y conectividad de red. Además de los gastos de capital iniciales involucrados en la configuración inicial de su entorno de DR, debe presupuestar las actualizaciones periódicas de software.

Debido a que su solución DR debe seguir siendo compatible con su entorno de producción principal, debe asegurarse de que su solución DR tenga las mismas versiones de software. Dependiendo de los detalles de su acuerdo de licencia, podría duplicar efectivamente sus costos de software.

Si está considerando soluciones DRaaS de terceros, asegúrese de que el proveedor tenga la capacidad de realizar copias de seguridad interregionales y multisitio. Si un evento meteorológico significativo (por ejemplo, un huracán) afectara la ubicación de su oficina principal, ¿el sitio de conmutación por error estaría lo suficientemente lejos como para no verse afectado por la tormenta?

Si muchos de los clientes de su proveedor en su área se vieran afectados simultáneamente, ¿su proveedor tendría suficiente capacidad para satisfacer sus necesidades combinadas? Está confiando en su proveedor de DRaaS para cumplir con los RTO y RPO en tiempos de crisis, así que busque un proveedor de servicios con una sólida reputación de confiabilidad.

Para obtener una visión comparativa de ambas soluciones, consulte: “Recuperación ante desastres como servicio (DRaaS) frente a recuperación ante desastres (DR): ¿Cuál necesita?

Recuperación ante desastres e IA

La integración de la inteligencia artificial (IA) está transformando la recuperación ante desastres con características que mejoran la detección de amenazas, automatizan la respuesta ante incidentes y optimizan la gestión en entornos híbridos y multinube.

En el Informe del costo de una filtración de datos de IBM 2025, los costos globales promedio disminuyeron de 4.88 millones de dólares a 4.44 millones de dólares, lo que representa una disminución del 9 %. Según el informe, las organizaciones pudieron identificar y contener una filtración en un tiempo promedio de 241 días, el más bajo en 9 años.

La IA en la recuperación ante desastres ofrece los siguientes beneficios clave:

  • análisis predictivos: los modelos de IA analizan datos históricos para predecir posibles fallos o violaciones de seguridad antes de que ocurran. Este proceso permite los análisis predictivos y respalda la mitigación de riesgos.
  • Monitoreo en tiempo real: los algoritmos del sistema de machine learning (ML) ayudan a monitorear el estado de la infraestructura en tiempo real. Las alertas ayudan a los equipos a detectar anomalías y evitar el tiempo de inactividad o la pérdida de datos.
  • Respuestas automatizadas: la automatización impulsada por IA puede ofrecer procedimientos de recuperación más rápidos que la intervención humana, reduciendo significativamente el RTO y el RPO.
  • IA generativa: los modelos de lenguaje grandes (LLM) mejoran los flujos de trabajo de recuperación ante desastres mediante el análisis de registros para determinar la causa principal, la generación automática de documentación sobre incidentes y la provisión de interfaces conversacionales para facilitar una rápida recuperación. Este proceso ayuda a los equipos a traducir los datos en pasos aplicables en la prácticas.
Soluciones relacionadas
IBM Storage Defender

Proteja sus datos de las amenazas en constante evolución sin importar dónde se almacenen mediante copia de seguridad, la detección de amenazas habilitada por IA y la recuperación rápida.

Explorar Storage Defender
Copia de seguridad y recuperación de datos de almacenamiento

Acelere los procesos de copia de seguridad y recuperación empresarial para ayudar a recuperar datos y servicios de TI rápidamente para cargas de trabajo on premises y en la nube. 

Explore las soluciones de copia de seguridad y recuperación
Soluciones de recuperación ante desastres en la nube

Proteja sus datos con un plan de recuperación ante desastres en la nube y mitigue el riesgo de tiempo de inactividad.

Explorar la recuperación ante desastres en la nube
Dé el siguiente paso

Mantenga sus datos seguros y sus cargas de trabajo disponibles a través de la detección temprana de amenazas, las capas de protección y la recuperación rápida. Descubra cómo IBM Storage Defender puede ayudarle a proteger su cadena de suministro de información.

Explorar Storage Defender Reserve una demostración en vivo
Notas de pie de página