La recuperación ante desastres (DR) es un marco que consiste en tecnologías de TI y mejores prácticas diseñadas para prevenir o minimizar la pérdida de datos y las interrupciones del negocio derivadas de eventos catastróficos.
Abarca todo, desde fallas de equipamiento y cortes de energía locales hasta ataques criminales o militares, ciberataques y desastres naturales.
Muchas empresas, especialmente las pequeñas y medianas, descuidan el desarrollo de un plan de recuperación ante desastres (DRP) confiable y práctico. Sin un plan de este tipo, tienen poca protección contra el impacto de grandes eventos disruptivos.
El costo del tiempo de inactividad no planificado hace que la protección contra la pérdida de datos sea esencial. Según una investigación de Splunk y Oxford Economics, el costo promedio del tiempo de inactividad puede costar hasta 9000 USD por minuto (o 540 000 USD por hora) para las organizaciones empresariales. Para las instituciones financieras y de atención médica de alto riesgo que manejan datos confidenciales, el tiempo de inactividad puede resultar en costos superiores a 5 millones de dólares por hora.1 La planificación de recuperación ante desastres puede mitigar significativamente estos riesgos.
La recuperación ante desastres implica la elaboración de estrategias, la planificación, el despliegue de tecnología adecuada y la implementación de pruebas continuas. Si bien las copias de seguridad de los datos son un componente crítico, un proceso de copia de seguridad y recuperación por sí solo no constituye un plan integral de recuperación ante desastres.
La recuperación ante desastres también implica garantizar que se disponga de almacenamiento y computación adecuados para mantener procedimientos sólidos de conmutación por error y conmutación por recuperación. La conmutación por error es el proceso de descargar cargas de trabajo a sistemas de respaldo para que los procesos de producción y las experiencias del usuario final se vean lo menos interrumpidos posible. La conmutación por recuperación implica volver a los sistemas primarios originales.
Boletín de la industria
Manténgase al día sobre las tendencias más importantes e intrigantes de la industria sobre IA, automatización, datos y más con el boletín Think. Consulte la Declaración de privacidad de IBM.
Su suscripción se entregará en inglés. En cada boletín, encontrará un enlace para darse de baja. Puede gestionar sus suscripciones o darse de baja aquí. Consulte nuestra Declaración de privacidad de IBM para obtener más información.
La recuperación ante desastres para la continuidad de negocio (BCDR) es un proceso que ayuda a su organización a reanudar las operaciones comerciales normales cuando ocurre un desastre. La continuidad de negocio y la recuperación ante desastres tienen muchas similitudes, pero son dos enfoques distintos.
Si bien la BCDR a veces se denomina gestión de emergencias en las empresas, difiere significativamente de los programas de gobierno como la Federal Emergency Management Agency (FEMA). Estos programas se centran en emergencias civiles y brindan seguridad pública y asistencia en casos de desastre a toda la comunidad, en lugar de TI y operaciones organizacionales.
La planificación de la continuidad de negocio (BCP) consiste en sistemas y procesos que garantizan que todas las áreas de una empresa puedan mantener las operaciones esenciales o reanudarlas rápidamente en caso de crisis o emergencia.
La planificación de la recuperación ante desastres es un subconjunto de la planificación de la continuidad de negocio que se centra en la recuperación de la infraestructura y los sistemas de TI. Implica un plan de recuperación ante desastres (DRP) que traza los pasos de recuperación de un evento inesperado. Las empresas dependen de los DRP para gestionar diversas situaciones de desastre (por ejemplo, desastres naturales, ransomware, ataques de malware).
Los siguientes siete pasos son fundamentales para una planeación eficaz de la recuperación ante desastres:
La creación de un plan integral de recuperación ante desastres comienza con un análisis de impacto empresarial (BIA). Al realizar este análisis, va a crear una serie de escenarios de desastre detallados. Estos escenarios se pueden utilizar para predecir el tamaño y el alcance de las pérdidas en las que incurriría en caso de que se interrumpieran determinados procesos empresariales. Por ejemplo, ¿qué sucede si un incendio destruye su centro de atención telefónica? ¿O si un terremoto afectara a su sede central?
Este análisis le permite identificar las funciones empresariales críticas y determinar cuánto tiempo de inactividad puede tolerar cada una de ellas. Con esta información a mano, puede comenzar a crear un plan para mantener las operaciones críticas en varios escenarios.
La planificación de recuperación ante desastres de TI debe basarse en la planificación de continuidad de negocio y apoyarla. ¿Qué sucede si, por ejemplo, su plan de continuidad de negocio requiere que los representantes de atención al cliente trabajen desde casa después de un incendio en el centro de atención telefónica? ¿Qué tipos de hardware, software y recursos de TI deberían estar disponibles para respaldar ese plan?
Evaluar la probabilidad y las posibles consecuencias de los riesgos que enfrenta su empresa es un componente crucial de una estrategia de recuperación ante desastres. A medida que los ciberataques y el ransomware se vuelven más frecuentes, es crítico comprender los riesgos generales de ciberseguridad que enfrentan todas las empresas hoy en día. Además, es importante comprender los riesgos específicos de su industria y ubicación geográfica.
Para diversos escenarios, incluyendo desastres naturales, fallas de equipamiento, amenazas de usuarios internos, sabotaje y errores de empleados, es importante evaluar sus riesgos y considerar el impacto global en su negocio.
Hágase las siguientes preguntas:
No todas las cargas de trabajo son igualmente críticas para la capacidad de su empresa para mantener las operaciones, y el tiempo de inactividad es mucho más tolerable para algunas aplicaciones que para otras.
Separe sus sistemas y aplicaciones de TI en tres niveles, en función del tiempo que pueda permitirse tenerlos inactivos y la gravedad de las consecuencias de la pérdida de datos:
El siguiente paso en la planificación de la recuperación ante desastres es crear un inventario completo de sus activos de hardware y software. Es esencial comprender las interdependencias críticas de aplicación en esta etapa. Si una aplicación de software deja de funcionar, ¿qué otras se verán afectadas?
Diseñar modelos de resiliencia de los datos y recuperación ante desastres en los sistemas cuando se crean inicialmente es la mejor manera de gestionar las interdependencias de la aplicación. Es muy común con las arquitecturas actuales basadas en microservicios descubrir procesos que no se pueden iniciar cuando otros sistemas o procesos están inactivos, y viceversa.
Esta situación es difícil de superar. También es fundamental detectar estos problemas cuando se dispone de tiempo para desarrollar planes alternativos para los sistemas y procesos, antes de que se produzca un desastre real.
Al considerar sus análisis de riesgo e impacto empresarial, debería poder establecer múltiples objetivos. Estos objetivos incluyen cuánto tiempo llevaría volver a poner los sistemas en línea, cuántos datos puede permitirse perder y cuánta corrupción o desviación de datos puede tolerar.
Todo el software y las soluciones de recuperación ante desastres que su empresa haya establecido deben satisfacer cualquier requerimiento de seguridad y protección de datos que se le exija cumplir. Significa que todas las copias de seguridad y sistemas de conmutación por error deben estar diseñados para cumplir con los mismos estándares para garantizar la confidencialidad e integridad de los datos que sus sistemas primarios.
Al mismo tiempo, varias normas reguladoras estipulan que todas las empresas deben mantener planes de recuperación ante desastres y de continuidad de negocio. La Ley Sarbanes-Oxley (SOX), por ejemplo, exige que todas las empresas que cotizan en bolsa en Estados Unidos mantengan copias de todos los registros comerciales durante un mínimo de cinco años.
El incumplimiento de esta normativa (incluyendo el descuido de establecer y probar sistemas de copia de seguridad adecuados) puede conllevar importantes resultados económicos para las empresas, incluso penas de cárcel para sus líderes.
En pocas palabras: si su plan de recuperación ante desastres no ha sido probado, no es confiable. Todos los empleados con responsabilidades relevantes deben participar en el ejercicio de prueba de recuperación ante desastres, que puede implicar mantener las operaciones desde el sitio de conmutación por error durante un período específico.
Si realizar pruebas exhaustivas de recuperación ante desastres está fuera de su presupuesto o capacidades, también puede programar un simulacro de los procedimientos de prueba. Sin embargo, es menos probable que este tipo de pruebas revelen anomalías o debilidades en sus procedimientos de DR, especialmente la presencia de interdependencias de aplicaciones previamente no descubiertas, que una prueba completa.
A medida que sus activos de hardware y software cambian con el tiempo, debe asegurarse de que su plan de recuperación ante desastres se actualice en consecuencia. Por ello, es importante revisar y modificar periódicamente el plan de forma continua.
Haga clic aquí para ver un ejemplo de plan de recuperación ante desastres.
La recuperación ante desastres ofrece beneficios esenciales, incluyendo:
La recuperación ante desastres incluye los siguientes tipos de tecnologías y soluciones:
Construir su propio centro de datos de recuperación ante desastres implica encontrar un equilibrio entre varios objetivos en competencia.
Sin embargo, una copia de sus datos debe almacenarse en algún lugar que esté lo suficientemente lejos de sus oficinas centrales u oficinas. De esta manera, los mismos eventos sísmicos, amenazas ambientales u otros peligros que afectan su sitio principal no pueden destruir permanentemente sus datos.
Al mismo tiempo, las copias de seguridad almacenadas fuera del sitio tardan más en restaurarse en comparación con las ubicadas on premises en el sitio principal. Además, la latencia de la red puede ser aún mayor a distancias más largas.
La copia de seguridad y la restauración sirven como base sobre la cual se construye cualquier plan estable de recuperación ante desastres.
Una copia de seguridad instantánea de una base de datos captura el estado actual de una aplicación o disco en un momento determinado. Al escribir solo los datos modificados desde la última instantánea, este método puede ayudar a proteger los datos mientras se conserva el espacio de almacenamiento.
Las instantáneas se pueden replicar en otras ubicaciones o almacenarse en la nube para fines de recuperación ante desastres.
La recuperación ante desastres en la nube (DR en la nube) utiliza infraestructura y servicios basados en la nube para realizar copias de seguridad y recuperar datos y aplicaciones, eliminando la necesidad de mantener centros de datos secundarios físicos.
Le permite proteger los datos de la aplicación y toda la infraestructura del servidor, incluidas las máquinas físicas o máquinas virtuales (VM) que utilizan la nube pública o la configuración de un proveedor de servicios dedicado. Puede configurar los horarios de las copias de seguridad según sus necesidades específicas.
Las soluciones de respaldo en la nube también pueden integrarse con plataformas de virtualización como VMware o soluciones de respaldo nativas de la nube. Estos enfoques ofrecen una escalabilidad flexible y una optimización de costos a medida que evolucionan sus necesidades de almacenamiento, y dan soporte a las organizaciones que están llevando a cabo la migración a la nube.
La recuperación ante desastres como servicio (DRaaS) es una solución de terceros basada en la nube que proporciona protección de datos y capacidades de DR bajo demanda y de pago por uso.
DRaaS es una de las ofertas de servicios de TI gestionados más populares y de rápido crecimiento disponibles en la actualidad. Un estudio de la industria de 2023 proyectó que el mercado de DRaaS crecería de 10.7 mil millones de dólares a 26.5 mil millones de dólares para 2028 a una tasa de crecimiento anual compuesta.2
Con DRaaS, su proveedor de servicios documenta los RTO y RPO en un acuerdo de nivel de servicio (SLA) que describe sus límites de tiempo de inactividad y expectativas de recuperación de aplicaciones.
Las ofertas de DRaaS también suelen incluir operaciones de recuperación de aplicaciones basadas en la nube. Este enfoque ofrece importantes ahorros de costos en comparación con el mantenimiento de recursos de hardware dedicados redundantes en su propio centro de datos. Hay contratos en los que paga una tarifa por mantener las capacidades de conmutación por error, más los costos por uso de los recursos consumidos en una situación de recuperación ante desastres. De este modo, su proveedor normalmente asume toda la responsabilidad de configurar y mantener el entorno de conmutación por error.
Si ya creó una solución de recuperación ante desastres (DR) en sus instalaciones, puede ser un desafío evaluar los costos y los beneficios de mantenerla en comparación con la transición a una suscripción mensual de DRaaS.
La mayoría de las soluciones de DR on premises incurren en costos de hardware, energía, mano de obra para mantenimiento y administración, software y conectividad de red. Además de los gastos de capital iniciales involucrados en la configuración inicial de su entorno de DR, debe presupuestar las actualizaciones periódicas de software.
Debido a que su solución DR debe seguir siendo compatible con su entorno de producción principal, debe asegurarse de que su solución DR tenga las mismas versiones de software. Dependiendo de los detalles de su acuerdo de licencia, podría duplicar efectivamente sus costos de software.
Si está considerando soluciones DRaaS de terceros, asegúrese de que el proveedor tenga la capacidad de realizar copias de seguridad interregionales y multisitio. Si un evento meteorológico significativo (por ejemplo, un huracán) afectara la ubicación de su oficina principal, ¿el sitio de conmutación por error estaría lo suficientemente lejos como para no verse afectado por la tormenta?
Si muchos de los clientes de su proveedor en su área se vieran afectados simultáneamente, ¿su proveedor tendría suficiente capacidad para satisfacer sus necesidades combinadas? Está confiando en su proveedor de DRaaS para cumplir con los RTO y RPO en tiempos de crisis, así que busque un proveedor de servicios con una sólida reputación de confiabilidad.
Para obtener una visión comparativa de ambas soluciones, consulte: “Recuperación ante desastres como servicio (DRaaS) frente a recuperación ante desastres (DR): ¿Cuál necesita?”
La integración de la inteligencia artificial (IA) está transformando la recuperación ante desastres con características que mejoran la detección de amenazas, automatizan la respuesta ante incidentes y optimizan la gestión en entornos híbridos y multinube.
En el Informe del costo de una filtración de datos de IBM 2025, los costos globales promedio disminuyeron de 4.88 millones de dólares a 4.44 millones de dólares, lo que representa una disminución del 9 %. Según el informe, las organizaciones pudieron identificar y contener una filtración en un tiempo promedio de 241 días, el más bajo en 9 años.
La IA en la recuperación ante desastres ofrece los siguientes beneficios clave:
Proteja sus datos de las amenazas en constante evolución sin importar dónde se almacenen mediante copia de seguridad, la detección de amenazas habilitada por IA y la recuperación rápida.
Acelere los procesos de copia de seguridad y recuperación empresarial para ayudar a recuperar datos y servicios de TI rápidamente para cargas de trabajo on premises y en la nube.
Proteja sus datos con un plan de recuperación ante desastres en la nube y mitigue el riesgo de tiempo de inactividad.
1. The Hidden costs of downtime—According to Global 2000 Executives, Splunk, junio de 2024
2. Disaster Recovery as a Service (DRaaS) Market Size, MarketsandMarkets, 2023