¿Qué es la recuperación de desastres?
Una descripción general del proceso de planificación de la recuperación de desastres y algunas pautas sobre si la recuperación de desastres como servicio (DRaaS) es la opción correcta para proteger su negocio.
Fondo negro y azul
¿Qué es la recuperación de desastres?

La recuperación de desastres (DR) consiste en tecnologías de TI y mejores prácticas diseñadas para prevenir o minimizar la pérdida de datos y la interrupción del negocio resultante de eventos catastróficos, desde fallas de equipos y cortes de energía localizados hasta ciberataques, emergencias civiles, ataques criminales o militares y desastres naturales.

Muchas empresas, especialmente las organizaciones pequeñas y medianas, se olvidan de desarrollar un plan de recuperación de desastres confiable y factible. Sin un plan de este tipo, tienen poca protección contra el impacto de eventos significativamente perturbadores.

La falla de la infraestructura puede costar hasta USD 100,000 por hora (enlace externo a IBM) y los costos de fallas de aplicaciones críticas pueden oscilar entre USD 500,000 y USD 1 millón por hora. Muchas empresas no pueden recuperarse de tales pérdidas. Más del 40 % de las pequeñas empresas no volverán a abrir después de sufrir un desastre y, entre las que sí lo hagan, un 25 % adicional fracasará durante el primer año después de la crisis. La planificación de la recuperación de desastres puede reducir drásticamente estos riesgos.

La planificación de la recuperación de desastres implica la elaboración de estrategias, la planificación, la implementación de la tecnología adecuada y las pruebas continuas. Mantener copias de seguridad de sus datos es un componente crítico de la planificación de la recuperación de desastres, pero un proceso de copia de seguridad y recuperación por sí solo no constituye un plan completo de recuperación de desastres.

La recuperación de desastres también implica garantizar que el almacenamiento y la computación adecuados estén disponibles para mantener procedimientos sólidos de conmutación por error y conmutación por recuperación. La conmutación por error es el proceso de descargar cargas de trabajo a los sistemas de copia de seguridad para que los procesos de producción y las experiencias del usuario final se interrumpan lo menos posible. La conmutación por recuperación implica volver a los sistemas primarios originales.

Lea nuestro artículo para obtener más información acerca de la importante distinción entre copia de seguridad y planificación de recuperación de desastres.

Planificación de continuidad del negocio

La planificación de la continuidad del negocio crea sistemas y procesos para garantizar que todas las áreas de su empresa puedan mantener las operaciones esenciales o reanudarlas lo más rápido posible en caso de una crisis o emergencia. La planificación de la recuperación de desastres es el subconjunto de la planificación de la continuidad del negocio que se centra en la recuperación de la infraestructura y los sistemas de TI.

Plan de recuperación de desastres

Análisis de impacto empresarial


La creación de un plan integral de recuperación de desastres comienza con un análisis de impacto empresarial. Al realizar este análisis, creará una serie de escenarios detallados de desastre que luego se podrán usar para prever el tamaño y el alcance de las pérdidas en las que incurriría si se interrumpieran ciertos procesos de negocio. ¿Qué pasa si, por ejemplo, un incendio destruye su centro de atención al cliente? ¿O un terremoto golpeó su sede?

Esto le permitirá identificar las áreas y funciones del negocio que son más críticas y le permitirá determinar cuánto tiempo de inactividad podría tolerar cada una de estas funciones críticas. Con esta información en la mano, puede comenzar a crear un plan sobre cómo se podrían mantener las operaciones más críticas en varios escenarios.

La planificación de la recuperación de desastres de TI debe seguir y respaldar la planificación de la continuidad del negocio. Si, por ejemplo, su plan de continuidad del negocio requiere que los representantes de servicio al cliente trabajen desde casa después de un incendio en el centro de llamadas, ¿qué tipos de hardware, software y recursos de TI deberían estar disponibles para respaldar ese plan?

 

Análisis de riesgo


La evaluación de la probabilidad y las posibles consecuencias de los riesgos que enfrenta su empresa también es un componente esencial de la planificación de la recuperación de desastres. A medida que los ciberataques y el ransomware se vuelven más frecuentes, es fundamental comprender los actuales riesgos generales de ciberseguridad que enfrentan todas las empresas, así como los riesgos específicos de su industria y ubicación geográfica.

Para una variedad de escenarios, incluidos desastres naturales, fallas de equipos, amenazas internas, sabotaje y errores de los empleados, querrá evaluar sus riesgos y considerar el impacto general en su negocio. Hágase las siguientes preguntas:

  • ¿Qué pérdidas financieras incurriría debido a perdidas de oportunidades de ventas o interrupciones en las actividades que generan ingresos?

  • ¿Qué tipo de daño sufriría la reputación de su marca? ¿Cómo se vería afectada la satisfacción del cliente?

  • ¿Cómo se vería afectada la productividad de los empleados? ¿Cuántas horas laborales se pueden perder?

  • ¿Qué riesgos podría representar el incidente para la salud o la seguridad humana?

  • ¿Se vería afectado el progreso hacia alguna iniciativa u objetivo empresarial? ¿Cómo?

 

Priorizar aplicaciones


No todas las cargas de trabajo son igualmente críticas para la capacidad de su empresa de mantener las operaciones, y el tiempo de inactividad es mucho más tolerable para algunas aplicaciones que para otras. Separe sus sistemas y aplicaciones en tres niveles, según el tiempo que pueda soportar que estén inactivos y la gravedad de las consecuencias de la pérdida de datos.

  1. Misión crítica: aplicaciones cuyo funcionamiento es fundamental para la supervivencia de su negocio.

  2. Importante: aplicaciones para las que podría tolerar períodos de inactividad relativamente cortos.

  3. No esencial: aplicaciones que podría reemplazar temporalmente con procesos manuales o prescindir de ellos.

 

Documentar dependencias


El siguiente paso en la planificación de la recuperación de desastres es crear un inventario completo de sus activos de hardware y software. En esta etapa, es esencial comprender las interdependencias críticas de las aplicaciones. Si una aplicación de software falla, ¿qué otras se verán afectadas?

Diseñar modelos de resiliencia y recuperación de desastres en los sistemas tal como se construyeron inicialmente es la mejor manera de gestionar las interdependencias de las aplicaciones. Es muy común en las arquitecturas actuales basadas en microservicios descubrir procesos que no pueden iniciarse cuando otros sistemas o procesos están inactivos, y viceversa. Esta es una situación desafiante de la que recuperarse y es vital descubrir estos problemas cuando tenga tiempo para desarrollar planes alternativos para sus sistemas y procesos, antes de que ocurra un desastre real.

 

Establecer objetivos de tiempo de recuperación, objetivos de punto de recuperación y objetivos de consistencia de recuperación


Al considerar sus análisis de riesgo e impacto comercial, debería poder establecer objetivos sobre cuánto tiempo necesitaría para restablecer los sistemas, cuántos datos podría usar y cuánta corrupción o desviación de datos podría tolerar.

Su objetivo de tiempo de recuperación (RTO) es la cantidad máxima de tiempo que debería tomar para restaurar el funcionamiento de la aplicación o el sistema después de una interrupción del servicio.

Su objetivo de punto de recuperación (RPO) es la antigüedad máxima de los datos que deben recuperarse para que su empresa reanude las operaciones habituales. Para algunas empresas, perder incluso unos pocos minutos de datos puede ser catastrófico, mientras que en otras industrias pueden tolerar ventanas más largas.

Se establece un objetivo de consistencia de recuperación (RCO) en el acuerdo de nivel de servicio (SLA) para los servicios continuos de protección de datos. Es una métrica que indica cuántas entradas inconsistentes en los datos comerciales de los procesos o sistemas recuperados son tolerables en situaciones de recuperación de desastres, y describe la integridad de los datos comerciales en entornos de aplicaciones complejos.

 

Problemas de conformidad normativa


Todos los softwares y soluciones de recuperación de desastres que haya establecido su empresa deben satisfacer todos los requisitos de seguridad y protección de datos que debe cumplir. Esto significa que todos los sistemas de copia de seguridad de datos y de conmutación por error deben diseñarse para cumplir con los mismos estándares para garantizar la confidencialidad e integridad de los datos que sus sistemas primarios.

Al mismo tiempo, varios estándares regulatorios estipulan que todas las empresas deben mantener planes de recuperación de desastres y/o continuidad del negocio. La Ley Sarbanes-Oxley (SOX), por ejemplo, requiere que todas las empresas que cotizan en bolsa en los Estados Unidos mantengan copias de todos los registros comerciales durante un mínimo de cinco años. El incumplimiento de esta regulación (incluida la negligencia en establecer y probar sistemas de copia de seguridad de datos apropiados) puede resultar en importantes sanciones financieras para las empresas e incluso penas de cárcel para sus ejecutivos.

 

Elegir tecnologías


Las copias de seguridad sirven como base sobre la que se crea cualquier plan sólido de recuperación de desastres. En el pasado, la mayoría de las empresas confiaban en cintas y discos giratorios (HDD) para realizar copias de seguridad, manteniendo múltiples copias de sus datos y almacenando al menos una de ellas fuera del sitio.

En el mundo digital siempre cambiante y siempre conectado de hoy, las copias de seguridad en cinta en repositorios externos a menudo no pueden lograr los RTO necesarios para mantener las operaciones críticas para el negocio. Crear su propia solución de recuperación ante desastres implica replicar muchas de las características de su entorno de producción y requiere incurrir en costos de personal de soporte, administración, instalaciones e infraestructura. Por esta razón, muchas organizaciones están recurriendo a soluciones de copia de seguridad basadas en la nube o proveedores de recuperación de desastres como servicio (DRaaS) a gran escala.

 

Elegir ubicaciones de sitios de recuperación


Crear su propio centro de datos de recuperación de desastres implica equilibrar varios objetivos en competencia. Por un lado, una copia de sus datos debe almacenarse en algún lugar que esté lo suficientemente distante geográficamente de las ubicaciones de su sede o oficina para que no se vea afectado por los mismos eventos sísmicos, amenazas ambientales u otros peligros que su sitio principal. Por otro lado, las copias de seguridad almacenadas fuera del sitio siempre tardan más en restaurarse que las que se encuentran en las instalaciones en el sitio principal, y la latencia de la red puede ser incluso mayor en distancias más largas.

 

Prueba y revisión continuas


En pocas palabras, si su plan de recuperación de desastres no se ha probado, no se puede confiar en él. Todos los empleados con responsabilidades relevantes deben participar en el ejercicio de prueba de recuperación de desastres, que puede incluir el mantenimiento de las operaciones desde el sitio de conmutación por error durante un período de tiempo.

Si realizar pruebas integrales de recuperación de desastres está fuera de su presupuesto o de sus capacidades, también puede programar un recorrido de "ejercicio de mesa" de los procedimientos de prueba, aunque debe tener en cuenta que es menos probable que este tipo de prueba revele anomalías o debilidades en sus procedimientos de recuperación de desastres, especialmente la presencia de interdependencias de aplicaciones previamente desconocidas, que una prueba completa.

A medida que sus activos de hardware y software cambien con el tiempo, querrá asegurarse de que su plan de recuperación de desastres también se actualice. Querrá revisar el plan periódicamente de forma continua.

IBM Knowledge Center proporciona un ejemplo de un plan de recuperación de desastres.

Recuperación de desastres como servicio (DRaaS)

La recuperación de desastres como servicio (DRaaS) es actualmente una de las soluciones de servicios gestionados de TI más populares y de rápido crecimiento disponibles. Su proveedor documentará los RTO y RPO en un acuerdo de nivel de servicio (SLA) que describe los límites de tiempo de inactividad y las expectativas de recuperación de la aplicación.

Los proveedores de DRaaS suelen proporcionar entornos de conmutación por error basados en la nube. Este modelo ofrece ahorros de costos significativos en comparación con el mantenimiento de recursos de hardware dedicados redundantes en su propio centro de datos. Hay contratos disponibles en los que pagará una tarifa por mantener las funcionalidades de conmutación por error más los costos por uso de los recursos consumidos en una situación de recuperación de desastres. Normalmente, su proveedor asumirá toda la responsabilidad de configurar y mantener el entorno de conmutación por error.

Las ofertas de servicios de recuperación de desastres difieren de un proveedor a otro. Algunos proveedores definen su solución como una solución integral, todo en uno, mientras que otros ofrecen servicios por partes que van desde la restauración de una sola aplicación hasta la réplica completa del centro de datos en la nube. Algunas soluciones pueden incluir planificación de recuperación de desastres o servicios de prueba, mientras que otras cobrarán una tarifa de consultoría adicional por estas soluciones.

Asegúrese de que todas las aplicaciones de software empresarial en las que confíe sean compatibles, al igual que cualquier proveedor de nube pública con el que esté trabajando. También querrá asegurarse de que el rendimiento de la aplicación sea satisfactorio en el entorno de conmutación por error y que los procedimientos de conmutación por error y conmutación por recuperación se hayan probado bien.

DR en la nube

Si ya ha creado una solución de recuperación ante desastres (DR) local, puede resultar complicado evaluar los costos y los beneficios de mantenerla, en lugar de pasar a una suscripción mensual de DRaaS.

La mayoría de las soluciones de recuperación de desastres en las instalaciones incurrirán en costos de hardware, energía, mano de obra para el mantenimiento y administración, software y conectividad de red. Además de los gastos de capital iniciales involucrados en la configuración inicial de su entorno de recuperación de desastres, deberá presupuestar las actualizaciones regulares del software. Debido a que su solución de recuperación de desastres debe seguir siendo compatible con su entorno de producción principal, querrá asegurarse de que su solución de recuperación de desastres tenga las mismas versiones de software. Dependiendo de los detalles de su contrato de licencia, esto podría duplicar efectivamente sus costos de software.

El cambio a una suscripción DRaaS no solo puede reducir sus gastos de hardware y software, sino que también puede reducir sus costos laborales al trasladar la carga de mantener el sitio de conmutación por error al proveedor.

Si está considerando soluciones DRaaS de terceros, querrá asegurarse de que el proveedor tenga la capacidad para realizar copias de seguridad de varios sitios entre regiones. Si un evento meteorológico significativo, como un huracán, afectara la ubicación de su oficina principal, ¿el sitio de conmutación por error estaría lo suficientemente lejos como para no verse afectado por la tormenta? Además, ¿tendría el proveedor la capacidad adecuada para satisfacer las necesidades combinadas de todos sus clientes en su área si muchos fueran afectados al mismo tiempo? Confía en su proveedor de DRaaS para cumplir con los RTO y RPO en tiempos de crisis. Así que busque un proveedor de servicios que se sepa que es confiable.

Para obtener una descripción comparativa de ambas soluciones, lea "Recuperación de desastres como servicio (DRaaS) frente a recuperación de desastres (DR): ¿cuál necesita?".

Soluciones relacionadas
Soluciones de recuperación de desastres de IBM

Proteja sus datos con un plan de recuperación de desastres en la nube.

Descubra las soluciones de recuperación de desastres en la nube
Zerto on IBM Cloud

Consiga RPO en segundos y RTO en minutos, con una solución de protección de datos escalable y fácil de implementar.

Explore Zerto on IBM Cloud
Centros de datos globales de IBM Cloud

Ejecute operaciones más fluidas con opciones de implementación para cada carga de trabajo. Nuestra red es resistente, redundante y altamente disponible.

Explore los centros de datos de IBM Cloud
Recursos Capacitación: Arquitecto profesional de IBM Cloud

Obtenga las habilidades y los conocimientos necesarios para comenzar una carrera como arquitecto profesional de IBM Cloud. Valide sus capacidades en un plan de estudios interactivo que le prepara para la certificación de IBM Cloud.

¿Qué es la copia de seguridad y recuperación de desastres?

Conozca más acerca de los conceptos básicos de la copia de seguridad y la recuperación de desastres para poder formular planes eficaces que minimicen el tiempo de inactividad.

Recuperación de desastres como servicio (DRaaS) frente a recuperación de desastres (DR): ¿cuál necesita?

Compare los costos, los beneficios y la funcionalidad de las soluciones locales de recuperación de desastres y DRaaS.

Dé el siguiente paso

Las soluciones de recuperación de desastres basadas en IBM Cloud son resilientes y confiables. Puede suministrar un sitio de conmutación por error en cualquiera de los más de 60 centros de datos ubicados en seis regiones y en 18 zonas de disponibilidad global para conseguir una baja latencia y cumplir con los requisitos comerciales específicos geográficamente.

Descubra más acerca de las soluciones de recuperación de desastres de IBM Cloud