Recuperación ante desastres
leadspace en la nube
Recuperación ante desastres

Una descripción general del proceso de planificación de la recuperación de desastres y algunas pautas sobre si la recuperación de desastres como servicio (DRaaS) es la opción correcta para proteger su negocio.


¿Qué es la recuperación de desastres?

La recuperación de desastres (DR) consiste en tecnologías de TI y mejores prácticas diseñadas para prevenir o minimizar la pérdida de datos y la interrupción del negocio resultante de eventos catastróficos, desde fallas de equipos y cortes de energía localizados hasta ataques cibernéticos, emergencias civiles, ataques criminales o militares y desastres naturales.

Muchas empresas, especialmente las organizaciones pequeñas y medianas, se olvidan de desarrollar un plan de recuperación de desastres confiable y factible. Sin un plan de este tipo, tienen poca protección contra el impacto de eventos significativamente perturbadores.

La falla de la infraestructura puede costar tanto como USD 100,000 por hora y los costos de fallas de aplicaciones críticas pueden oscilar entre USD 500,000 y USD 1 millón por hora. Muchas empresas no pueden recuperarse de tales pérdidas. Más del 40 % de las pequeñas empresas no volverán a abrir después de sufrir un desastre y, entre las que sí lo hagan, un 25 % adicional fracasará durante el primer año después de la crisis. La planificación de la recuperación de desastres puede reducir drásticamente estos riesgos.

La planificación de la recuperación de desastres implica la elaboración de estrategias, la planificación, la implementación de la tecnología adecuada y las pruebas continuas. Mantener copias de seguridad de sus datos es un componente crítico de la planificación de la recuperación de desastres, pero un proceso de copia de seguridad y recuperación por sí solo no constituye un plan completo de recuperación de desastres.

La recuperación de desastres también implica garantizar que el almacenamiento y la computación adecuados estén disponibles para mantener procedimientos sólidos de conmutación por error y conmutación por recuperación. La conmutación por error  es el proceso de descargar cargas de trabajo a los sistemas de copia de seguridad para que los procesos de producción y las experiencias del usuario final se interrumpan lo menos posible. La conmutación por recuperación  implica volver a los sistemas primarios originales.

Lea nuestro artículo para obtener más  información acerca de la importante distinción entre copia de seguridad y planificación de recuperación de desastres.


Planificación de continuidad empresarial

La planificación de la continuidad del negocio crea sistemas y procesos para garantizar que todas las áreas de su empresa puedan mantener las operaciones esenciales o reanudarlas lo más rápido posible en caso de una crisis o emergencia. La planificación de la recuperación de desastres es el subconjunto de la planificación de la continuidad del negocio que se centra en la recuperación de la infraestructura y los sistemas de TI.


Plan de recuperación de desastres

Análisis de impacto empresarial


La creación de un plan integral de recuperación de desastres comienza con un análisis de impacto empresarial. Al realizar este análisis, creará una serie de escenarios detallados de desastre que luego se podrán usar para prever el tamaño y el alcance de las pérdidas en las que incurriría si se interrumpieran ciertos procesos comerciales. ¿Qué pasa si, por ejemplo, un incendio destruye su centro de atención al cliente? ¿O un terremoto golpeó su sede?

Esto le permitirá identificar las áreas y funciones del negocio que son más críticas y le permitirá determinar cuánto tiempo de inactividad podría tolerar cada una de estas funciones críticas. Con esta información en la mano, puede comenzar a crear un plan sobre cómo se podrían mantener las operaciones más críticas en varios escenarios.

La planificación de la recuperación de desastres de TI debe seguir y respaldar la planificación de la continuidad del negocio. Si, por ejemplo, su plan de continuidad del negocio requiere que los representantes de servicio al cliente trabajen desde casa después de un incendio en el centro de llamadas, ¿qué tipos de hardware, software y recursos de TI deberían estar disponibles para respaldar ese plan?

 

Análisis de riesgo


La evaluación de la probabilidad y las posibles consecuencias de los riesgos que enfrenta su empresa también es un componente esencial de la planificación de la recuperación de desastres. A medida que los ataques cibernéticos y el ransomware se vuelven más frecuentes, es fundamental comprender los actuales riesgos generales de seguridad cibernética que enfrentan todas las empresas, así como los riesgos específicos de su industria y ubicación geográfica.

Para una variedad de escenarios, incluidos desastres naturales, fallas de equipos, amenazas internas, sabotaje y errores de los empleados, querrá evaluar sus riesgos y considerar el impacto general en su negocio. Pregúntate a ti mismo las siguientes preguntas:

  • ¿Qué pérdidas financieras incurriría debido a perdidas de oportunidades de ventas o interrupciones en las actividades que generan ingresos?
  • ¿Qué tipo de daño sufriría la reputación de su marca? ¿Cómo se vería afectada la satisfacción del cliente?
  • ¿Cómo se vería afectada la productividad de los empleados? ¿Cuántas horas laborales se pueden perder?
  • ¿Qué riesgos podría representar el incidente para la salud o la seguridad humana?
  • ¿Se vería afectado el progreso hacia alguna iniciativa u objetivo empresarial? ¿Cómo?

 

Priorizar aplicaciones


No todas las cargas de trabajo son igualmente críticas para la capacidad de su empresa de mantener las operaciones, y el tiempo de inactividad es mucho más tolerable para algunas aplicaciones que para otras. Separe sus sistemas y aplicaciones en tres niveles, según el tiempo que pueda soportar que estén inactivos y la gravedad de las consecuencias de la pérdida de datos.

  1. Misión crítica: aplicaciones cuyo funcionamiento es fundamental para la supervivencia de su negocio.
  2. Importante: aplicaciones para las que podría tolerar períodos de inactividad relativamente cortos.
  3. No esencial: aplicaciones que podría reemplazar temporalmente con procesos manuales o prescindir de ellos.

 

Documentar dependencias


El siguiente paso en la planificación de la recuperación de desastres es crear un inventario completo de sus activos de hardware y software. En esta etapa, es esencial comprender las interdependencias críticas de las aplicaciones. Si una aplicación de software falla, ¿qué otras se verán afectadas?

Diseñar modelos de resiliencia y recuperación de desastres en los sistemas tal como se construyeron inicialmente es la mejor manera de administrar las interdependencias de las aplicaciones. Es muy común en las arquitecturas actuales basadas en microservicios descubrir procesos que no pueden iniciarse cuando otros sistemas o procesos están inactivos, y viceversa. Esta es una situación desafiante de la que recuperarse y es vital descubrir estos problemas cuando tenga tiempo para desarrollar planes alternativos para sus sistemas y procesos, antes de que ocurra un desastre real.

 

Establecer objetivos de tiempo de recuperación, objetivos de punto de recuperación y objetivos de consistencia de recuperación


Al considerar sus análisis de riesgo e impacto comercial, debería poder establecer objetivos sobre cuánto tiempo necesitaría para restablecer los sistemas, cuántos datos podría usar y cuánta corrupción o desviación de datos podría tolerar.

Su objetivo de tiempo de recuperación (RTO) es la cantidad máxima de tiempo que debería tomar para restaurar el funcionamiento de la aplicación o el sistema después de una interrupción del servicio.

Su objetivo de punto de recuperación (RPO) es la antigüedad máxima de los datos que deben recuperarse para que su empresa reanude las operaciones habituales. Para algunas empresas, perder incluso unos pocos minutos de datos puede ser catastrófico, mientras que en otras industrias pueden tolerar ventanas más largas.

Se establece un objetivo de consistencia de recuperación (RCO) en el acuerdo de nivel de servicio (SLA) para los servicios continuos de protección de datos. Es una métrica que indica cuántas entradas inconsistentes en los datos comerciales de los procesos o sistemas recuperados son tolerables en situaciones de recuperación de desastres, y describe la integridad de los datos comerciales en entornos de aplicaciones complejos.

 

Problemas de conformidad normativa


Todos los softwares y soluciones de recuperación de desastres que haya establecido su empresa deben satisfacer todos los requisitos de seguridad y protección de datos que debe cumplir. Esto significa que todos los sistemas de copia de seguridad de datos y de conmutación por error deben diseñarse para cumplir con los mismos estándares para garantizar la confidencialidad e integridad de los datos que sus sistemas primarios.

Al mismo tiempo, varios estándares regulatorios estipulan que todas las empresas deben mantener planes de recuperación de desastres y/o continuidad del negocio. La Ley Sarbanes-Oxley (SOX), por ejemplo, requiere que todas las empresas que cotizan en bolsa en los Estados Unidos mantengan copias de todos los registros comerciales durante un mínimo de cinco años. El incumplimiento de esta regulación (incluida la negligencia en establecer y probar sistemas de copia de seguridad de datos apropiados) puede resultar en sanciones financieras significativas para las empresas e incluso en la cárcel para sus líderes.

 

Elegir tecnologías


Las copias de seguridad sirven como base sobre la que se construye cualquier plan sólido de recuperación de desastres. En el pasado, la mayoría de las empresas confiaban en cintas y discos giratorios (HDD) para realizar copias de seguridad, manteniendo múltiples copias de sus datos y almacenando al menos una en una ubicación externa.

En el mundo en constante transformación digital de hoy, las copias de seguridad en cinta en repositorios externos a menudo no pueden lograr los RTO necesarios para mantener las operaciones críticas para el negocio. Crear la arquitectura de su propia solución de recuperación de desastres implica replicar muchas de las funcionalidades de su entorno de producción y requerirá que incurra en costos de personal de soporte, administración, instalaciones e infraestructura. Por esta razón, muchas organizaciones están recurriendo a soluciones de copia de seguridad basadas en la nube o proveedores de recuperación de desastres como servicio (DRaaS) a gran escala.

 

Elegir ubicaciones de sitios de recuperación


Crear su propio centro de datos de recuperación de desastres implica equilibrar varios objetivos en competencia. Por un lado, una copia de sus datos debe almacenarse en algún lugar que esté lo suficientemente distante geográficamente de las ubicaciones de su sede o oficina para que no se vea afectado por los mismos eventos sísmicos, amenazas ambientales u otros peligros que su sitio principal. Por otro lado, las copias de seguridad almacenadas fuera del sitio siempre tardan más en restaurarse que las que se encuentran en las instalaciones en el sitio principal, y la latencia de la red puede ser incluso mayor en distancias más largas.

 

Prueba y revisión continuas


En pocas palabras, si su plan de recuperación de desastres no se ha probado, no se puede confiar en él. Todos los empleados con responsabilidades relevantes deben participar en el ejercicio de prueba de recuperación de desastres, que puede incluir el mantenimiento de las operaciones desde el sitio de conmutación por error durante un período de tiempo.

Si realizar pruebas integrales de recuperación de desastres está fuera de su presupuesto o de sus capacidades, también puede programar un recorrido de "ejercicio de mesa" de los procedimientos de prueba, aunque debe tener en cuenta que es menos probable que este tipo de prueba revele anomalías o debilidades en sus procedimientos de recuperación de desastres, especialmente la presencia de interdependencias de aplicaciones previamente desconocidas, que una prueba completa.

A medida que sus activos de hardware y software cambien con el tiempo, querrá asegurarse de que su plan de recuperación de desastres también se actualice. Querrá revisar y revisar el plan periódicamente de forma continua.

IBM Knowledge Center proporciona un ejemplo de un plan de recuperación de desastres.


Recuperación de desastres como servicio (DRaaS)

La recuperación de desastres como servicio (DRaaS) es actualmente una de las ofertas de servicios gestionados de TI más populares y de rápido crecimiento disponibles. Su proveedor documentará los RTO y RPO en un acuerdo de nivel de servicio (SLA) que describe los límites de tiempo de inactividad y las expectativas de recuperación de la aplicación.

Los proveedores de DRaaS suelen proporcionar entornos de conmutación por error basados en la nube. Este modelo ofrece ahorros de costos significativos en comparación con el mantenimiento de recursos de hardware dedicados redundantes en su propio centro de datos. Hay contratos disponibles en los que pagará una tarifa por mantener las funcionalidades de conmutación por error más los costos por uso de los recursos consumidos en una situación de recuperación de desastres. Normalmente, su proveedor asumirá toda la responsabilidad de configurar y mantener el entorno de conmutación por error.

Las ofertas de servicios de recuperación de desastres difieren de un proveedor a otro. Algunos proveedores definen su oferta como una solución integral, todo en uno, mientras que otros ofrecen servicios por partes que van desde la restauración de una sola aplicación hasta la réplica completa del centro de datos en la nube. Algunas soluciones pueden incluir planificación de recuperación de desastres o servicios de prueba, mientras que otras cobrarán una tarifa de consultoría adicional por estas soluciones.

Asegúrese de que todas las aplicaciones de software empresarial en las que confíe sean compatibles, al igual que cualquier proveedor de nube pública con el que esté trabajando. También querrá asegurarse de que el rendimiento de la aplicación sea satisfactorio en el entorno de conmutación por error y que los procedimientos de conmutación por error y conmutación por recuperación se hayan probado bien.


DR en la nube

Si ya ha creado una solución de recuperación ante desastres (DR) local, puede resultar complicado evaluar los costos y los beneficios de mantenerla en lugar de pasar a una suscripción mensual de DRaaS.

La mayoría de las soluciones de recuperación de desastres en las instalaciones incurrirán en costos de hardware, energía, mano de obra para el mantenimiento y administración, software y conectividad de red. Además de los gastos de capital iniciales involucrados en la configuración inicial de su entorno de recuperación de desastres, deberá presupuestar las actualizaciones regulares del software. Debido a que su solución de recuperación de desastres debe seguir siendo compatible con su entorno de producción principal, querrá asegurarse de que su solución de recuperación de desastres tenga las mismas versiones de software. Dependiendo de los detalles de su contrato de licencia, esto podría duplicar efectivamente sus costos de software.

El cambio a una suscripción DRaaS no solo puede reducir sus gastos de hardware y software, sino que también puede reducir sus costos laborales al trasladar la carga de mantener el sitio de conmutación por error al proveedor.

Si está considerando soluciones DRaaS de terceros, querrá asegurarse de que el proveedor tenga la capacidad para realizar copias de seguridad de varios sitios entre regiones. Si un evento meteorológico significativo, como un huracán, afectara la ubicación de su oficina principal, ¿el sitio de conmutación por error estaría lo suficientemente lejos como para no verse afectado por la tormenta? Además, ¿tendría el proveedor la capacidad adecuada para satisfacer las necesidades combinadas de todos sus clientes en su área si muchos fueran afectados al mismo tiempo? Confía en que su proveedor de DRaaS cumplirá con los RTO y los RPO en tiempos de crisis, así que busque un proveedor de servicios con una sólida reputación de confiabilidad.

Para obtener una descripción comparativa de ambas soluciones, lea "Recuperación de desastres como servicio (DRaaS) frente a recuperación de desastres (DR): ¿Qué necesita?".


Recuperación de desastres e IBM

Las soluciones de recuperación de desastres basadas en IBM Cloud son resilientes y confiables. Puede suministrar un sitio de conmutación por error en cualquiera de los más de 60 centros de datos ubicados en seis regiones y en 18 zonas de disponibilidad global para conseguir una baja latencia y cumplir con los requisitos comerciales específicos geográficamente.

Las soluciones de recuperación de desastres de IBM brindan recursos de continuidad del negocio de nivel empresarial para implementaciones en las instalaciones, en nubes públicas, privadas e híbridas. Las soluciones están diseñadas para dar soporte local a IBM Cloud, IBM Cloud a IBM Cloud y proveedores de nube de terceros a arquitecturas de recuperación de desastres de IBM Cloud. IBM también ofrece consultoría de continuidad del negocio para ayudarle a anticipar y planificar una amplia variedad de amenazas, riesgos y posibles interrupciones comerciales.

Además, IBM se ha asociado con Zerto para presentar Zerto on IBM Cloud, una solución de recuperación de desastres simple y escalable que se instala sin problemas en el entorno de VMware vSphere y ofrece RPO de segundos y RTO de minutos para todas las máquinas virtuales y cargas de trabajo.

Desarrolle habilidades con cursos de opciones de almacenamiento y resiliencia, como "Descripción general de los conceptos de recuperación de desastres" y una variedad de otros cursos incluidos en la capacitación y certificación basada en roles de IBM Cloud Professional Architect.

Para obtener más información sobre las soluciones de recuperación de desastres de IBM Cloud y las licencias complementarias para Zerto on IBM Cloud, solicite una cuenta sin costo de IBM Cloud hoy mismo.


Soluciones relacionadas

Almacenamiento en cinta

Tecnología de almacenamiento en cinta confiable con air gap, retención a largo plazo, resiliencia cibernética y bajo consumo a un costo menor que otros medios.


Zerto on IBM Cloud

Consiga RPO en segundos y RTO en minutos, con una solución de protección de datos escalable y fácil de implementar


Centros de datos globales

Realice sus operaciones de una manera más fluida en la nube y más segura en el terreno, con más opciones de implementación según sus cargas de trabajo. La red de IBM Cloud es resiliente, segura y está disponible en 19 países de 6 continentes.