Alta disponibilidad, continuidad de la actividad, copias de seguridad y recuperación en caso de catástrofe en AWS

En los entornos impulsados por la IA en los que la automatización y los agentes inteligentes operan a escala, es fundamental mantener el tiempo de actividad, salvaguardar los datos y prepararse para fallos inesperados. IBM watsonx Orchestrate ofrece un marco sólido para la resiliencia y la recuperación.

Esta sección cubre lo siguiente:

Al comprender e implementar estas prácticas, puede garantizar que su organización esté preparada para recuperarse rápidamente de los incidentes y mantener la continuidad operativa.

Responsabilidades de apoyo

Garantizar la seguridad y recuperabilidad de los datos es una responsabilidad compartida entre IBM y el cliente. Aunque IBM proporciona protecciones a nivel de infraestructura, los clientes son responsables de gestionar las copias de seguridad y la restauración de sus propios activos de datos.

Datos esenciales frente a datos de clientes

Datos esenciales : Se refiere a la información interna a nivel del sistema necesaria para restaurar y poner en funcionamiento el servicio watsonx Orchestrate. Incluye configuraciones internas, lógica de servicio y metadatos operativos que son fundamentales para que la plataforma funcione. Los procesos de recuperación ante desastres (DR) de IBM Cloud están diseñados para proteger y restaurar estos datos.

Datos del cliente : Esto incluye cualquier contenido, archivo o configuración creados o subidos por el cliente mientras utiliza watsonx Orchestrate. Los datos de los clientes no se consideran esenciales para el funcionamiento de la Plataforma de Servicios de Datos ( watsonx Orchestrate ) y no están incluidos en los compromisos de recuperación ante desastres (DR) de la Plataforma de Servicios de Datos ( IBM ). Los clientes son responsables de hacer copias de seguridad de sus propios datos.

Responsabilidades del cliente

Como usuario del servicio, se espera que gestione de forma proactiva las copias de seguridad y la restauración de los siguientes tipos de datos:

  • Datos de entrenamiento: Los conjuntos de datos utilizados para entrenar modelos de IA, que pueden incluir información sensible o privada.

  • Datos de modelos personalizados: datos que se generan durante el desarrollo y el ajuste de modelos adaptados a sus casos de uso específicos.

  • Modelos personalizados generados: los modelos finales de IA que se crean a partir de sus esfuerzos de formación y personalización.

Eliminación y recuperación de datos

watsonx Orchestrate garantiza que sus clientes dispongan de un breve plazo para recuperar datos críticos, incluso después de su eliminación.

Retraso en la eliminación de datos

  • Cuando se borran los datos de un cliente de una instancia de servicio, no se eliminan inmediatamente.

  • Este retraso intencionado proporciona un periodo de gracia durante el cual los datos borrados aún pueden recuperarse, ayudando a prevenir la pérdida accidental o prematura de datos.

Programación automática de copias de seguridad

  • IBM Realiza copias de seguridad automáticas cada 12 horas de los datos de los clientes almacenados en bases de datos compatibles.

  • Estas copias de seguridad se conservan dentro de una ventana móvil de 12 horas, lo que significa que sólo la copia de seguridad más reciente está disponible para la restauración.

Proceso de restauración

Si necesita recuperar datos de las bases de datos PostgreSQL o MongoDB, y los datos se encuentran dentro de la última ventana de copia de seguridad de 12 horas:

  • Póngase en contacto con IBM el servicio de asistencia para iniciar el proceso de restauración.

  • IBM le ayuda a recuperar y restaurar los datos de la instantánea de copia de seguridad más reciente.

Gestión de datos del asistente de IA

  • En el caso de los asistentes AI creados con el AI Assistant Builder, los datos pueden descargarse directamente desde la interfaz del AI Assistant Builder.

  • Puedes hacer copias de seguridad manuales de las configuraciones y contenidos de tu asistente sin depender de ciclos de copia de seguridad automatizados. Para obtener más información, consulta «Copia de seguridad y restauración de datos del asistente de IA ».

Alta disponibilidad

IBM watsonx Orchestrate se ha diseñado prestando especial atención a la resiliencia, la fiabilidad y la prestación ininterrumpida del servicio.

Redundancia de datos en la región

watsonx Orchestrate replica automáticamente los datos en varias zonas de disponibilidad dentro de la misma región geográfica. Estas zonas son centros de datos físicamente separados que están interconectados. Esta configuración garantiza que si una zona experimenta un fallo, el servicio pueda seguir funcionando desde otra zona con un impacto mínimo o nulo en el rendimiento.

Replicación automática de datos

IBM gestiona el proceso de replicación automáticamente, sin requerir ninguna intervención manual por parte de los clientes. Esta réplica se aplica específicamente a:

  • Datos de entrenamiento

  • Datos personalizados del modelo

Esto garantiza que los datos críticos estén siempre protegidos y disponibles, incluso durante interrupciones inesperadas.

Rentabilidad

La replicación automática de datos se realiza sin coste adicional y sin incurrir en gastos adicionales de infraestructura u operativos.

Impacto empresarial

  • Tiempo de inactividad minimizado: Garantiza el acceso continuo a servicios y datos.

  • Mayor fiabilidad: Compatible con IBM 's 99.9 % SLA commitment.

  • Continuidad operativa: Permite una experiencia de usuario sin fisuras.

AWS GovCloud (EE. UU.)

Nota:
  • Todas las funciones de alta disponibilidad (HA) y recuperación ante desastres (DR) para AWSGovCloud (EE. UU.) son las mismas que en la versión comercial AWS, con consideraciones de cumplimiento normativo.

  • Todas las operaciones de HA - DR se realizan dentro de AWSGovCloud (EE. UU.).

  • Los datos de copia de seguridad (instantáneas, archivos) se almacenan en AWSGovCloud (EE. UU.) S3 buckets.

  • Garantiza que todos los datos permanezcan dentro del FedRAMP-approved límite.

Objetivos de disponibilidad

IBM se compromete a ofrecer un servicio altamente fiable y resistente. Para respaldar este compromiso, IBM establece un objetivo claro de disponibilidad como parte de su Acuerdo de Nivel de Servicio (SLA) para watsonx Orchestrate.

Un objetivo de disponibilidad representa el porcentaje de tiempo total en un mes determinado que se espera que el servicio esté plenamente operativo y accesible para los clientes. IBM ofrece a los clientes el siguiente acuerdo de nivel de servicio (SLA) de disponibilidad:

Tabla 1. Tabla 1. Acuerdo de nivel de servicio (SLA) para watsonx Orchestrate

Objetivo de disponibilidad

Valor de destino

% de disponibilidad

99.9%

Resumen de responsabilidades

Área

Responsabilidad de IBM

Responsabilidad del cliente

Replicación de datos en la región

Con soporte

No soportado

Copia de seguridad automática (cada 12 horas)

Con soporte

No soportado

Retención de copias de seguridad (ventana de 12 horas)

Con soporte

No soportado

Restauración de datos ( PostgreSQL, MongoDB )

Con soporte (gracias al apoyo)

No soportado

Compromiso de SLA ( 99.9 % uptime)

Con soporte

No soportado

Copia de seguridad manual de los datos de formación

No soportado

Con soporte

Copia de seguridad manual de los datos del modelo personalizado

No soportado

Con soporte

Copia de seguridad manual de los modelos generados

No soportado

Con soporte

Descarga manual de datos del asistente de IA

No soportado

Con soporte

Recuperación multirregional en caso de catástrofe

No soportado

Con soporte

Enrutamiento y equilibrio de carga entre regiones

No soportado

Con soporte

Sincronización de políticas de seguridad

No soportado

Con soporte