Alta disponibilidad, continuidad de la actividad, copias de seguridad y recuperación en caso de catástrofe en AWS
En los entornos impulsados por la IA en los que la automatización y los agentes inteligentes operan a escala, es fundamental mantener el tiempo de actividad, salvaguardar los datos y prepararse para fallos inesperados. IBM watsonx Orchestrate ofrece un marco sólido para la resiliencia y la recuperación.
Esta sección cubre lo siguiente:
Al comprender e implementar estas prácticas, puede garantizar que su organización esté preparada para recuperarse rápidamente de los incidentes y mantener la continuidad operativa.
Responsabilidades de apoyo
Garantizar la seguridad y recuperabilidad de los datos es una responsabilidad compartida entre IBM y el cliente. Aunque IBM proporciona protecciones a nivel de infraestructura, los clientes son responsables de gestionar las copias de seguridad y la restauración de sus propios activos de datos.
Datos esenciales frente a datos de clientes
Datos esenciales : Se refiere a la información interna a nivel del sistema necesaria para restaurar y poner en funcionamiento el servicio watsonx Orchestrate. Incluye configuraciones internas, lógica de servicio y metadatos operativos que son fundamentales para que la plataforma funcione. Los procesos de recuperación ante desastres (DR) de IBM Cloud están diseñados para proteger y restaurar estos datos.
Datos del cliente : Esto incluye cualquier contenido, archivo o configuración creados o subidos por el cliente mientras utiliza watsonx Orchestrate. Los datos de los clientes no se consideran esenciales para el funcionamiento de la Plataforma de Servicios de Datos ( watsonx Orchestrate ) y no están incluidos en los compromisos de recuperación ante desastres (DR) de la Plataforma de Servicios de Datos ( IBM ). Los clientes son responsables de hacer copias de seguridad de sus propios datos.
Responsabilidades del cliente
Como usuario del servicio, se espera que gestione de forma proactiva las copias de seguridad y la restauración de los siguientes tipos de datos:
Datos de entrenamiento: Los conjuntos de datos utilizados para entrenar modelos de IA, que pueden incluir información sensible o privada.
Datos de modelos personalizados: datos que se generan durante el desarrollo y el ajuste de modelos adaptados a sus casos de uso específicos.
Modelos personalizados generados: los modelos finales de IA que se crean a partir de sus esfuerzos de formación y personalización.
Eliminación y recuperación de datos
watsonx Orchestrate garantiza que sus clientes dispongan de un breve plazo para recuperar datos críticos, incluso después de su eliminación.
Retraso en la eliminación de datos
Cuando se borran los datos de un cliente de una instancia de servicio, no se eliminan inmediatamente.
Este retraso intencionado proporciona un periodo de gracia durante el cual los datos borrados aún pueden recuperarse, ayudando a prevenir la pérdida accidental o prematura de datos.
Programación automática de copias de seguridad
IBM Realiza copias de seguridad automáticas cada 12 horas de los datos de los clientes almacenados en bases de datos compatibles.
Estas copias de seguridad se conservan dentro de una ventana móvil de 12 horas, lo que significa que sólo la copia de seguridad más reciente está disponible para la restauración.
Proceso de restauración
Si necesita recuperar datos de las bases de datos PostgreSQL o MongoDB, y los datos se encuentran dentro de la última ventana de copia de seguridad de 12 horas:
Póngase en contacto con IBM el servicio de asistencia para iniciar el proceso de restauración.
IBM le ayuda a recuperar y restaurar los datos de la instantánea de copia de seguridad más reciente.
Gestión de datos del asistente de IA
En el caso de los asistentes AI creados con el AI Assistant Builder, los datos pueden descargarse directamente desde la interfaz del AI Assistant Builder.
Puedes hacer copias de seguridad manuales de las configuraciones y contenidos de tu asistente sin depender de ciclos de copia de seguridad automatizados. Para obtener más información, consulta «Copia de seguridad y restauración de datos del asistente de IA ».
Alta disponibilidad
IBM watsonx Orchestrate se ha diseñado prestando especial atención a la resiliencia, la fiabilidad y la prestación ininterrumpida del servicio.
Redundancia de datos en la región
watsonx Orchestrate replica automáticamente los datos en varias zonas de disponibilidad dentro de la misma región geográfica. Estas zonas son centros de datos físicamente separados que están interconectados. Esta configuración garantiza que si una zona experimenta un fallo, el servicio pueda seguir funcionando desde otra zona con un impacto mínimo o nulo en el rendimiento.
Replicación automática de datos
IBM gestiona el proceso de replicación automáticamente, sin requerir ninguna intervención manual por parte de los clientes. Esta réplica se aplica específicamente a:
Datos de entrenamiento
Datos personalizados del modelo
Esto garantiza que los datos críticos estén siempre protegidos y disponibles, incluso durante interrupciones inesperadas.
Rentabilidad
La replicación automática de datos se realiza sin coste adicional y sin incurrir en gastos adicionales de infraestructura u operativos.
Impacto empresarial
Tiempo de inactividad minimizado: Garantiza el acceso continuo a servicios y datos.
Mayor fiabilidad: Compatible con IBM 's 99.9 % SLA commitment.
Continuidad operativa: Permite una experiencia de usuario sin fisuras.
Todas las funciones de alta disponibilidad (HA) y recuperación ante desastres (DR) para AWSGovCloud (EE. UU.) son las mismas que en la versión comercial AWS, con consideraciones de cumplimiento normativo.
Todas las operaciones de HA - DR se realizan dentro de AWSGovCloud (EE. UU.).
Los datos de copia de seguridad (instantáneas, archivos) se almacenan en AWSGovCloud (EE. UU.) S3 buckets.
Garantiza que todos los datos permanezcan dentro del FedRAMP-approved límite.
Objetivos de disponibilidad
IBM se compromete a ofrecer un servicio altamente fiable y resistente. Para respaldar este compromiso, IBM establece un objetivo claro de disponibilidad como parte de su Acuerdo de Nivel de Servicio (SLA) para watsonx Orchestrate.
Un objetivo de disponibilidad representa el porcentaje de tiempo total en un mes determinado que se espera que el servicio esté plenamente operativo y accesible para los clientes. IBM ofrece a los clientes el siguiente acuerdo de nivel de servicio (SLA) de disponibilidad:
Objetivo de disponibilidad | Valor de destino |
|---|---|
% de disponibilidad | 99.9% |
Resumen de responsabilidades
Área | Responsabilidad de IBM | Responsabilidad del cliente |
|---|---|---|
Replicación de datos en la región |
|
|
Copia de seguridad automática (cada 12 horas) |
|
|
Retención de copias de seguridad (ventana de 12 horas) |
|
|
Restauración de datos ( PostgreSQL, MongoDB ) |
|
|
Compromiso de SLA ( 99.9 % uptime) |
|
|
Copia de seguridad manual de los datos de formación |
|
|
Copia de seguridad manual de los datos del modelo personalizado |
|
|
Copia de seguridad manual de los modelos generados |
|
|
Descarga manual de datos del asistente de IA |
|
|
Recuperación multirregional en caso de catástrofe |
|
|
Enrutamiento y equilibrio de carga entre regiones |
|
|
Sincronización de políticas de seguridad |
|
|