Multi-site Workload Lifeline, también conocido como "Lifeline", es un software para monitorear y enrutar cargas de trabajo. Su propósito es equilibrar las transacciones de cargas de trabajo críticas mediante la distribución de conexiones para cargas de trabajo TCP/IP y mensajes para cargas de trabajo de clúster IBM® MQ en dos sitios, garantizando así una disponibilidad casi continua.
Este producto está disponible como una oferta independiente y como parte de la solución GDPS Continuous Availability.
Cuando se produce una interrupción, IBM Multi-site Workload Lifeline ayuda a reducir de horas a minutos el tiempo de recuperación de cargas de trabajo críticas frente a la recuperación de desastres tradicional. El tiempo de recuperación de interrupciones imprevistas se reduce al detectar fallos en la carga de trabajo y redirigirlos a otro sitio. El impacto de las interrupciones planificadas se mitiga cambiando las cargas de trabajo a otro sitio con una interrupción mínima.
Lifeline admite estos tipos de cargas de trabajo:
Cargas de trabajo basadas en TCP/IP.
Cargas de trabajo de Linux on z Systems
Cargas de trabajo de SNA
Cargas de trabajo de clúster IBM MQ.
Cargas de trabajo enrutadas Sysplex Db2
Enrute nuevas conexiones de cargas de trabajo a las aplicaciones, los servidores y los sistemas que son más capaces de procesar para reducir el tiempo de respuesta de las transacciones. Los recursos del sistema se utilizan de manera más eficiente.
En caso de interrupción de una aplicación, un sistema o un sitio, las nuevas conexiones de carga de trabajo se enrutan a otras aplicaciones disponibles. Se pueden minimizar las interrupciones por actualizaciones de mantenimiento u otros eventos planificados.
Se reduce el tiempo de respuesta alineando las nuevas conexiones de carga de trabajo con las aplicaciones y los sistemas más capaces. Minimice el tiempo de recuperación de horas a minutos tras una falla de la carga de trabajo.
Agrega instancias de aplicación bajo demanda. Supervisa e incluye automáticamente instancias agregadas en las decisiones de enrutamiento de cargas de trabajo.
Enruta las cargas de trabajo de un sitio a otro con interrupciones mínimas. Las conexiones para cargas de trabajo de consulta se pueden distribuir a ambos sitios simultáneamente.
Someta los procedimientos de recuperación de desastres a pruebas más sencillas que no causen perturbaciones, validando que las cargas de trabajo sigan siendo accesibles en el sitio de recuperación sin requerir ninguna interrupción en el sitio de producción.
Lifeline utiliza dos niveles de equilibrio de carga para cargas de trabajo dirigidas a aplicaciones TCP/IP. Lifeline indica a los equilibradores de carga de primer nivel que enruten las conexiones de carga de trabajo a los equilibradores de carga de segundo nivel en el sitio seleccionado, que luego enrutan las conexiones a las aplicaciones en el sitio. Lifeline confía en clústeres IBM MQ para cargas de trabajo que utilizan mensajería. Lifeline dirige el clúster para direccionar los mensajes de carga de trabajo a los gestores de colas de IBM MQ en el sitio seleccionado, que a su vez ponen los mensajes a disposición de las aplicaciones.
Para cargas de trabajo que utilizan dos niveles de equilibradores de carga, Lifeline proporciona equilibradores de carga de primer nivel con recomendaciones de enrutamiento de conexión del sitio basadas en la disponibilidad y el estado de las aplicaciones de carga de trabajo, los sistemas z/OS y (si corresponde) en los sistemas Linux en IBM Z, en ambos sitios. Para las cargas de trabajo que utilizan clústeres IBM MQ, Lifeline proporciona el clúster con recomendaciones de enrutamiento de mensajes basadas en el estado de los gestores de cola de IBM MQ y los sistemas z/OS en ambos sitios.
Se inicia un Agente Lifeline en cada sistema z/OS y Linux en Z Management Guest donde están presentes las cargas de trabajo en ambos sitios. El agente es responsable de supervisar las aplicaciones de carga de trabajo que residen en su sistema y de notificar esta información a un asesor de Lifeline. El agente en z/OS también es responsable de comunicarse con un gestor de colas IBM MQ para monitorear e influir en el enrutamiento de mensajes IBM MQ dentro de un clúster IBM MQ.
Un asesor de Lifeline se inicia en un sistema z/OS ya sea como asesor principal o secundario. Un asesor principal se comunica con todos los agentes Lifeline para determinar la disponibilidad de la carga de trabajo. El Asesor proporciona reglas de distribución de mensajes MQ IBM a los Agentes para los clústeres MQ e recomendaciones de enrutamiento IBM a los equilibradores de carga para las conexiones TCP de estas cargas de trabajo. Un asesor secundario supervisa la disponibilidad del asesor principal y asumirá su responsabilidad si este falla.
Cada carga de trabajo configurada en Multi-site Workload Lifeline se clasifica como carga de trabajo activa/en espera o activa/consulta.
Carga de trabajo activa/en espera en un sitio Lifeline dirige a los equilibradores de carga y a los gestores de colas de IBM MQ para enrutar las conexiones y los mensajes entrantes al sitio activo. Cuando se realizan actualizaciones de la base de datos, el software de replicación de bases de datos transmite esos cambios de forma asíncrona desde la instancia activa de la carga de trabajo a su instancia en espera. En el sitio en espera, la instancia en espera de la carga de trabajo está activa y lista para recibir trabajo. Los datos actualizados del sitio activo se aplican al subsistema de base de datos que se está ejecutando en el sitio en espera casi en tiempo real.
Una carga de trabajo activa/de consulta puede estar activa en uno de los sitios o en ambos. Lifeline ofrece recomendaciones de enrutamiento a los equilibradores de carga para equilibrar de manera inteligente las conexiones en ambos sitios. Las cargas de trabajo que utilizan mensajes IBM MQ no se pueden clasificar como cargas de trabajo activas/de consulta. Cuando la carga de trabajo activa-en espera asociada realiza actualizaciones de la base de datos, Lifeline supervisa la latencia de la replicación de la base de datos para garantizar que las conexiones no se dirijan a un sitio si la base de datos replicada en ese sitio contiene datos demasiado desfasados con respecto a la base de datos del sitio activo.
Como preparación para usar Multi-site Workload Lifeline, usted debe identificar las cargas de trabajo para las que desea proporcionar una disponibilidad continua y evaluar cómo se accede a las aplicaciones de estas cargas de trabajo.
Aprenda a convertir un entorno existente MQ con canales compartidos en un clúster y a configurar Lifeline para dar soporte a una carga de trabajo que utilice un clúster MQ.
Lea casos de uso que describen la integración de Lifeline con BIG-IP Local Traffic Manager de F5.
Plataforma segura para desarrollar y compartir cargas de trabajo de mainframe.
Automatice las tareas de mainframe y la recuperación ante desastres para lograr objetivos de resiliencia.
Mejore las comunicaciones de los servidores con una tecnología de agrupación en clústeres que permite conectar un conjunto de hasta 32 sistemas IBM z/OS para que se comporten como una sola plataforma informática lógica.
Admita iniciativas de integración y consolidación de datos, almacenamiento y analytics a escala gracias la captura de datos de cambios basada en registros y en la integridad transaccional.
Lifeline supervisa las aplicaciones de carga de trabajo y los sistemas en los que residen estas aplicaciones, en los dos sysplex, o sitios, en los que se ejecutan estos sistemas. Lifeline controla el enrutamiento de conexiones y mensajes MQ dirigidos a estas aplicaciones de carga de trabajo, asegurando que las conexiones y los mensajes IBM MQ se envíen a las aplicaciones de carga de trabajo óptimas en el o los sitios activos.
Si Lifeline detecta una falla de carga de trabajo en el sitio activo, puede realizar automáticamente en segundos un cambio de carga de trabajo a las aplicaciones de carga de trabajo en el sitio alternativo. O bien, puede generar mensajes de alerta que los productos de automatización pueden capturar para realizar su propio cambio de carga de trabajo.
Si su empresa cumple con una de las siguientes situaciones, se necesita disponibilidad continua para sus cargas de trabajo.
Las soluciones de recuperación ante desastres existentes utilizan la replicación basada en disco para realizar copias reflejadas en un sitio remoto de todos los discos utilizados por los sistemas en el sitio local. Estas copias de disco no se pueden utilizar mientras se produce la replicación de disco. En caso de que se produzca un error en el sitio local, los sistemas y las aplicaciones de carga de trabajo deben reiniciarse en el sitio remoto antes de restablecer el acceso a las cargas de trabajo. Por lo general, esto puede tardar una hora o más en lograrlo.
Con las soluciones de disponibilidad continua habilitadas para Lifeline, la replicación de datos de software, como InfoSphere Data Replication for Db2, se utiliza para mantener los datos sincronizados entre los sitios locales y remotos. La diferencia clave es que los sistemas de ambos sitios están activos y Lifeline se utiliza para supervisar las cargas de trabajo en ambos sitios. En caso de que se produzca un error en el sitio local, Lifeline detectará el error de la carga de trabajo y enrutará todas las nuevas conexiones de carga de trabajo al sitio alternativo. Por lo tanto, el acceso a las cargas de trabajo se restablecen en segundos, frente a la hora o más con las soluciones de recuperación ante desastres.
Lifeline, a través de su monitoreo y enrutamiento de cargas de trabajo, desempeña un papel integral en la solución de disponibilidad continua de GDPS y proporciona los siguientes beneficios:
No. Aunque normalmente se usa como parte integral de la solución GDPS Continuous Availability, Lifeline también se puede implementar fuera de la solución.
Si su empresa tiene sus propias capacidades de automatización, puede utilizar Lifeline, junto con un producto de replicación de datos de software para mantener sincronizados los datos de ambos sitios.
En otros casos, si su empresa tiene aplicaciones de carga de trabajo que no están habilitadas para sysplex, no puede utilizar la solución de disponibilidad continua de GDPS. El uso de Lifeline, junto con un producto de replicación de datos de software para mantener sincronizados los datos en ambos sitios, proporcionará una recuperación "similar a sysplex" para estos tipos de cargas de trabajo.
Lifeline ofrece la capacidad de realizar un cambio apacible de las aplicaciones y sus fuentes de datos, llamadas cargas de trabajo por Lifeline, durante interrupciones planificadas. Mediante el uso de sencillos comandos de Lifeline, se puede realizar fácilmente la migración de la carga de trabajo de un sitio a otro, minimizando el tiempo de inactividad para eventos planificados, como las actividades de mantenimiento programadas.
Lifeline aumenta la disponibilidad ya que las nuevas conexiones y mensajes pueden enrutarse lejos de aplicaciones y sistemas de carga de trabajo que fallan. Lifeline reduce los tiempos de respuesta al enrutar conexiones y mensajes a aplicaciones y sistemas de carga de trabajo con capacidad para trabajo adicional y reduce el tiempo de recuperación de horas a minutos.
No. Uno de los muchos beneficios de Lifeline es que no es una solución de todo o nada, como tienden a ser las soluciones de recuperación ante desastres. Sólo las cargas de trabajo más críticas se configurarían en Lifeline para ofrecer una disponibilidad continua, mientras que el resto, incluidos los lotes, se recuperarían mediante los procedimientos de recuperación ante desastres existentes. Y se pueden agregar cargas de trabajo adicionales a Lifeline en cualquier momento.
Las características de una carga de trabajo dependen de su tipo. En el caso de las cargas de trabajo basadas en TCP, son las direcciones IP y los números de puerto de las aplicaciones TCP. En el caso de las cargas de trabajo basadas en SNA, son los nombres de las aplicaciones SNA. En el caso de la carga de trabajo basada en IBM MQ, son las colas de clústeres MQ y los gestores de colas donde se envían mensajes IBM MQ para las cargas de trabajo. En el caso de las cargas de trabajo basadas en Db2 DRDA, son las direcciones IP y los números de puerto de los alias Db2 y los subsistemas Db2. En el caso de las cargas de trabajo de Linux en Z, son los invitados Linux en Z que se están ejecutando en zVM.
Lifeline se basa en un equilibrador de carga que admite el protocolo de estado de servidor/aplicación, o SASP, documentado en RFC 4678. El protocolo permite a Lifeline enviar periódicamente recomendaciones de enrutamiento a un equilibrador de carga habilitado para SASP, dirigiendo el equilibrador de carga sobre cómo enrutar conexiones de carga de trabajo a través de un conjunto de aplicaciones de carga de trabajo que pueden abarcar ambos sitios. El gestor de tráfico local de conmutación de IP grande F5 es el equilibrador de carga recomendado para usar con Lifeline.
Lifeline se comunica con los gestores de colas MQ que manejan las colas utilizadas por las cargas de trabajo y dirige el clúster IBM MQ en el que dichos gestores son elegibles para recibir mensajes IBM MQ. Tras un fallo de una carga de trabajo en un sitio, Lifeline también garantiza que los mensajes MQ varados se transfieran a los gestores IBM MQ del sitio alternativo durante un cambio de carga de trabajo.