IBM Turbonomic

Accélérez les opérations informatiques, améliorez les performances des applications et minimisez les coûts liés au cloud

Voir la démo interactive Réserver une démo en direct

IBM Multi-site Workload Lifeline (Lifeline) permet d’équilibrer intelligemment la charge des transactions critiques en influençant le routage des connexions pour les workloads TCP/IP et des messages pour les workloads de cluster IBM MQ. Le routage est effectué sur deux sites afin d’assurer une disponibilité quasi continue.

En cas de panne, IBM Multi-site Workload Lifeline permet de réduire de plusieurs heures à quelques minutes le temps de reprise des workloads critiques par rapport à une reprise après sinistre traditionnelle. Le temps de reprise en cas de panne non planifiée est réduit grâce à la détection des défaillances du workload et au reroutage vers un autre site. L’impact des pannes planifiées est atténué grâce au basculement des workloads vers un autre site avec un minimum d’interruption.

Avantages Améliorez les performances

Les nouvelles connexions de workloads sont acheminées vers les applications, les serveurs et les systèmes les plus à même de les traiter, ce qui permet de réduire le temps de réponse des transactions. Les ressources système sont utilisées plus efficacement.

Parvenir à un niveau de disponibilité plus élevé

En cas de panne d’une application, d’un système ou d’un site, les nouvelles connexions de workloads sont acheminées vers d’autres applications disponibles. Les interruptions pour les mises à jour de maintenance ou d’autres événements planifiés peuvent être minimisées.

Améliorer l’évolutivité

Ajoutez des instances d’application à la demande. Contrôlez et incluez automatiquement les instances ajoutées dans les décisions de routage du workload.

Réduire le délai de reprise

Réduisez le temps de réponse en alignant les nouvelles connexions de workloads avec les applications et les systèmes les plus performants. Le délai de reprise après une défaillance du workload peut passer de plusieurs heures à quelques minutes.

Améliorer la migration et l’utilisation du workload

Acheminez les workloads d’un site à l’autre avec un minimum de perturbations. Les connexions pour les workloads de requête peuvent être distribuées sur les deux sites simultanément.

Simplifier les procédures de reprise après sinistre

Simplifiez les tests des procédures de reprise après sinistre en confirmant que les workloads restent accessibles sur le site de reprise, sans qu’une interruption du site de production ne soit nécessaire.

IBM Multi-site Workload Lifeline peut nous aider à savoir si un site est normal et si les données sont synchronisées. Ce n’est que lorsqu’IBM Multi-site Workload Lifeline est déployé qu’IBM GDPS Continuous Availability (GDPS AA) peut achever le basculement du workload pour atteindre une disponibilité continue. Responsable senior du centre de données Une grande banque asiatique
Fonctionnalités
Équilibrage de charge des workloads

Lifeline utilise deux niveaux d’équilibrage de charge pour les workloads ciblant les applications TCP/IP. Lifeline demande aux équilibreurs de charge de premier niveau d’acheminer les connexions de workloads vers les équilibreurs de charge de second niveau du site sélectionné, qui acheminent ensuite les connexions vers les applications du site. Lifeline s’appuie sur les clusters IBM MQ pour les workloads qui utilisent la messagerie. La solution demande au cluster d’acheminer les messages du workload vers les gestionnaires de file d’attente IBM MQ sur le site sélectionné, qui mettent ensuite les messages à la disposition des applications.

Recommandations de routage du site

Pour les workloads qui utilisent deux niveaux d’équilibreurs de charge, Lifeline fournit aux équilibreurs de charge de premier niveau des recommandations de routage de connexion de site basées sur la disponibilité et l’état des applications du workload, des systèmes z/OS et (le cas échéant) des systèmes Linux on IBM Z sur les deux sites. Pour les workloads qui utilisent des clusters IBM MQ, Lifeline donne au cluster des recommandations de routage de messages sur site basées sur la disponibilité et la santé des gestionnaires de file d’attente IBM MQ et des systèmes z/OS sur les deux sites.

Agents de Lifeline

Un Agent est démarré sur chaque système z/OS et Linux on Z Management Guest où les workloads sont présents, sur les deux sites. L’Agent est chargé de surveiller les applications de workload qui résident sur son système et de transmettre ces informations à un Conseiller Lifeline. L’Agent sur z/OS est également chargé de communiquer avec un gestionnaire de files d’attente MQ afin de surveiller et d’influencer le routage des messages MQ au sein d’un cluster MQ.

Conseillers Lifeline

Un Conseiller Lifeline est démarré sur un système z/OS et peut être démarré en tant que Conseiller principal ou secondaire. Le Conseiller primaire communique avec tous les Agents Lifeline pour déterminer la disponibilité du workload. Il fournit des règles de distribution des messages MQ aux Agents pour les clusters MQ et des recommandations de routage aux équilibreurs de charge pour les connexions TCP de ces workloads. Un Conseiller secondaire surveille la disponibilité du conseiller primaire et reprend la responsabilité du Conseiller primaire dans le cas où celui-ci est défaillant.

Configurations des workloads

Chaque workload configuré pour Multi-site Workload Lifeline est classé comme workload actif/de réserve ou actif/requête.

  • Un workload actif/standby est actif sur un site. Lifeline demande aux équilibreurs de charge d’acheminer les connexions entrantes vers le site actif. Lorsque des mises à jour de base de données sont effectuées, la réplication du logiciel de base de données communique ces modifications de manière asynchrone de l’instance active du workload à l’instance en veille du workload. Sur le site de secours, l’instance en attente du workload est active et prête à recevoir les tâches. Les données actualisées du site actif sont appliquées au sous-système de base de données fonctionnant sur le site de secours en temps quasi réel.

  • Un workload actif/requête peut être actif sur l’un des sites ou sur les deux. Lifeline donne des recommandations de routage aux équilibreurs de charge afin d’équilibrer intelligemment les connexions entre les deux sites. Lorsque des mises à jour de base de données sont effectuées par le workload actif/standby associé, la latence de réplication de la base de données est surveillée par Lifeline pour veiller à ce que les connexions ne soient pas acheminées vers un site si la base de données répliquée sur ce site contient des données trop obsolètes par rapport à la base de données sur le site actif.
Types de workloads

Lifeline peut prendre en charge de nombreux types de workloads qui résident sur z/OS ou Linux on Z :

  • Applications basées sur TCP telles que les sockets CICS ou les serveurs HTTP

  • Applications SNA accessibles à partir d’un serveur TCP tel que TN3270

  •  Applications MQ qui reçoivent des messages d’un cluster MQ défini sur z/OS

  •  Sous-systèmes Db2 accessibles via la messagerie DRDA

  •  Applications basées sur le protocole TCP exécutées sur des clients Linux on Z, telles que WebSphere Application Server
Configuration requise

Configuration logicielle requise

  • La virtualisation sur z/VM nécessite la version V5R3 ou plus récente.
  • La virtualisation sur z/OS nécessite la version z/OS V2R1 ou une version plus récente exécutant Communications Server for z/OS.

Configuration matérielle requise

  • Tout système z pouvant exécuter z/OS V2R1 ou supérieur et utilise la pile TCP/IP du serveur de communication pour z/OS.
Ressources IBM Multi-site Workload Lifeline

Découvrez comment IBM Multi-site Workload Lifeline joue un rôle essentiel dans la résolution de problèmes majeurs dans l’entreprise.

Équilibrage de charge avec IBM Multi-site Workload Lifeline

Découvrez comment équilibrer intelligemment les workloads TCP/IP tout en garantissant une disponibilité quasi continue.

Produits associés IBM z/OS Communications Server

Plateforme sécurisée pour le développement et le partage des workloads du mainframe.

IBM GDPS

Automatisez les tâches du mainframe et la reprise après incident pour atteindre vos objectifs de résilience.

Réplication des données IBM Infosphere

Prenez en charge les initiatives d’intégration et de consolidation des big data, d’entreposage et d’analyse à grande échelle grâce à la capture des données de changement basée sur les journaux et à l’intégrité transactionnelle.

FAQ

Comment IBM Multi-site Workload Lifeline permet une disponibilité continue ?

Lifeline surveille les applications de workload et les systèmes dans lesquels ces applications résident, dans les deux sysplexes, ou sites, où ces systèmes sont exécutés. Lifeline contrôle le routage des connexions et des messages MQ destinés à ces applications de workload, en veillant à ce que les connexions et les messages MQ soient transmis aux applications de workload optimales dans le(s) site(s) actif(s).
Si Lifeline détecte une défaillance du workload sur le site actif, la solution peut automatiquement basculer le workload, en quelques secondes, vers les applications du workload du site alternatif. Elle peut également générer des messages d’alerte que les produits d’automatisation peuvent capturer pour effectuer leur propre basculement de workload.

Mon entreprise a-t-elle besoin d’une disponibilité continue des workloads ?

Si votre entreprise est concernée par l’une des situations suivantes, une disponibilité continue de vos workloads est nécessaire.

  • Votre entreprise doit fonctionner 24 h/24 et 7 j/7 en raison des réglementations du secteur.
  • D’autres entreprises dépendent de la disponibilité continue de votre entreprise, par exemple si votre entreprise est active dans les secteurs de la finance et de l’assurance.
  • Votre entreprise n’a mis en place aucune procédure de reprise, par exemple avec des environnements non sysplex et aucune fonctionnalité de réplication sur disque
En quoi la disponibilité continue est-elle différente de la reprise après incident ?

Les solutions de reprise après sinistre existantes utilisent la réplication sur disque pour effectuer des copies miroir vers un site distant de tous les disques utilisés par les systèmes du site local. Ces copies de disques ne peuvent pas être utilisées au cours de la réplication des disques. En cas de panne sur le site local, les systèmes et les applications de workload doivent être relancés sur le site distant avant que l’accès aux workloads ne soit rétabli. En règle générale, cette opération peut prendre une heure, voire plus.
Avec les solutions de disponibilité continue basées sur Lifeline, la réplication logicielle des données, telle que InfoSphere Data Replication for Db2, est utilisée pour assurer la synchronisation des données entre les sites locaux et distants. La principale différence réside dans le fait que les systèmes des deux sites sont actifs et que Lifeline intervient pour surveiller les workloads sur les deux sites. En cas de défaillance du site local, Lifeline détecte la défaillance du workload et achemine toutes les nouvelles connexions au workload vers le site alternatif. L’accès aux workloads est ainsi rétabli en quelques secondes, au lieu d’une heure ou plus avec les solutions de reprise après sinistre.

En quoi Lifeline fait partie intégrante de la solution GDPS Continuous Availability ?

Lifeline, grâce à sa surveillance et à son routage des workloads, joue un rôle essentiel dans la solution de disponibilité continue GDPS et offre les avantages suivants :

  • Performances améliorées : les nouvelles connexions de workloads sont acheminées vers les applications, les serveurs et les systèmes les plus à même de les traiter, ce qui permet de réduire le temps de réponse des transactions. Les ressources système sont utilisées plus efficacement.
  • Amélioration de la disponibilité : les nouvelles connexions de workloads peuvent être acheminées vers les applications et les systèmes disponibles lorsque certains sont en panne. Les interruptions pour les mises à jour de maintenance ou d’autres événements planifiés peuvent être minimisées.
  • Réduction du délai de reprise : réduisez l’objectif de temps de reprise de plusieurs heures à quelques minutes. Avec la réplication de disque, les solutions traditionnelles de reprise après sinistre récupèrent sur le site de secours en redémarrant les systèmes ou les applications. Cela prend normalement des heures et les services informatiques sont indisponibles pendant cette période. Avec Lifeline, qui fonctionne dans le cadre de la solution de disponibilité continue de GDPS, le workload peut être basculé sur le site de secours en quelques minutes.
En savoir plus
Est-ce que Lifeline n’est disponible que dans le cadre de la solution GDPS Continuous Availability ?

Non. Bien que la solution Lifeline soit généralement utilisée comme partie intégrante de la solution GDPS Continuous Availability, elle peut également être déployée en dehors de cette solution.
Si votre entreprise dispose de ses propres capacités d’automatisation, vous pouvez utiliser Lifeline, ainsi qu’un logiciel de réplication des données, pour assurer la synchronisation des données sur les deux sites.
Dans d’autres cas, si votre entreprise dispose d’applications de workload qui ne sont pas compatibles avec sysplex, vous ne pouvez pas utiliser la solution GDPS Continuous Availability. En utilisant Lifeline, ainsi qu’un produit de réplication des données pour assurer la synchronisation des données sur les deux sites, vous obtiendrez une récupération de type "sysplex" pour ces types de workloads.

En savoir plus
Comment Lifeline réduit-elle la fenêtre de maintenance pour les pannes planifiées ?

Lifeline permet d’effectuer un basculement en douceur des applications et de leurs sources de données, appelées workloads par Lifeline, lors d’interruptions planifiées. En utilisant de simples commandes Lifeline, la migration des workloads d’un site à l’autre peut être facilement effectuée, minimisant ainsi les temps d’arrêt pour les événements planifiés tels que les activités de maintenance programmées.

En savoir plus
Comment Lifeline offre-t-elle une disponibilité quasi continue pour les workloads critiques lors d’interruptions imprévues ?

Lifeline augmente la disponibilité car les nouvelles connexions et les nouveaux messages peuvent être acheminés en dehors des applications et des systèmes workloads défaillants. Lifeline réduit les temps de réponse en acheminant les connexions et les messages vers des applications et des systèmes workload ayant une capacité de travail supplémentaire et réduit le temps de reprise de plusieurs heures à quelques minutes.

Les workloads fonctionnant sur un site doivent-ils tous être initialement configurés pour Lifeline ?

Non. L’un des nombreux avantages de Lifeline est qu’il ne s’agit pas d’une solution « tout ou rien », comme le sont généralement les solutions de reprise après sinistre. Seuls les workloads les plus critiques sont configurés sur Lifeline pour assurer une disponibilité continue, tandis que tous les autres workloads, y compris les lots, sont récupérés à l’aide des procédures de reprise après sinistre existantes. De plus, il est possible d’ajouter des workloads supplémentaires à Lifeline à tout moment.

Quelles sont les caractéristiques d’un workload, au regard de Lifeline ?

Les caractéristiques d’un workload dépendent du type de workload. Dans le cas des workloads basés sur TCP, il s’agit des adresses IP et des numéros de port des applications TCP. Pour les workloads basés sur SNA, il s’agit des noms des applications SNA. Pour les workloads basés sur MQ, il s’agit des files d’attente du cluster MQ et des gestionnaires de files d’attente MQ où sont envoyés les messages MQ pour les workloads. Pour les workloads basés sur Db2 DRDA, il s’agit des adresses IP et des numéros de port des alias Db2 et des sous-systèmes Db2. Pour les workloads Linux on Z, il s’agit des invités Linux on Z fonctionnant sur zVM.

Comment la solution Lifeline contrôle-t-elle le routage des connexions vers les applications de workload ?

Lifeline s’appuie sur un équilibreur de charge qui prend en charge le protocole Server/Application State Protocol (SASP), décrit dans le document RFC 4678. Ce protocole permet à Lifeline de transmettre périodiquement des recommandations de routage à un équilibreur de charge compatible SASP, en lui indiquant comment acheminer les connexions de workloads dans un ensemble d’applications de workloads qui peuvent s’étendre sur les deux sites. Le F5 Big-IP Switch Local Traffic Manager est l’équilibreur de charge recommandé pour Lifeline.

Comment Lifeline contrôle-t-elle le routage des messages MQ pour les workloads ?

Lifeline communique avec les gestionnaires de files d’attente MQ en charge des files d’attente utilisées par les workloads et indique au cluster MQ les gestionnaires de files d’attente MQ aptes à recevoir des messages MQ. En cas de défaillance d’un workload sur un site, Lifeline veille également à ce que les messages MQ bloqués soient transférés vers les gestionnaires MQ du site alternatif lors d’un basculement du workload.

Etapes suivantes

Multisite Workload Lifeline permet de réduire le temps de restauration des workloads critiques en cas de panne. 

Autres moyens d’information Documentation Support Financement global