![[IBM MQ Advanced]](ngadv.gif)
![[Linux]](nglinux.gif)
Alta disponibilità RDQM
RDQM (replicated data queue manager) è una soluzione alta disponibilità disponibile su piattaforme Red Hat® Enterprise Linux® per x86-64 .
Una configurazione RDQM è composta da tre server configurati in un gruppo HA (High Availability), ciascuno con una istanza del gestore code. Un'istanza è il gestore code in esecuzione, che replica in modo sincrono i dati nelle altre due istanze. Se il server su cui è in esecuzione questo gestore code ha esito negativo, viene avviata un'altra istanza del gestore code con cui devono operare i dati correnti. Le tre istanze del gestore code possono facoltativamente condividere un indirizzo IP mobile, quindi i client devono essere configurati solo con un singolo indirizzo IP. È possibile eseguire una sola istanza del gestore code alla volta, anche se il gruppo HA viene suddiviso in partizioni a causa di problemi di rete. Il server che esegue il gestore code è noto come 'primario ', ciascuno degli altri due server è noto come 'secondario'.
Tre nodi sono utilizzati per ridurre notevolmente la possibilità che si verifichi una situazione di divisione del cervello. In un sistema ad alta disponibilità a due nodi, la divisione del cervello può verificarsi quando la connettività tra i due nodi è interrotta. Senza connettività, entrambi i nodi potrebbero eseguire il gestore code contemporaneamente, accumulando dati differenti. Quando la connessione viene ripristinata, ci sono due versioni differenti dei dati (un 'split-brain ') e l'intervento manuale è richiesto per decidere quale serie di dati conservare e quale scartare.
- Se si verifica un malfunzionamento di un singolo nodo, il gestore code può essere eseguito su uno degli altri due nodi. In caso di errore di due nodi, il gestore code non può essere eseguito sul nodo rimanente perché il nodo non ha il quorum (il nodo rimanente non può indicare se gli altri due nodi hanno avuto esito negativo o se sono ancora in esecuzione e hanno perso la connettività).
- Se un singolo nodo perde la connettività, il gestore code non può essere eseguito su questo nodo perché il nodo non ha il quorum. Il gestore code può essere eseguito su uno dei due nodi rimanenti, che hanno il quorum. Se tutti i nodi perdono la connettività, il gestore code non può essere eseguito su nessuno dei nodi, poiché nessuno dei nodi ha il quorum.
La configurazione del gruppo dei tre nodi è gestita da Pacemaker. La replica tra i tre nodi è gestita d DRBD (Per informazioni su Pacemaker, consultare il sito https://clusterlabs.org/pacemaker/; per informazioni su DRBD, consultare il sito https://docs.linbit.com/docs/users-guide-9.0/.)
È possibile eseguire il backup dei gestori di code di dati replicati utilizzando la procedura descritta in Backup dei dati dei gestori di code. L'arresto del gestore code e il backup non ha alcun effetto sul monitoraggio del nodo eseguito dalla configurazione RDQM.
La seguente figura mostra una distribuzione tipica con un RDQM in esecuzione su ognuno dei tre nodi nel gruppo HA.

Nella figura successiva, Node3 ha avuto esito negativo, i collegamenti Pacemaker sono stati persi e il gestore code QM3 viene invece eseguito sul Node2 .
