[Linux]

Sostituzione di un nodo non riuscito in una configurazione di disaster recovery

Se si perde uno dei nodi in una configurazione di disaster recovery, è possibile sostituire il nodo e ripristinare la configurazione del disaster recovery seguendo questa procedura.

Informazioni su questa attività

Se si verifica un disastro tale che il nodo nel sito principale sia oltre la riparazione, è possibile sostituire il nodo non riuscito mentre il gestore code viene eseguito sul nodo di ripristino e quindi ripristinare la configurazione originale del disaster recovery. Il nodo di sostituzione deve assumere l'identità del nodo non riuscito: il nome e l'indirizzo IP devono essere uguali.

È necessario essere collegati come root o collegati come un utente che appartiene al gruppo mqm ed ha la necessaria configurazione sudo.

Procedura

In seguito alla perdita del gestore code sul sito principale, effettuare le seguenti operazioni:

  1. Sul nodo di ripristino, eseguire i seguenti comandi per rendere il gestore della coda secondario assumere il ruolo primario:
    rdqmdr -m QMname -p
    Dove QMname è il nome del gestore code.
  2. Richiamare il comando che sarà necessario eseguire sul nodo principale di sostituzione per riconfigurare il disaster recovery:
    rdqmdr -m QMname -d
    Copiare l'output di questo comando.
  3. Esegui il seguente comando per avviare il gestore code:
    strmqm QMname
    
  4. Verificare che le tue applicazioni si ricollegino al gestore code sul nodo di ripristino. A condizione che tu abbia definito i tuoi canali con un elenco di nomi di connessione alternativi, specificando i tuoi responsabili della coda primaria e secondaria, allora le tue applicazioni si colleterranno automaticamente al nuovo gestore della coda principale.
  5. Sostituire il nodo non riuscito sul proprio sito principale e configurarlo per avere lo stesso nome e indirizzo IP utilizzato per il disaster recovery sul nodo originale. Quindi, configurare il ripristino di emergenza eseguendo il comando crtmqm copiato nel passo 2. Ora si dispone di un'istanza secondaria del gestore code e l'istanza principale sincronizza i suoi dati con l'istanza secondaria.
  6. Fine dell'istanza principale corrente.
  7. Dopo aver completato la sincronizzazione, rendere l'istanza primaria che si sta eseguendo sul nodo di ripristino nel secondario ancora una volta:
    rdqmdr -m QMname -s
  8. Sul nodo principale di sostituzione, rendere l'istanza secondaria del gestore code nell'istanza primaria:
    rdqmdr -m QMname -p
  9. Sul nodo principale di sostituzione, avviare il gestore code:
    strmqm QMname
    
    Ora è stata ripristinata la configurazione come era prima del guasto al sito principale.