Fehlerbehebung bei non-pureScale -automatisierter HA mit Pacemaker

Überblick über Techniken zur Fehlerbehebung, Befehle und häufige Probleme im Zusammenhang mit Pacemaker in non-pureScale HA-Bereitstellungen.

Wichtig: Ab wird die Hochverfügbarkeit durch Db2®11.5.8 gegenseitiges Failover unterstützt, wenn als integrierter Pacemaker Cluster-Manager verwendet wird. In Db2 11.5.6 und höher wird der Pacemaker -Cluster-Manager für die automatisierte Funktionsübernahme durch HADR-Bereitschaftsdatenbanken mit Db2gepackt und installiert. In Db2 11.5.5ist Pacemaker enthalten und für Produktionsumgebungen verfügbar. In Db2 11.5.4ist Pacemaker nur als Technologievorschau für Entwicklungs-, Test-und Machbarkeitsnachweisumgebungen enthalten.

Befolgen Sie die Befehle, um die Fehlerbehebung für den HADR-Cluster mit Pacemakerzu unterstützen. Die Fehlerbehebung bei Problemen im Zusammenhang mit dem Cluster-Manager beginnt fast immer mit der Überprüfung des Status aller Hosts, aller Ressourcen im Ressourcenmodell, der Quoruminformationen und weiterer Aspekte aus der Perspektive des Cluster-Managers. In der integrierten Lösung wird der Befehl db2cm -list empfohlen, der eine Gesamtansicht aller relevanten Ressourcen bietet. Dieser Abschnitt beginnt mit einer ausführlichen Erklärung der Ausgabe von db2cm -list, bevor Fehlerszenarios und deren Lösungen behandelt werden.

Beispielausgabe von db2cm -list und Erklärung:
[root@db2tea1 ~]# db2cm -list
      Cluster Status

Domain information:
Domain name               = hadom
Pacemaker version         = 2.0.2-1.db2pcmk.el8
Corosync version          = 3.0.3
Current domain leader     = db2tea1
Number of nodes           = 2
Number of resources       = 6

Node information:
Name name           State
----------------    --------
db2tea1             Online
kedge1              Online

Resource Information:

Resource Name             = db2_db2inst1_db2inst1_SAMPLE
  Resource Type                 = HADR
    DB Name                	= SAMPLE
    Managed                     = true
    HADR Primary Instance       = db2inst1
    HADR Primary Node           = db2tea1
    HADR Primary State          = Online
    HADR Standby Instance       = db2inst1
    HADR Standby Node           = kedge1
    HADR Standby State          = Online

Resource Name             = db2_db2tea1_db2inst1_0
  State                         = Online
  Managed                       = true
  Resource Type                 = Instance
    Node                        = db2tea1
    Instance Name               = db2inst1

Resource Name             = db2_db2tea1_eth1
  State                         = Online
  Managed                       = true
  Resource Type                 = Network Interface
    Node                        = db2tea1
    Interface Name              = eth1

Resource Name             = db2_kedge1_db2inst1_0
  State                         = Online
  Managed                       = true
  Resource Type                 = Instance
    Node                        = kedge1
    Instance Name               = db2inst1

Resource Name             = db2_kedge1_eth1
  State                         = Online
  Managed                       = true
  Resource Type                 = Network Interface
    Node                        = kedge1
    Interface Name              = eth1

Fencing Information:
  Not Configured
Quorum Information:
  Two-node quorum
Es gibt fünf Schlüsselkomponenten, nach denen Benutzer in der Ausgabe suchen sollten: Domain, Node, Resource, Fencing information und Quorum information.
Domäne
Domäneninformationen zeigen installierte RPM-Versionen und Domänenkonfigurationen an.
Knoten
In den Knoteninformationen werden alle konfigurierten Knoten in der Domäne und ihre aktiven Status angezeigt.
Ressource
In den Ressourceninformationen sind alle Ressourcen in der Domäne und deren Status und Konfigurationen aufgelistet. State zeigt den aktiven Status der Ressource an; Managed zeigt an, ob die Ressource inaktiviert oder aktiviert ist.
Fencing information
In den Abschirmungsinformationen wird die in der Domäne verwendete Abschirmungsmethode beschrieben.
Quorum information
Die Quoruminformationen sollten je nach konfiguriertem Quorumtyp 'Two-node quorum', 'QDevice' oder 'None' sein.
Wenn Quorum information eine QDevice-Konfiguration auflistet, unterscheidet sich die Ausgabe von der obigen Ausgabe. Sie würde ähnlich der folgenden aussehen:
[root@db2tea1 ~]# db2cm -list
      Cluster Status

Domain information:
Domain name               = hadom
Pacemaker version         = 2.0.2-1.db2pcmk.el8
Corosync version          = 3.0.3
Current domain leader     = db2tea1
Number of nodes           = 2
Number of resources       = 6

Node information:
Name name           State
----------------    --------
db2tea1             Online
kedge1              Online

Resource Information:

Resource Name             = db2_db2inst1_db2inst1_SAMPLE
  Resource Type                 = HADR
    HADR DB Name                = SAMPLE
    HADR Primary Instance       = db2inst1
    HADR Primary Node           = db2tea1
    HADR Primary State          = Online
    HADR Priamry Managed        = true

    HADR Standby Instance       = db2inst1
    HADR Standby Node           = kedge1
    HADR Standby State          = Online
    HADR Standby Managed        = true

Resource Name             = db2_db2tea1_db2inst1_0
  State                         = Online
  Managed                       = true
  Resource Type                 = Instance
    Node                        = db2tea1
    Instance Name               = db2inst1

Resource Name             = db2_db2tea1_eth1
  State                         = Online
  Managed                       = true
  Resource Type                 = Network Interface
    Node                        = db2tea1
    Interface Name              = eth1

Resource Name             = db2_kedge1_db2inst1_0
  State                         = Online
  Managed                       = true
  Resource Type                 = Instance
    Node                        = kedge1
    Instance Name               = db2inst1

Resource Name             = db2_kedge1_eth1
  State                         = Online
  Managed                       = true
  Resource Type                 = Network Interface
    Node                        = kedge1
    Interface Name              = eth1

Fencing Information:
  Not Configured
Quorum Information:
  Qdevice

Qdevice information
-------------------
Model:			Net
Node ID:		1
Configured node list:
    0	Node ID = 1
    1	Node ID = 2
Membership node list:	1, 2

Qdevice-net information
----------------------
Cluster name:		hadom
QNetd host:		tierce1:5403
Algorithm:		LMS
Tie-breaker:		Node with lowest node ID
State:			Connected

Wenn Sie den Db2 -Support beauftragen, ein Problem mit der Pacemaker -Automatisierung zu analysieren, sollten Diagnosedaten so bald wie möglich erfasst werden. Alle erforderlichen Pacemaker -Diagnoseprogramme werden erfasst, wenn der Befehl db2support ausgeführt wird, der auf beiden Hosts ausgeführt werden muss, um ein vollständiges Bild zu erhalten.

Falls bei der Ausführung eines db2cm-Befehls ein Problem auftritt, müssen zusätzlich zu den db2support-Diagnosedaten auch die db2cm-Protokolle erfasst und in den Supportfall hochgeladen werden. Bei jeder Ausführung von db2cm wird eine neue Protokolldatei im Verzeichnis /tmp erstellt. Der Name des db2cm-Protokolls enthält die Zeitmarke der Befehlsausführung. Beispiel:
/tmp/db2cm.run.log.20200123

Lesen Sie Folgendes, um weitere Informationen zur Fehlerbehebung bei bestimmten Problemen zu erhalten: