Resolución de problemas de HA automatizada non-pureScale con Pacemaker

Resumen de técnicas de solución de problemas, comandos y problemas comunes relacionados con el gestor de clústeres Pacemaker en implantaciones de HA automatizada non-pureScale.

Importante: En Db2®11.5.8 y versiones posteriores, se admite la alta disponibilidad de conmutación por error mutua cuando se utiliza Pacemaker como administrador de clústeres integrado. En Db2 11.5.6 y posteriores, el gestor de clúster de Pacemaker para la migración tras error automatizada a bases de datos en espera HADR se empaqueta e instala con Db2. En Db2 11.5.5, Pacemaker se incluye y está disponible para entornos de producción. En Db2 11.5.4, Pacemaker se incluye solo como vista previa de tecnología, para entornos de desarrollo, prueba y prueba de concepto.

Siga los mandatos para ayudarle a resolver problemas del clúster HADR con Pacemaker. La resolución de problemas relacionados con el gestor de clúster casi siempre empieza con la comprobación del estado de todos los hosts, todos los recursos del modelo de recursos, la información de quórum y más, desde la perspectiva del gestor de clústeres. Con la solución integrada, se recomienda el mandato db2cm -list para proporcionar una única vista de todos los recursos relevantes. Esta sección empieza con una explicación detallada de la salida de db2cm -list antes de pasar por los casos de error y sus resoluciones.

Ejemplo de salida y explicación de db2cm -list:
[root@db2tea1 ~]# db2cm -list
      Cluster Status

Domain information:
Domain name               = hadom
Pacemaker version         = 2.0.2-1.db2pcmk.el8
Corosync version          = 3.0.3
Current domain leader     = db2tea1
Number of nodes           = 2
Number of resources       = 6

Node information:
Name name           State
----------------    --------
db2tea1             Online
kedge1              Online

Resource Information:

Resource Name             = db2_db2inst1_db2inst1_SAMPLE
  Resource Type                 = HADR
    DB Name                	= SAMPLE
    Managed                     = true
    HADR Primary Instance       = db2inst1
    HADR Primary Node           = db2tea1
    HADR Primary State          = Online
    HADR Standby Instance       = db2inst1
    HADR Standby Node           = kedge1
    HADR Standby State          = Online

Resource Name             = db2_db2tea1_db2inst1_0
  State                         = Online
  Managed                       = true
  Resource Type                 = Instance
    Node                        = db2tea1
    Instance Name               = db2inst1

Resource Name             = db2_db2tea1_eth1
  State                         = Online
  Managed                       = true
  Resource Type                 = Network Interface
    Node                        = db2tea1
    Interface Name              = eth1

Resource Name             = db2_kedge1_db2inst1_0
  State                         = Online
  Managed                       = true
  Resource Type                 = Instance
    Node                        = kedge1
    Instance Name               = db2inst1

Resource Name             = db2_kedge1_eth1
  State                         = Online
  Managed                       = true
  Resource Type                 = Network Interface
    Node                        = kedge1
    Interface Name              = eth1

Fencing Information:
  Not Configured
Quorum Information:
  Two-node quorum
Hay cinco componentes clave que los usuarios deben buscar en la salida: Domain, Node, Resource, Fencing informationy Quorum information.
Dominio
La información de dominio muestra las versiones RPM y las configuraciones de dominio instaladas.
Nodo
La información de nodo muestra todos los nodos configurados en el dominio y sus estados activos.
Recurso
La información de recursos lista todos los recursos del dominio y sus estados y configuraciones. La State muestra el estado activo del recurso y Managed muestra que el recurso está inhabilitado o habilitado.
Información de barreras
La información de barreras describe el método de barreras utilizado en el dominio.
Información de quórum
La información de quórum debe ser relativa a quórum de dos nodos, QDevice o ninguna, en función del tipo de quórum configurado
Si el Quorum information lista una configuración de QDevice, la salida sería diferente en comparación con la salida anterior. El resultado tendrá un aspecto similar al siguiente:
[root@db2tea1 ~]# db2cm -list
      Cluster Status

Domain information:
Domain name               = hadom
Pacemaker version         = 2.0.2-1.db2pcmk.el8
Corosync version          = 3.0.3
Current domain leader     = db2tea1
Number of nodes           = 2
Number of resources       = 6

Node information:
Name name           State
----------------    --------
db2tea1             Online
kedge1              Online

Resource Information:

Resource Name             = db2_db2inst1_db2inst1_SAMPLE
  Resource Type                 = HADR
    HADR DB Name                = SAMPLE
    HADR Primary Instance       = db2inst1
    HADR Primary Node           = db2tea1
    HADR Primary State          = Online
    HADR Priamry Managed        = true

    HADR Standby Instance       = db2inst1
    HADR Standby Node           = kedge1
    HADR Standby State          = Online
    HADR Standby Managed        = true

Resource Name             = db2_db2tea1_db2inst1_0
  State                         = Online
  Managed                       = true
  Resource Type                 = Instance
    Node                        = db2tea1
    Instance Name               = db2inst1

Resource Name             = db2_db2tea1_eth1
  State                         = Online
  Managed                       = true
  Resource Type                 = Network Interface
    Node                        = db2tea1
    Interface Name              = eth1

Resource Name             = db2_kedge1_db2inst1_0
  State                         = Online
  Managed                       = true
  Resource Type                 = Instance
    Node                        = kedge1
    Instance Name               = db2inst1

Resource Name             = db2_kedge1_eth1
  State                         = Online
  Managed                       = true
  Resource Type                 = Network Interface
    Node                        = kedge1
    Interface Name              = eth1

Fencing Information:
  Not Configured
Quorum Information:
  Qdevice

Qdevice information
-------------------
Model:			Net
Node ID:		1
Configured node list:
    0	Node ID = 1
    1	Node ID = 2
Membership node list:	1, 2

Qdevice-net information
----------------------
Cluster name:		hadom
QNetd host:		tierce1:5403
Algorithm:		LMS
Tie-breaker:		Node with lowest node ID
State:			Connected

Al interactuar con el soporte de Db2 para analizar un problema con la automatización de Pacemaker , los diagnósticos deben recopilarse lo antes posible. Todos los diagnósticos de Pacemaker necesarios se recopilan al ejecutar el mandato db2support que se debe ejecutar en ambos hosts para tener una imagen completa.

Si se encuentra un problema al ejecutar un mandato db2cm, los registros de db2cm también se deben recopilar y subir al caso de soporte además de db2support. Cada vez que se ejecute un mandato db2cm, se creará un nuevo archivo de registro bajo el directorio /tmp. El nombre de registro de db2cm incluirá la indicación de fecha y hora de cuando se ejecutó el mandato. Por ejemplo:
/tmp/db2cm.run.log.20200123

Consulte lo siguiente para obtener más información sobre problemas específicos: