IBM PureData System for Analytics, Version 7.1

Detección del error de cerebro dividido

Acerca de esta tarea

Cerebro dividido es un estado de error que se produce cuando las imágenes de los datos de cada host de IBM® Netezza son diferentes. Por lo general, se produce cuando la sincronización está inhabilitada y los usuarios modifican los datos de manera independiente en cada host de Netezza. Como resultado de ello, las dos imágenes de host de Netezza son diferentes y resulta difícil resolver cuál de las imágenes es la más reciente y la correcta.

Importante: El error de cerebro dividido no se produce se se ha habilitado la agrupación en clúster. Los controles de barrera evitan que los usuarios puedan modificar los datos duplicados en el nodo en espera. Permita que la administración de DRBD pueda ser controlada mediante señal de monitorización para evitar problemas de cerebro dividido.

Sin embargo, si se produce un problema de cerebro dividido, se grabará el siguiente mensaje en el archivo /var/log/messages:

Error de cerebro dividido; descartando conexión.

Aunque DRBD no cuenta con procesos de corrección automáticos para resolver las situaciones de cerebro dividido, la implementación de Netezza inhabilita la corrección automática. Se requiere la intervención manual, que es la mejor manera de asegurarse de que se restauran el mayor número de cambios de datos posible.

Para detectar y reparar el error de división de cerebro, trabaje en colaboración con el Servicio de soporte de Netezza para llevar a cabo el siguiente procedimiento:

Procedimiento

Localice Split en /var/log/messages, por lo general en el host en el que intente crear el host primario/activo. Deje que DRBD detecte este problema.
Dado que el error de división de cerebro se deriva de la ejecución de ambas imágenes como hosts primarios de Netezza sin sincronización, compruebe los registros de Netezza en ambos hosts. Por ejemplo, compruebe los archivos pg.log en ambos hosts para ver si se producen actualizaciones y cuándo. Si existe un solapamiento de las horas, ambas imágenes tendrán una información distinta.
Identifique qué imagen de host, si hay alguna, es la imagen correcta. En algunos casos, ninguna de las dos imágenes de host es la totalmente correcta. Debe elegir la imagen que sea más correcta. El host que tenga la imagen que decida que es correcta será el "superviviente" y el otro host, la "víctima".
Lleve a cabo el procedimiento siguiente:
1. Inicie sesión en el host víctima y ejecute estos mandatos:
```
drbdadm secondary resource
drbdadm disconnect resource
drbdadm -- --discard-my-data connect resource
```
  donde resource puede ser r0, r1 o all.
  Lleve a cabo estos pasos para los recursos de uno en uno, es decir, ejecute todos los mandatos de los pasos a. y b. para r0 y luego repítalos todos para r1. Existe la opción all, pero utilícela con prudencia. Los mandatos de recursos individuales normalmente funcionan de forma más efectiva.
2. Inicie sesión en el host superviviente como root y ejecute este mandato:
```
drbdadm connect resource
```
  donde resource puede ser r0, r1 o all
  Nota: El mandato de conexión puede mostrar un error indicándole que debe ejecutar primero drbdadm disconnect.
Compruebe el estado del arreglo utilizando los mandatos drbdadm primary resource y service drbd status. Asegúrese de que ejecuta drbdadm secondary resource antes de iniciar Heartbeat.