Entradas del registro de errores de desasignación

Tres mensajes diferentes de registro de errores se asocian a la desasignación de CPU.

A continuación se muestran unos ejemplos.

formato corto de errpt - resumen
En el ejemplo siguiente se muestran las entradas visualizadas por mandato errpt (sin opciones):
# errpt
IDENTIFICADOR  IND._HORA   T  C  NOMBRE_RECURSO  DESCRIPCIÓN
804E987A       1008161399  I  O  proc4           CPU DESASIGNADA
8470267F       1008161299  T  S  proc4           DESASIGNACIÓN DE CPU CANCELADA
1B963892       1008160299  P  H  proc4           ANOMALÍA DE CPU PREVISTA
#
  • Si la desasignación de procesador está habilitada, el mensaje de ANOMALÍA DE CPU PREVISTA siempre va seguido del mensaje CPU DESASIGNADA o el mensaje DESASIGNACIÓN DE CPU CANCELADA ANORMALMENTE.
  • Si la desasignación de procesador no está habilitada, sólo se anota cronológicamente el mensaje ANOMALÍA DE CPU PREVISTA. La habilitación de la desasignación del procesador en cualquier momento posterior a la anotación cronológica de uno o varios mensajes ANOMALÍA DE CPU PREVISTA inicia el proceso de desasignación y da lugar a una entrada en el registro de errores del éxito o anomalía, según se describe más arriba, para cada procesador que se ha informado que falla.
formato largo de errpt - descripción detallada
El siguiente formato es la salida obtenida con errpt -a:
  • CPU_FAIL_PREDICTED

    Descripción del error: Anomalía de procesador prevista

    Este error indica que el hardware ha detectado que un procesador tiene una alta probabilidad de fallar en un futuro próximo. Siempre se anota cronológicamente, no importa si la desasignación del procesador está habilitada o no.

    DATOS DE DETALLE: Número de procesador físico, ubicación

    Ejemplo de entrada de registro de errores - formato largo
    		ETIQUETA:			CPU_FAIL_PREDICTED
    		IDENTIFICADOR:		1655419A
    
    		Fecha/Hora:		Jue Sep 30 13:42:11
    		Número de secuencia:	53
    		Id de máquina:		00002F0E4C00
    		Id de nodo:		auntbea
    		Clase:			H
    		Tipo:			PEND
    		Nombre de recurso:		proc25
    		Clase de recurso:		procesador
    		Tipo de recurso:		proc_rspc
    		Ubicación:		00-25
    
    	Descripción
    		ANOMALÍA DE CPU PREVISTA
    
    	Causas probables
    	ANOMALÍA DE CPU
    	Causas de anomalía
    	ANOMALÍA DE CPU
    		Acciones recomendadas
    				ASEGÚRESE DE QUE LA MODALIDAD DE CPU GARD ESTÁ HABILITADA
    				EJECUTE LOS DIAGNÓSTICOS DEL SISTEMA.
    
    	Datos de detalle
    	DATOS DEL PROBLEMA
    	0144	1000	0000	003A	8E00	9100	1842	1100	1999	0930	4019
    	0000	0000	0000	0000	0000
    	0000	0000	0000	0000	0000	0000	0000	0000	4942	4D00	5531
    	2E31	2D50	312D	4332	0000
    	0002	0000	0000	0000	0000	0000	0000	0000	0000	0000	0000
    	0000	0000	0000	0000	0000
    	0000	0000	0000	0000	0000	0000	0000	0000	0000	0000	0000
    	0000	0000	0000	0000	0000
    	...	...	...	...	...
    
  • CPU_DEALLOC_SUCCESS

    Descripción del error: Un procesador se ha desasignado satisfactoriamente tras la detección de una anomalía de procesador prevista. Este mensaje se anota cronológicamente cuando la desasignación del procesador está habilitada y cuando la CPU se ha desasignado satisfactoriamente.

    DATOS DE DETALLE: Número de CPU lógica de procesador desasignado.

    Ejemplo: entrada de registro de errores - formato largo:
    		ETIQUETA:			CPU_DEALLOC_SUCCESS
    		IDENTIFICADOR:		804E987A
    
    		Fecha/Hora:		Jue Sep 30 13:44:13
    		Número de secuencia:	63
    		Id de máquina:		00002F0E4C00
    		Id de nodo:		auntbea
    		Clase:			O
    	Tipo:            INFO
    		Nombre de recurso:		proc24
    
    	Descripción
    	CPU DESASIGNADA
    
    		Acciones recomendadas
    				SE NECESITA MANTENIMIENTO DEBIDO A ANOMALÍA DE CPU
    
    	Datos de detalle
    		NÚMERO DE CPU LÓGICA DESASIGNADA
    
    		0
    En este ejemplo, proc24 se ha desasignado satisfactoriamente y era la CPU lógica 0 cuando se ha producido la anomalía.
  • CPU_DEALLOC_FAIL

    Descripción del error: Una desasignación de procesador no ha sido satisfactoria debido a una anomalía de procesador prevista. Este mensaje se anota cronológicamente cuando la desasignación de CPU está habilitada, y cuando la CPU no se ha desasignado satisfactoriamente.

    DATOS DE DETALLE: Código de razón, número de CPU lógica, información adicional según el tipo de anomalía.

    El código de razón es un valor hexadecimal numérico. Los posibles códigos de razón son:
    Elemento Descripción
    2 Uno o varios procesos o hebras permanecen vinculados a la última CPU lógica. En este caso, los datos detallados ofrecen los PID de los procesos infractores.
    3 Un controlador registrado o extensión de kernel ha devuelto un error cuando se le ha notificado. En este caso, el campo de datos detallados contiene el nombre del controlador o extensión de kernel infractor (codificado en ASCII).
    4 La desasignación de un procesador hace que la máquina tenga disponibles menos de dos CPU. Este sistema operativo no desasigna más de N-2 procesadores en una máquina de N vías para evitar la confusión de las aplicaciones o extensiones de kernel que utilizan el número total de procesadores disponibles para determinar si están ejecutando en un sistema Uniprocesador (UP) donde es seguro saltarse el uso de bloques de multiprocesador o en un Multiprocesador simétrico (SMP).
    200 (0xC8) La desasignación de procesador está habilitada (el atributo de ODM cpuguard tiene el valor disable). Normalmente no se ve este error a menos que se inicie ha_star manualmente.

    Ejemplos: entradas del registro de errores - formato largo

    Ejemplo 1:
    		ETIQUETA:			CPU_DEALLOC_ABORTED
    		IDENTIFICADOR:		8470267F
    		Fecha/Hora:		Jue Sep 30 13:41:10
    		Número de secuencia:	50
    		Id de máquina:		00002F0E4C00
    		Id de nodo:		auntbea
    		Clase:			S
    		Tipo:			TEMP
    		Nombre de recurso:		proc26
    
    Descripción
    DESASIGNACIÓN DE CPU CANCELADA ANORMALMENTE
    
    Causas probables
    PROGRAMA DE SOFTWARE
    
    Causas de anomalía
    PROGRAMA DE SOFTWARE
    
    	Acciones recomendadas
    			SE NECESITA MANTENIMIENTO DEBIDO A ANOMALÍA DE CPU
    		VER DOCUMENTACIÓN DEL USUARIO PARA CPU GARD
    
    Datos de detalle
    CAUSA DE DESASIGNACIÓN CANCELADA ANORMALMENTE
    0000 0003
    DATOS DE DESASIGNACIÓN CANCELADA ANORMALMENTE
    6676 6861 6568 3200
    En este ejemplo, la desasignación de proc26 ha fallado. El código de razón 3 significa que una extensión de kernel ha devuelto un error a la rutina de notificación de kernel. Los DATOS DE DESASIGNACIÓN CANCELADA ANORMALMENTE indican fvhaeh2, que es el nombre que la extensión ha utilizado al registrarse en el kernel.
    Ejemplo 2:
    		ETIQUETA:			CPU_DEALLOC_ABORTED
    		IDENTIFICADOR:		8470267F
    		Fecha/Hora:		Jue Sep 30 14:00:22
    		Número de secuencia:	71
    		Id de máquina:		00002F0E4C00
    		Id de nodo:		auntbea
    		Clase:			S
    		Tipo:			TEMP
    		Nombre de recurso:		proc19
    
    Descripción
    DESASIGNACIÓN DE CPU CANCELADA ANORMALMENTE
    
    Causas probables
    PROGRAMA DE SOFTWARE
    
    Causas de anomalía
    PROGRAMA DE SOFTWARE
    
    	Acciones recomendadas
    		SE NECESITA MANTENIMIENTO DEBIDO A ANOMALÍA DE CPU;
    		VER DOCUMENTACIÓN DEL USUARIO PARA CPU GARD
    
    Datos de detalle
    CAUSA DE DESASIGNACIÓN CANCELADA ANORMALMENTE
    0000 0002
    DATOS DE DESASIGNACIÓN CANCELADA ANORMALMENTE
    0000 0000 0000 4F4A
    En este ejemplo, la desasignación para proc19 ha fallado. El código de razón 2 indica que había una hebra o hebras vinculadas al último procesador lógico y no se han desvinculado después de recibir la señal SIGCPUFAIL. DATOS DE DESASIGNACIÓN CANCELADA ANORMALMENTE muestra que estas hebras pertenecían al proceso 0x4F4A.

    Las opciones del mandato ps (-o THREAD, -o BND) permite listar todas las hebras o procesos junto con el número de CPU a la que están vinculados.

    Ejemplo 3:
    		ETIQUETA:			CPU_DEALLOC_ABORTED
    		IDENTIFICADOR:		8470267F
    
    		Fecha/Hora:		Jue Sep 30 14:37:34
    		Número de secuencia:	106
    		Id de máquina:		00002F0E4C00
    		Id de nodo:		auntbea
    		Clase:			S
    		Tipo:			TEMP
    		Nombre de recurso:		proc2
    
    Descripción
    DESASIGNACIÓN DE CPU CANCELADA ANORMALMENTE
    
    Causas probables
    PROGRAMA DE SOFTWARE
    
    Causas de anomalía
    PROGRAMA DE SOFTWARE
    
    	Acciones recomendadas
    			SE NECESITA MANTENIMIENTO DEBIDO A ANOMALÍA DE CPU
    		VER DOCUMENTACIÓN DEL USUARIO PARA CPU GARD
    
    Datos de detalle
    CAUSA DE DESASIGNACIÓN CANCELADA ANORMALMENTE
    0000 0004
    DATOS DE DESASIGNACIÓN CANCELADA ANORMALMENTE
    0000 0000 0000 0000
    En este ejemplo, la desasignación de proc2 ha fallado debido a que había dos procesadores activos o menos en el momento de la anomalía (código de razón 4).