Entradas del registro de errores de desasignación
Tres mensajes diferentes de registro de errores se asocian a la desasignación de CPU.
A continuación se muestran unos ejemplos.
- formato corto de errpt - resumen
- En el ejemplo siguiente se muestran las entradas visualizadas por mandato errpt (sin
opciones):
# errpt IDENTIFICADOR IND._HORA T C NOMBRE_RECURSO DESCRIPCIÓN 804E987A 1008161399 I O proc4 CPU DESASIGNADA 8470267F 1008161299 T S proc4 DESASIGNACIÓN DE CPU CANCELADA 1B963892 1008160299 P H proc4 ANOMALÍA DE CPU PREVISTA #- Si la desasignación de procesador está habilitada, el mensaje de
ANOMALÍA DE CPU PREVISTAsiempre va seguido del mensajeCPU DESASIGNADAo el mensajeDESASIGNACIÓN DE CPU CANCELADA ANORMALMENTE. - Si la desasignación de procesador no está habilitada, sólo se anota cronológicamente el
mensaje
ANOMALÍA DE CPU PREVISTA. La habilitación de la desasignación del procesador en cualquier momento posterior a la anotación cronológica de uno o varios mensajesANOMALÍA DE CPU PREVISTAinicia el proceso de desasignación y da lugar a una entrada en el registro de errores del éxito o anomalía, según se describe más arriba, para cada procesador que se ha informado que falla.
- Si la desasignación de procesador está habilitada, el mensaje de
- formato largo de errpt - descripción detallada
- El siguiente formato es la salida obtenida con errpt -a:
CPU_FAIL_PREDICTEDDescripción del error: Anomalía de procesador prevista
Este error indica que el hardware ha detectado que un procesador tiene una alta probabilidad de fallar en un futuro próximo. Siempre se anota cronológicamente, no importa si la desasignación del procesador está habilitada o no.
DATOS DE DETALLE: Número de procesador físico, ubicación
Ejemplo de entrada de registro de errores - formato largoETIQUETA: CPU_FAIL_PREDICTED IDENTIFICADOR: 1655419A Fecha/Hora: Jue Sep 30 13:42:11 Número de secuencia: 53 Id de máquina: 00002F0E4C00 Id de nodo: auntbea Clase: H Tipo: PEND Nombre de recurso: proc25 Clase de recurso: procesador Tipo de recurso: proc_rspc Ubicación: 00-25 Descripción ANOMALÍA DE CPU PREVISTA Causas probables ANOMALÍA DE CPU Causas de anomalía ANOMALÍA DE CPU Acciones recomendadas ASEGÚRESE DE QUE LA MODALIDAD DE CPU GARD ESTÁ HABILITADA EJECUTE LOS DIAGNÓSTICOS DEL SISTEMA. Datos de detalle DATOS DEL PROBLEMA 0144 1000 0000 003A 8E00 9100 1842 1100 1999 0930 4019 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 4942 4D00 5531 2E31 2D50 312D 4332 0000 0002 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 ... ... ... ... ...CPU_DEALLOC_SUCCESSDescripción del error: Un procesador se ha desasignado satisfactoriamente tras la detección de una anomalía de procesador prevista. Este mensaje se anota cronológicamente cuando la desasignación del procesador está habilitada y cuando la CPU se ha desasignado satisfactoriamente.
DATOS DE DETALLE: Número de CPU lógica de procesador desasignado.
Ejemplo: entrada de registro de errores - formato largo:
En este ejemplo, proc24 se ha desasignado satisfactoriamente y era la CPU lógica 0 cuando se ha producido la anomalía.ETIQUETA: CPU_DEALLOC_SUCCESS IDENTIFICADOR: 804E987A Fecha/Hora: Jue Sep 30 13:44:13 Número de secuencia: 63 Id de máquina: 00002F0E4C00 Id de nodo: auntbea Clase: O Tipo: INFO Nombre de recurso: proc24 Descripción CPU DESASIGNADA Acciones recomendadas SE NECESITA MANTENIMIENTO DEBIDO A ANOMALÍA DE CPU Datos de detalle NÚMERO DE CPU LÓGICA DESASIGNADA 0CPU_DEALLOC_FAILDescripción del error: Una desasignación de procesador no ha sido satisfactoria debido a una anomalía de procesador prevista. Este mensaje se anota cronológicamente cuando la desasignación de CPU está habilitada, y cuando la CPU no se ha desasignado satisfactoriamente.
DATOS DE DETALLE:Código de razón, número de CPU lógica, información adicional según el tipo de anomalía.El código de razón es un valor hexadecimal numérico. Los posibles códigos de razón son:Elemento Descripción 2Uno o varios procesos o hebras permanecen vinculados a la última CPU lógica. En este caso, los datos detallados ofrecen los PID de los procesos infractores. 3Un controlador registrado o extensión de kernel ha devuelto un error cuando se le ha notificado. En este caso, el campo de datos detallados contiene el nombre del controlador o extensión de kernel infractor (codificado en ASCII). 4La desasignación de un procesador hace que la máquina tenga disponibles menos de dos CPU. Este sistema operativo no desasigna más de N-2 procesadores en una máquina de N vías para evitar la confusión de las aplicaciones o extensiones de kernel que utilizan el número total de procesadores disponibles para determinar si están ejecutando en un sistema Uniprocesador (UP) donde es seguro saltarse el uso de bloques de multiprocesador o en un Multiprocesador simétrico (SMP). 200 (0xC8)La desasignación de procesador está habilitada (el atributo de ODM cpuguard tiene el valor disable). Normalmente no se ve este error a menos que se inicie ha_star manualmente.Ejemplos: entradas del registro de errores - formato largo
Ejemplo 1:
En este ejemplo, la desasignación de proc26 ha fallado. El código de razónETIQUETA: CPU_DEALLOC_ABORTED IDENTIFICADOR: 8470267F Fecha/Hora: Jue Sep 30 13:41:10 Número de secuencia: 50 Id de máquina: 00002F0E4C00 Id de nodo: auntbea Clase: S Tipo: TEMP Nombre de recurso: proc26 Descripción DESASIGNACIÓN DE CPU CANCELADA ANORMALMENTE Causas probables PROGRAMA DE SOFTWARE Causas de anomalía PROGRAMA DE SOFTWARE Acciones recomendadas SE NECESITA MANTENIMIENTO DEBIDO A ANOMALÍA DE CPU VER DOCUMENTACIÓN DEL USUARIO PARA CPU GARD Datos de detalle CAUSA DE DESASIGNACIÓN CANCELADA ANORMALMENTE 0000 0003 DATOS DE DESASIGNACIÓN CANCELADA ANORMALMENTE 6676 6861 6568 32003significa que una extensión de kernel ha devuelto un error a la rutina de notificación de kernel. LosDATOS DE DESASIGNACIÓN CANCELADA ANORMALMENTEindican fvhaeh2, que es el nombre que la extensión ha utilizado al registrarse en el kernel.Ejemplo 2:
En este ejemplo, la desasignación para proc19 ha fallado. El código de razónETIQUETA: CPU_DEALLOC_ABORTED IDENTIFICADOR: 8470267F Fecha/Hora: Jue Sep 30 14:00:22 Número de secuencia: 71 Id de máquina: 00002F0E4C00 Id de nodo: auntbea Clase: S Tipo: TEMP Nombre de recurso: proc19 Descripción DESASIGNACIÓN DE CPU CANCELADA ANORMALMENTE Causas probables PROGRAMA DE SOFTWARE Causas de anomalía PROGRAMA DE SOFTWARE Acciones recomendadas SE NECESITA MANTENIMIENTO DEBIDO A ANOMALÍA DE CPU; VER DOCUMENTACIÓN DEL USUARIO PARA CPU GARD Datos de detalle CAUSA DE DESASIGNACIÓN CANCELADA ANORMALMENTE 0000 0002 DATOS DE DESASIGNACIÓN CANCELADA ANORMALMENTE 0000 0000 0000 4F4A2indica que había una hebra o hebras vinculadas al último procesador lógico y no se han desvinculado después de recibir la señal SIGCPUFAIL.DATOS DE DESASIGNACIÓN CANCELADA ANORMALMENTEmuestra que estas hebras pertenecían al proceso 0x4F4A.Las opciones del mandato ps (
-o THREAD, -o BND) permite listar todas las hebras o procesos junto con el número de CPU a la que están vinculados.Ejemplo 3:
En este ejemplo, la desasignación de proc2 ha fallado debido a que había dos procesadores activos o menos en el momento de la anomalía (código de razónETIQUETA: CPU_DEALLOC_ABORTED IDENTIFICADOR: 8470267F Fecha/Hora: Jue Sep 30 14:37:34 Número de secuencia: 106 Id de máquina: 00002F0E4C00 Id de nodo: auntbea Clase: S Tipo: TEMP Nombre de recurso: proc2 Descripción DESASIGNACIÓN DE CPU CANCELADA ANORMALMENTE Causas probables PROGRAMA DE SOFTWARE Causas de anomalía PROGRAMA DE SOFTWARE Acciones recomendadas SE NECESITA MANTENIMIENTO DEBIDO A ANOMALÍA DE CPU VER DOCUMENTACIÓN DEL USUARIO PARA CPU GARD Datos de detalle CAUSA DE DESASIGNACIÓN CANCELADA ANORMALMENTE 0000 0004 DATOS DE DESASIGNACIÓN CANCELADA ANORMALMENTE 0000 0000 0000 00004).