Visión general del registro de errores

El proceso de registro de errores empieza cuando un módulo del sistema operativo detecta un error.

A continuación, el segmento de código de detección de errores envía información de error al servicio de kernel guardar error y errlast o a la subrutina errlog . A continuación, esta información de error se graba en el archivo especial /dev/error . A continuación, este proceso añade una indicación de fecha y hora a los datos recopilados. El daemon errdemon comprueba constantemente si hay nuevas entradas en el archivo /dev/error y, cuando se graban nuevos datos, el daemon realiza una serie de operaciones.

Antes de que se grabe una entrada en el registro de errores, el daemon errdemon compara la etiqueta enviada por el kernel o el código de aplicación con el contenido del repositorio de plantillas de registro de errores. Si la etiqueta coincide con un elemento del repositorio, el daemon recopila datos adicionales de otras partes del sistema.

Para crear una entrada en el registro de errores, el daemon errdemon recupera la plantilla adecuada del repositorio, el nombre de recurso de la unidad que ha detectado el error y los datos de detalle. Además, si el error indica que existe un problema relacionado con el hardware y datos vitales del producto (VPD), el daemon recupera los VPD del Gestor de datos de objeto. Cuando accede al registro de errores, ya sea a través de SMIT o con el mandato errpt , el registro de errores se formatea según la plantilla de errores del repositorio de plantillas de errores y se presenta en un informe de resumen o detallado. Las entradas también se pueden recuperar utilizando los servicios proporcionados en liberrlog, errlog_open, errlog_close, errlog_find_first, errlog_find_next, errlog_find_sequence, errlog_set_directiony errlog_write. errlog_write proporciona una capacidad de actualización limitada.

La mayoría de las entradas del registro de errores son atribuibles a problemas de hardware y software, pero también se pueden registrar mensajes informativos.

El mandato diag utiliza el registro de errores para diagnosticar problemas de hardware. Para diagnosticar correctamente nuevos problemas del sistema, el sistema suprime las entradas relacionadas con el hardware anteriores a 90 días del registro de errores. El sistema suprime las entradas relacionadas con el software 30 días después de que se hayan registrado.

Debe estar familiarizado con los siguientes términos:

Plazo Descripción
ID DE ERROR Código hexadecimal de CRC de 32 bits utilizado para identificar una anomalía determinada. Cada plantilla de registro de error tiene un ID de error exclusivo.
Etiqueta de error El nombre mnemotécnico de un ID de error.
Anot. de error El archivo que almacena las instancias de errores y anomalías encontradas por el sistema.
entrada de anotación cronológica de errores Registro en el registro de errores del sistema que describe una anomalía de hardware, una anomalía de software o un mensaje de operador. Una entrada de registro de errores contiene datos de anomalía capturados.
plantilla de registro de error Descripción de la información visualizada cuando el registro de errores se formatea para un informe, incluida la información sobre el tipo y la clase del error, las causas probables y las acciones recomendadas. Colectivamente, las plantillas forman el repositorio de plantillas de registro de errores.