Gestión del registro de errores
El registro de errores se inicia automáticamente mediante el script rc.boot durante la inicialización del sistema y se detiene automáticamente mediante el script shutdown durante la conclusión del sistema.
El análisis del registro de errores realizado por el mandato diag analiza las entradas de error de hardware. El periodo de tiempo predeterminado que las entradas de error de hardware permanecen en el registro de errores es de 90 días. Si elimina entradas de error de hardware con menos de 90 días de antigüedad, puede limitar la efectividad de este análisis de registro de errores.
Transferencia del registro de errores a otro sistema
Los mandatos errclear, errdead, errlogger, errmsgy errpt forman parte del paquete de ayudas de servicio de software instalable opcionalmente (bos.sysmgt.serv_aid). Necesita el paquete Ayudas de servicio de software para generar informes a partir del registro de errores o para suprimir entradas del registro de errores. Puede instalar el paquete de ayudas de servicio de software en el sistema, o puede transferir el archivo de registro de errores del sistema a un sistema que tenga instalado el paquete de ayudas de servicio de software.
/usr/lib/errdemon -l- Copie el archivo en un sistema de archivos montado de forma remota utilizando el mandato cp
- Copie el archivo a través de la conexión de red utilizando los mandatos rcp, ftpo tftp
- Copie el archivo en un soporte extraíble utilizando el mandato tar o backup y restaure el archivo en otro sistema.
Puede formatear informes para un registro de errores copiado en el sistema desde otro sistema utilizando el distintivo -i del mandato errpt . El distintivo -i le permite especificar el nombre de vía de acceso de un archivo de registro de errores que no sea el predeterminado. Del mismo modo, puede suprimir entradas de un archivo de registro de errores copiado en el sistema desde otro sistema utilizando el distintivo -i del mandato errclear .
Configuración del registro de errores
Puede personalizar el nombre y la ubicación del archivo de registro de errores y el tamaño del almacenamiento intermedio de errores interno para que se ajuste a sus necesidades. También puede controlar el registro de errores duplicados.
Listado de los valores actuales
Para listar la configuración actual, ejecute /usr/lib/errdemon -l. Los valores del nombre del archivo de registro cronológico de errores, el tamaño del archivo de registro cronológico de errores y el tamaño del almacenamiento intermedio que están almacenados actualmente en la base de datos de configuración de registro cronológico de errores se muestran en la pantalla.
Personalización de la ubicación del archivo de registro
Para cambiar el nombre del archivo utilizado para el registro de errores, ejecute el comando /usr/lib/errdemon -i FileName. El nombre de archivo especificado se guarda en la base de datos de configuración del registro de errores y el daemon de errores se reinicia inmediatamente.
Personalización del tamaño del archivo de registro
/usr/lib/errdemon -s LogSize El límite de tamaño especificado para el archivo de registro se guarda en la base de datos de configuración de registro de errores y el daemon de errores se reinicia inmediatamente. Si el límite de tamaño del archivo de registro es menor que el tamaño del archivo de registro que se está utilizando actualmente, se cambia el nombre del archivo de registro actual añadiendo .old al nombre de archivo y se crea un nuevo archivo de registro con el límite de tamaño especificado. La cantidad de espacio especificada está reservada para el archivo de registro de errores y no está disponible para que lo utilicen otros archivos. Por lo tanto, tenga cuidado de no hacer el registro excesivamente grande. Pero, si hace que el registro sea demasiado pequeño, es posible que la información importante se sobrescriba prematuramente. Cuando se alcanza el límite de tamaño del archivo de registro, el archivo se ajusta, es decir, las entradas más antiguas se sobrescriben con las entradas nuevas.
Personalización del tamaño del almacenamiento intermedio
/usr/lib/errdemon -B BufferSize El tamaño de almacenamiento intermedio especificado se guarda en la base de datos de configuración de registro de errores y, si es mayor que el tamaño de almacenamiento intermedio utilizado actualmente, el almacenamiento intermedio en memoria aumenta inmediatamente. Si es menor que el tamaño de almacenamiento intermedio que se está utilizando actualmente, el nuevo tamaño se pone en vigor la próxima vez que se inicie el daemon de error después de que se reinicie el sistema. El almacenamiento intermedio no puede ser menor que el valor predeterminado codificado de 8 KB. El tamaño que especifique se redondeará al siguiente múltiplo integral del tamaño de página de memoria (4 KB). La memoria utilizada para el almacenamiento intermedio en memoria del controlador de dispositivo de registro de errores no está disponible para que la utilicen otros procesos (el almacenamiento intermedio está fijado).
Tenga cuidado de no afectar al rendimiento del sistema haciendo que el almacenamiento intermedio sea excesivamente grande. Pero, si hace que el almacenamiento intermedio sea demasiado pequeño, el almacenamiento intermedio puede llenarse si las entradas de error llegan más rápido de lo que se leen del almacenamiento intermedio y se colocan en el archivo de registro. Cuando el almacenamiento intermedio está lleno, las nuevas entradas se descartan hasta que haya espacio disponible en el almacenamiento intermedio. Cuando se produce esta situación, se crea una entrada de registro de errores para informarle del problema y puede corregir el problema ampliando el almacenamiento intermedio.
Personalización del manejo de errores duplicados
Por defecto, a partir de AIX 5.1, el demonio de errores elimina los errores duplicados mirando cada error que se registra. Un error es un duplicado si es idéntico al error anterior, y si ocurre dentro del intervalo de tiempo aproximado especificado con /usr/lib/errdemon -t time-interval. El valor de tiempo predeterminado es 10000, o 10 segundos. El valor es en milisegundos.
El distintivo -m maxdups controla cuántos duplicados se pueden acumular antes de que se registre una entrada duplicada. El valor predeterminado es 1000. Si se registra un error, seguido de 1000 apariciones del mismo error, se registra un error duplicado en ese punto en lugar de esperar a que caduque el intervalo de tiempo o a que se produzca un error exclusivo.
Por ejemplo, si un manejador de dispositivos inicia rápidamente el registro de muchos errores idénticos, la mayoría no aparecerá en el registro. En su lugar, se registrará la primera aparición. Las apariciones posteriores no se registrarán inmediatamente, sino que sólo se contarán. Cuando caduca el intervalo de tiempo, se alcanza el valor maxdups , o cuando se registra otro error, se registra un formato alternativo del error, que indica las horas del primer y último duplicado y el número de duplicados.
Eliminación de entradas de registro de errores
Las entradas se eliminan del registro de errores cuando el usuario root ejecuta el mandato errclear , cuando el mandato errclear se invoca automáticamente mediante un trabajo cron diario o cuando el archivo de registro de errores se ajusta como resultado de alcanzar su tamaño máximo. Cuando el archivo de registro de errores alcanza el tamaño máximo especificado en la base de datos de configuración de registro de errores, las entradas más antiguas se sobrescriben con las entradas más recientes.
Eliminación automática
crontab -l Command crontab -e Command mandato errclear
El mandato errclear se puede utilizar para eliminar de forma selectiva entradas del registro de errores. Los criterios de selección que puede especificar incluyen el número de ID de error, el número de secuencia, la etiqueta de error, el nombre de recurso, la clase de recurso, la clase de error y el tipo de error. También debe especificar la antigüedad de las entradas que se van a eliminar. Se eliminarán las entradas que coincidan con los criterios de selección que haya especificado y sean más antiguas que el número de días que haya especificado.
Habilitar e inhabilitar el registro para un evento
Puede inhabilitar el registro o la creación de informes de un evento determinado modificando el campo Registro o el campo Informe de la plantilla de error para el evento. Puede utilizar el mandato errupdate para cambiar los valores actuales de un suceso.
Mostrar sucesos para los que el registro está inhabilitado
errpt -t -F Log=0 Los sucesos para los que el registro está inhabilitado no se guardan en el archivo de registro de errores.
Mostrar sucesos para los que la creación de informes está inhabilitada
errpt -t -F Report=0 Los sucesos para los que la creación de informes está inhabilitada se guardan en el archivo de registro de errores cuando se producen, pero no se visualizan mediante el mandato errpt .
Cambio del valor actual para un suceso
Para cambiar los valores actuales de un suceso, puede utilizar el mandato errupdate . La entrada necesaria para el mandato errupdate puede estar en un archivo o desde la entrada estándar.
errupdate <Enter>
=192AC071: <Enter>
Report=False <Enter>
<Ctrl-D>
<Ctrl-D>Registro de actividades de mantenimiento
El mandato errlogger permite al administrador del sistema registrar mensajes en el registro de errores. Siempre que realice una actividad de mantenimiento, como borrar entradas del registro de errores, sustituir hardware o aplicar un arreglo de software, es una buena idea registrar esta actividad en el registro de errores del sistema.
El mandato ras_logger proporciona una forma de registrar cualquier error desde la línea de mandatos. Se puede utilizar para probar plantillas de error recién creadas y proporciona una forma de registrar un error de un script de shell.
Redirigir mensajes de syslog a registro de errores
Algunas aplicaciones utilizan syslog para registrar errores y otros sucesos. Para listar los mensajes de registro de errores y los mensajes de registro de sistema en un único informe, redirija los mensajes de registro de sistema al registro de errores. Puede hacerlo especificando errlog como destino en el archivo de configuración de syslog (/etc/syslog.conf). Consulte el daemon syslogd para obtener más información.
Direccionar mensajes de registro de errores a syslog
errnotify:
en_name = "syslog1"
en_persistenceflg = 1
en_method = "logger Msg from Error Log: `errpt -l $1 | grep -v 'ERROR_ID TIMESTAMP'`"Por ejemplo, cree un archivo denominado /tmp/syslog.add con este contenido. A continuación, ejecute el mandato odmadd /tmp/syslog.add (debe haber iniciado la sesión como usuario root).
Para obtener más información sobre la notificación de errores simultánea, consulte Notificación de errores.