エラー・ログの概要

エラー・ログ・プロセスは、オペレーティング・システムのモジュールがエラーを検出すると、開始されます。

次に、コードのエラー検出セグメントがエラー情報を errsave および errlast カーネル・サービスまたは errlog サブルーチンに送信します。 そして、このエラー情報が /dev/error スペシャル・ファイルに書き込まれます。 次に、このプロセスは収集済みデータにタイム・スタンプを追加します。 errdemon デーモンは /dev/error ファイルの新規エントリーを常に検査し、新規データが書き込まれると、一連の操作を実行します。

エントリーがエラー・ログに書き込まれる前に、errdemon デーモンは、カーネルまたはアプリケーション・コードによって送信されたラベルを、 エラー・レコード・テンプレート・リポジトリーの内容と比較します。 ラベルがリポジトリー内の項目と一致した場合、 デーモンは追加のデータをシステムの他の部分から収集します。

エラー・ログ内にエントリーを作成するために、errdemon デーモンは、リポジトリーから適切なテンプレート、 エラーを検出した単位のリソース名および詳細データを取り出します。 さらに、エラーがハードウェア関連の問題を示し、ハードウェアの重要プロダクト・データ (VPD) が存在している場合、このデーモンは VPD をオブジェクト・データ・マネージャーから取り出します。 SMIT を介して、または errpt コマンドを使用して、エラー・ログにアクセスすると、エラー・ログは、 エラー・テンプレート・リポジトリー内のエラー・テンプレートに従ってフォーマット設定され、 要約レポートまたは明細レポートに示されます。 エントリーは、 liberrlogerrlog_openerrlog_closeerrlog_find_firsterrlog_find_nexterrlog_find_sequenceerrlog_set_direction、 および errlog_write で提供されるサービスを使用して取り出すこともできます。 errlog_write で提供されている更新機能は、 限定的なものです。

エラー・ログ内の大部分のエントリーは、ハードウェアおよびソフトウェアの問題に由来しますが、 通知メッセージが記録される場合もあります。

diag コマンドは、 ハードウェア障害を診断するために、エラー・ログを使用します。 新規システム問題を正しく診断するために、システムは、 90 日より前のハードウェア関連のエントリーをエラー・ログから削除します。 システムは、記録されてから 30 日後にソフトウェア関連のエントリーを削除します。

以下の用語を理解している必要があります。

用語 説明
エラー ID 特定の障害を識別するために使用される 32 ビットの CRC 16 進コード。 各エラー・レコード・テンプレートは固有のエラー ID を持ちます。
エラー・ラベル エラー ID のニーモニック名。
エラー・ログ システムによって検出されたエラーおよび障害のインスタンスを保管するファイル。
エラー・ログ・エントリー ハードウェア障害、ソフトウェア障害、またはオペレーター・メッセージを記述する、 システム・エラー・ログ内のレコード。 エラー・ログ・エントリーには、取り込まれた障害データが入ります。
エラー・レコード・テンプレート エラー・ログがレポート用にフォーマット設定される時に表示される情報に関する記述であり、 エラーのタイプおよびクラス、推定原因、および望ましいアクションに関する情報も示されます。 テンプレートが集まって、エラー・レコード・テンプレート・リポジトリーを構成します。