エラー・ログの概要
エラー・ログ・プロセスは、オペレーティング・システムのモジュールがエラーを検出すると、開始されます。
次に、コードのエラー検出セグメントがエラー情報を errsave および errlast カーネル・サービスまたは errlog サブルーチンに送信します。 そして、このエラー情報が /dev/error スペシャル・ファイルに書き込まれます。 次に、このプロセスは収集済みデータにタイム・スタンプを追加します。 errdemon デーモンは /dev/error ファイルの新規エントリーを常に検査し、新規データが書き込まれると、一連の操作を実行します。
エントリーがエラー・ログに書き込まれる前に、errdemon デーモンは、カーネルまたはアプリケーション・コードによって送信されたラベルを、 エラー・レコード・テンプレート・リポジトリーの内容と比較します。 ラベルがリポジトリー内の項目と一致した場合、 デーモンは追加のデータをシステムの他の部分から収集します。
エラー・ログ内にエントリーを作成するために、errdemon デーモンは、リポジトリーから適切なテンプレート、 エラーを検出した単位のリソース名および詳細データを取り出します。 さらに、エラーがハードウェア関連の問題を示し、ハードウェアの重要プロダクト・データ (VPD) が存在している場合、このデーモンは VPD をオブジェクト・データ・マネージャーから取り出します。 SMIT を介して、または errpt コマンドを使用して、エラー・ログにアクセスすると、エラー・ログは、 エラー・テンプレート・リポジトリー内のエラー・テンプレートに従ってフォーマット設定され、 要約レポートまたは明細レポートに示されます。 エントリーは、 liberrlog、errlog_open、errlog_close、errlog_find_first、errlog_find_next、 errlog_find_sequence、errlog_set_direction、 および errlog_write で提供されるサービスを使用して取り出すこともできます。 errlog_write で提供されている更新機能は、 限定的なものです。
エラー・ログ内の大部分のエントリーは、ハードウェアおよびソフトウェアの問題に由来しますが、 通知メッセージが記録される場合もあります。
diag コマンドは、 ハードウェア障害を診断するために、エラー・ログを使用します。 新規システム問題を正しく診断するために、システムは、 90 日より前のハードウェア関連のエントリーをエラー・ログから削除します。 システムは、記録されてから 30 日後にソフトウェア関連のエントリーを削除します。
以下の用語を理解している必要があります。
用語 | 説明 |
---|---|
エラー ID | 特定の障害を識別するために使用される 32 ビットの CRC 16 進コード。 各エラー・レコード・テンプレートは固有のエラー ID を持ちます。 |
エラー・ラベル | エラー ID のニーモニック名。 |
エラー・ログ | システムによって検出されたエラーおよび障害のインスタンスを保管するファイル。 |
エラー・ログ・エントリー | ハードウェア障害、ソフトウェア障害、またはオペレーター・メッセージを記述する、 システム・エラー・ログ内のレコード。 エラー・ログ・エントリーには、取り込まれた障害データが入ります。 |
エラー・レコード・テンプレート | エラー・ログがレポート用にフォーマット設定される時に表示される情報に関する記述であり、 エラーのタイプおよびクラス、推定原因、および望ましいアクションに関する情報も示されます。 テンプレートが集まって、エラー・レコード・テンプレート・リポジトリーを構成します。 |