IBM PureData System for Analytics、バージョン 7.1

ECC エラー・イベント

SPU のメモリー・システムは、1 ビットのメモリー・エラーを自動的に訂正します。この訂正機能があるため、こうしたエラーがデータの完全性に影響を及ぼすことはありません。それでも、このエラーが検出された場合には、eccError イベント・タイプを通じて通知を受けることができます。これらのエラーの多くは、SPU 上のメモリーで障害が起きたことを示している可能性があります。これらのエラーが短期間に大量に発生した場合は、影響を受ける SPU を交換する方法について、IBM® Netezza® サポートにお問い合わせください。

次に示すのはイベント・ルール eccError の構文です。
-name EccError -on no -eventType eccError -eventArgsExpr '' 
-notifyType runCmd -dst '$NZ_SBIN_DIR/notifyECC' -msg 'NPS system 
$HOST -$hwType $hwId Soft (ECC) memory error recorded at 
$eventTimestamp' -bodyText '$notifyMsg\n\nSPA ID:$spaId\nSPA 
Slot:$spaSlot\n' -callHome no -eventAggrCount 0

ECC エラーは、E メール・メッセージまたは NzAdmin ツールを通じて監視することができます。

次の表に、eccError イベント・ルールからの出力をリストします。
表 1. eccError イベント・ルール
引数 説明
hwType 影響を受けるハードウェアのタイプ spu (z シリーズ・システムの場合は sfi)
hwId 問題が発生した対象ソース SPU のハードウェア ID 1013
spaId SPA の ID  
spaSlot SPA スロット番号  
errType エラーのタイプ。障害、障害の可能性、障害が切迫など 1 (障害)、2 (障害が切迫)、3 (障害の可能性)、4 (障害かどうか不明)
errCode エラー・コード 12
devSerial SPU のシリアル番号 601S496A2012
devHwRev ハードウェア・リビジョン 7.21496rA2.21091rB1
devFwRev ファームウェア・リビジョン 1.36
制約事項: このイベントは集約しないでください。


フィードバック | Copyright IBM Corporation 2014 | 最終更新: 2014-02-28