IBM PureData System for Analytics, Version 7.1

Evénement d'erreur ECC

La mémoire système sur l'unité SPU corrige automatiquement les erreurs de mémoire 1 bit. Grâce à cette fonction de correction, ces erreurs n'affectent pas l'intégrité des données. Cependant, lorsque le système détecte une telle erreur, il peut vous avertir via le type d'événement eccError. Un grand nombre de ces erreurs peut indiquer que la mémoire sur une unité SPU a échoué. Si vous obtenez un nombre significatif de ces erreurs sur une courte période, contactez le support IBM® Netezza pour remplacer l'unité SPU.

Voici la syntaxe de la règle d'événement eccError :
-name EccError -on no -eventType eccError -eventArgsExpr '' 
-notifyType runCmd -dst '$NZ_SBIN_DIR/notifyECC' -msg 'NPS system 
$HOST -$hwType $hwId Soft (ECC) memory error recorded at 
$eventTimestamp' -bodyText '$notifyMsg\n\nSPA ID:$spaId\nSPA 
Slot:$spaSlot\n' -callHome no -eventAggrCount 0

Vous pouvez surveiller les erreurs eccError par le biais de messages électroniques ou de l'outil NzAdmin.

Le tableau suivant présente la sortie de la règle d'événement eccError.
Tableau 1. Règle d'événement eccError
Arguments Description Exemples
hwType Type de matériel concerné spu (et sfi pour les systèmes z-series)
hwId ID matériel de l'unité SPU à l'origine du problème 1013
spaId ID SPA  
spaSlot Numéro d'emplacement de la SPA  
errType Type d'erreur, c'est-à-dire si l'erreur est de type Défaillance, Défaillance possible ou Défaillance imminente 1 (Défaillance), 2 (Défaillance imminente) 3 (Défaillance possible), 4 (Défaillance inconnue)
errCode Code d'erreur. 12
devSerial Numéro de série de l'unité SPU 601S496A2012
devHwRev Niveau de révision du matériel 7.21496rA2.21091rB1
devFwRev Niveau de révision du microprogramme 1.36
Restriction : N'agrégez pas cet événement.


Commentaires | Copyright IBM Corporation 2013 | Dernière mise à jour : 2013-07-31