La mémoire système sur l'unité SPU corrige automatiquement les erreurs de mémoire 1 bit. Grâce à cette fonction de correction, ces erreurs n'affectent pas l'intégrité des données. Cependant, lorsque le système détecte une telle erreur, il peut vous avertir via le type d'événement eccError. Un grand nombre de ces erreurs peut indiquer que la mémoire sur une unité SPU a échoué. Si vous obtenez un nombre significatif de ces erreurs sur une courte période, contactez le support IBM® Netezza pour remplacer l'unité SPU.
-name EccError -on no -eventType eccError -eventArgsExpr ''
-notifyType runCmd -dst '$NZ_SBIN_DIR/notifyECC' -msg 'NPS system
$HOST -$hwType $hwId Soft (ECC) memory error recorded at
$eventTimestamp' -bodyText '$notifyMsg\n\nSPA ID:$spaId\nSPA
Slot:$spaSlot\n' -callHome no -eventAggrCount 0
Vous pouvez surveiller les erreurs eccError par le biais de messages électroniques ou de l'outil NzAdmin.
| Arguments | Description | Exemples |
|---|---|---|
| hwType | Type de matériel concerné | spu (et sfi pour les systèmes z-series) |
| hwId | ID matériel de l'unité SPU à l'origine du problème | 1013 |
| spaId | ID SPA | |
| spaSlot | Numéro d'emplacement de la SPA | |
| errType | Type d'erreur, c'est-à-dire si l'erreur est de type Défaillance, Défaillance possible ou Défaillance imminente | 1 (Défaillance), 2 (Défaillance imminente) 3 (Défaillance possible), 4 (Défaillance inconnue) |
| errCode | Code d'erreur. | 12 |
| devSerial | Numéro de série de l'unité SPU | 601S496A2012 |
| devHwRev | Niveau de révision du matériel | 7.21496rA2.21091rB1 |
| devFwRev | Niveau de révision du microprogramme | 1.36 |