定制硬件错误的 AIX 错误通知

在配置集群时定制通知是一种很好的预防性措施。

使用 PowerHA® SystemMirror® Automatic Error Notification SMIT 面板,可以为选定的不可恢复的硬盘错误类型(如磁盘、磁盘适配器)打开自动错误通知。 包括定义为 PowerHA SystemMirror 资源的所有磁盘,以及 rootvg 和 PowerHA SystemMirror 卷组和文件系统中的磁盘。

您可能希望为某些介质或临时错误设置错误通知。 您可能还希望为某些设备定制错误通知,而不是使用两种自动错误通知方法中的一种。

注: 其中大部分错误仅返回 "通知"。

要监视的硬件错误的列表

以下硬件错误列表为您提供了要监视的错误类型的出色建议。 第一个列表显示 PowerHA SystemMirror 自动错误通知实用程序处理的错误。 以下列表显示了您可能要解决的其他错误类型。 对于监视的每个设备,您可以确定除了通知之外的其他操作,例如:

  • 停止集群服务并将资源组移动到其他节点。
  • 启动®自定义恢复操作,例如使用替代设备为故障设备重新配置。
表 1. 通过 PowerHA SystemMirror 自动错误通知处理硬件错误
错误 描述
DISK_ERR2 永久性物理磁盘错误(已知错误)
DISK_ERR3 永久性物理磁盘错误,检测到适配器(已知错误)
SCSI_ERR1 持久性 SCSI 适配器硬件错误(已知错误)
SCSI_ERR3 持久性 SCSI 适配器微码错误(已知错误)
SCSI_ERR5 临时 SCSI 总线错误
SCSI_ERR7 永久性未知系统错误
SCSI_ERR9 潜在的数据丢失条件
SDA_ERR1 适配器硬件错误条件
SDA_ERR3 永久性未知系统错误
SDC_ERR1 控制器/DASD 链路错误
SDC_ERR2 控制器硬件错误
DISK_ARRAY_ERR2 永久性磁盘操作错误(磁盘故障)
DISK_ARRAY_ERR3 永久性磁盘操作错误(磁盘故障)
DISK_ARRAY_ERR5 永久性磁盘操作错误(磁盘故障)
SCSI_ARRAY_ERR2 SCSI 硬件错误
表 2。 PowerHA SystemMirror 自动错误通知未涵盖的磁盘和适配器错误
错误 描述
LVM_MISSPVADDED PV 定义为缺失(未知错误)
LVM_SA_WRT PV 定义为缺失(未知错误)
LVM_SA_PVMISS 未能写入 VGSA(未知错误)
表 3。 PowerHA SystemMirror 自动错误通知未涵盖的磁盘阵列错误
错误 描述
DISK_ARRAY_ERR4 临时磁盘操作错误(磁盘介质故障)
DISK_ARRAY_ERR6 永久性阵列子系统降级(磁盘介质故障)
DISK_ARRAY_ERR7 永久性阵列子系统降级(控制器)
DISK_ARRAY_ERR8 永久性阵列活动控制器开关(控制器)
DISK_ARRAY_ERR9 永久性阵列控制器开关故障

PowerHA SystemMirror for AIX® 可能不支持对您的操作至关重要的其他设备。您可以设置 AIX 错误通知,以监控这些设备的微码错误或适配器超时。