PowerHA SystemMirror 自动错误通知 (automatic error notification)
可使用自动错误通知功能执行各种任务。
在配置自动错误通知之前,您必须拥有有效的 PowerHA® SystemMirror® 配置。
使用 SMIT 选项,您可以:
- 为集群资源配置自动错误通知。
- 列出当前已为相同集群资源定义的自动错误通知条目。
- 除去之前已配置的自动错误通知方法。
您还可以使用自动错误通知功能查看 PowerHA SystemMirror 群集配置中当前定义的自动错误通知条目,并删除所有自动错误通知方法。
注意: 配置自动错误通知时,集群必须处于脱机状态。 如果集群正在运行,那么将发出一条警告且 SMIT 失败。
如果添加错误通知方法,那么 AIX® cl_errnotify 实用程序会自动运行。 该实用程序为以下设备在集群的所有节点上开启错误通知:
- rootvg 卷组中的所有磁盘
- PowerHA SystemMirror 卷组、并发卷组和文件系统中的所有磁盘
- 定义为 PowerHA SystemMirror 资源的所有磁盘
为避免单点故障,JFS 日志必须包含在 PowerHA SystemMirror 卷组中。
自动错误通知可应用于所选的不可恢复的硬错误类型,例如磁盘和磁盘适配器。 该实用程序不支持介质错误、已恢复的错误或临时错误。
注: 您不需要为 2105 IBM® Enterprise Storage System (ESS) 设置自动错误通知。 这些系统都使用子系统设备驱动程序,能够使硬件本身处理故障并在它失去一条路径时自动切换至另一条路径。
如需了解更多信息,请访问 IBM 网站,获取 TotalStorage® 支持、存储软件或子系统设备驱动程序支持,或访问系统存储®多路径子系统设备驱动程序支持网站。
注: 如果设置了自动错误通知,那么它将只记录错误,而不会启动失败转移操作,因为子系统设备驱动程序会处理此操作。 但是,如果不是所有 PVID 都在 VPATHS 上,那么错误通知会失败。 消息将记录到 cspoc.log 和 smit.log 文件中。
执行自动错误通知可为已记录的所有错误类型指定两种错误通知方法中的一种:
- 如果磁盘或网络接口卡被确定为单点故障且该故障导致集群资源失败转移,那么将指定 cl_failover。 一旦这些设备中的任何一个发生故障,该方法会将错误记录到 hacmp.out 并关闭节点上的集群软件。 它将用 Move Resource Groups 选项停止集群服务以关闭节点。
- 针对所有其他错误类型,将指定 cl_logerror。 一旦这些设备中的任何一个发生故障,该方法会将错误记录到 hacmp.out。
针对以下系统资源,将在通知方法中指定 cl_logerror 脚本,而不是 cl_failover 脚本:
- 包含未镜像的逻辑卷并因此被视为单点故障的磁盘
- 作为被定义为非并发资源组中资源的卷组或文件系统的一部分的磁盘
在通知方法中指定 cl_logerror 而不是 cl_failover 脚本会防止不必要的 node_down 事件。