AIX 错误通知

虽然 PowerHA® SystemMirror® 软件不监控磁盘资源的状态,但它提供了一个 SMIT 接口,可连接 AIX® 错误通知功能。 AIX 错误通知功能允许您检测 PowerHA SystemMirror 软件未特别监控的事件。 例如,磁盘适配器故障,以及为对事件的响应编写程序。

磁盘驱动器、控制器或适配器上持久的硬件错误可能会影响数据的故障恢复。 通过错误通知方法监视这些错误使您可以评估故障对集群提供高可用性的能力的影响。 错误通知的一个简单实现是向系统管理员发送邮件消息以便进一步研究问题。 较复杂的实现可能包括这样的逻辑:分析故障,确定要继续处理、停止处理、还是将故障升级为节点故障并使接管节点让卷组资源对客户机可用。

请对影响磁盘子系统的所有错误实施错误通知方法。 这样做能确保退化的故障恢复不会不受检测。

请注意,如果您希望 PowerHA SystemMirror 对节点上的卷组故障做出反应,您可以选择为这一特定错误配置自定义的 AIX 错误通知方法,这将导致节点停机事件或将受影响的资源组移动到另一个节点。

可以为由于 LVM_SA_QUORCLOSE 错误而发生故障的卷组定制资源恢复。 如果您使用已启用定额的镜像卷组,那么就会发生该错误。 对于这种情况,您可以执行以下一种操作:

  • PowerHA SystemMirror 选择性切换功能移动受影响的资源组
  • 使用 AIX 错误通知功能发送通知
  • 使用针对该类型的恢复的事件前和事件后脚本继续

如果之前已配置事件前或事件后脚本来处理这些情况,那么评估下它们与选择性失败转移功能配合使用的情况。 有关 PowerHA SystemMirror 如何处理此特定错误的更多信息,请参阅卷组丢失时使用的错误通知方法。

但是, PowerHA SystemMirror 不会自动对任何其他类型的卷组错误做出反应。 在所有其他情况下,您仍然需要配置自定义的错误通知方法,或使用 AIX 自动错误通知方法来应对卷组故障。

有关使用此实用程序一步即可为多个选定磁盘设备分配错误通知方法的信息,请参阅 PowerHA SystemMirror 自动错误通知。