卷组丢失导致的选择性失败转移
当 PowerHA® SystemMirror® 在包含该资源组的节点上检测到卷组故障时,也会触发选择性失败转移。 换言之, PowerHA SystemMirror 会自动对与在集群节点上脱机的卷组相关联的 "丢失定额" 错误作出反应。
如果资源组中的卷组由于丢失该节点上的卷组的定额错误而脱机,那么 PowerHA SystemMirror 会选择性地将该资源组移至另一个节点。
在以下情况下, PowerHA SystemMirror 将选择性失败转移用于卷组丢失功能:
- PowerHA SystemMirror 监视资源组中包含的所有卷组以及属于该资源组的文件系统所依赖的所有卷组。
- PowerHA SystemMirror 仅移动包含卷组的资源组,该卷组的 LVM_SA_QUORCLOSE 错误已由该节点上的 AIX® errpt 中的错误守护程序记录。
注: PowerHA SystemMirror 不会自动对任何其他类型的卷组错误作出反应。 在这些情况下,您仍需要配置定制错误通知方法,或者使用 AIX Automatic Error Notification 方法来对卷组故障作出反应。
PowerHA SystemMirror 使用 "错误通知" 方法向集群管理器通知卷组的故障。 在使用此错误通知方法时:
- 请勿修改此错误通知方法。 如果尝试定制此通知方法或使用它来防止其他类型的资源发生故障,那么 PowerHA SystemMirror 将发出警告并不执行任何操作。
- 在对集群配置进行更改后同步集群。 用于卷组故障的通知脚本应该对应于集群资源的当前配置,否则 PowerHA SystemMirror 将在验证期间发出警告,并且不会执行任何操作来选择性地移动受影响的资源组。
- 除了 PowerHA SystemMirror 为选择性失败转移创建的 errnotify 条目外, errnotify ODM 还可能包含与相同 AIX 错误标签和资源相关的其他条目。 但是,选择性失败转移提供了一种最有效的恢复机制来防止资源组出现单一资源故障。
- 在卷组故障情况下运行的通知方法在 hacmp.out 和 clstrmgr.debug 日志文件中提供了以下信息:
- AIX 错误标签和标识
- 受影响资源组的名称
- 发生错误的节点的名称。
- 您可以通过在 SMIT 中模拟每个卷组的错误来测试选择性失败转移工具所生成的错误通知方法。
测试错误通知:
- 从命令行输入
smit sysmirror。 - 在 SMIT 中,选择 Problem Determination Tools > PowerHA SystemMirror Error Notification> Emulate Error Log Entry,然后按 Enter 键。
- 从选取列表中选择由每个卷组的选择性失败转移工具所生成的错误通知对象。