集群事件处理
资源组处理功能针对事件的总体处理添加了步骤。
这些步骤包括:
- 集群管理器与 RSCT 组服务进行通信以获取有关拓扑事件的信息,并整合有关资源组相关事件的信息。
- 集群管理器执行事件汇总并确定要运行的实际集群事件。
- 运行组服务协议以使所有集群节点就事件达成一致(表决)。
- 集群管理器在集群节点上启动事件脚本。
- 事件脚本获取有关要为事件处理的资源组的信息:
- 从 PowerHA® SystemMirror® 配置数据库和集群管理器获取信息,并确定要针对事件处理的资源组。
- 获取有关已尝试的节点的信息,并且从缺省节点列表中排除这些节点。
- 排除网络接口不足的节点(针对需要网络接口的资源组)。
- 检查节点优先级策略以对资源组的目标节点列表确定优先级。
- 事件脚本处理资源组。 (将其联机/脱机,等等)
- 如果在“获取”阶段中遇到故障,那么集群管理器在内部将资源组标记为可恢复。
- 事件脚本完成。注: 有关步骤 5-9 的更多信息,以及有关集群管理器确定首先处理哪个资源组时哪些属性和策略优先的信息,请参阅此部分 (请参阅 "常规资源组事件处理逻辑")。
- 集群管理器从脚本获取返回码。
- 如果返回码为 0,那么事件已完成(事件可能未成功);否则,返回 event_error。 (可能需要用户进行干预以使集群返回到稳定状态。)
- 集群管理器记录本地网络故障事件所影响的资源组,并且将受影响的资源组标记为可恢复。
- 集群管理器记录本地网络故障 (13) 或者某个获取错误 (8) 所影响的资源组,并且将处于可恢复状态的每个资源组的恢复事件加入队列。
- 事件结束。