网络接口故障导致的选择性失败转移

如果具有 PowerHA® SystemMirror® 服务 IP 标签的网络接口发生故障,并且同一 PowerHA SystemMirror 网络上的节点上没有其他可用的网络接口,那么该节点上受影响的应用程序无法运行。 如果该服务网络接口是节点中最后一个可用接口,那么网络接口故障将触发网络故障事件。

PowerHA SystemMirror 区分两种类型的网络故障: 本地全局。 如果节点无法再通过特定网络进行通信,但是网络仍由其他节点使用,那么此时便发生了本地网络故障。 如果所有节点都无法通过网络进行通信,那么此时便发生了全局网络故障。

PowerHA SystemMirror 对本地和全局网络故障事件使用以下格式:

本地网络故障事件
network_down <node_name> <network_name>
全局网络故障事件
network_down -1 <network_name>

如果发生本地网络故障,那么您可以创建一个后置事件来触发 node_down 事件。 尽管这具有期望的效果:将具有发生故障资源的资源组移动到其他节点,但是也具有不期望的效果:将节点上的所有资源组移动到其他节点。

选择性失败转移使用此基础结构来更好地处理网络接口故障。 在此情况下,您无需创建后置事件来将本地网络故障提升到节点故障。 请参阅以下部分,以获取有关 PowerHA SystemMirror 如何处理网络接口故障的更多信息。

您不能将全局网络故障提升到 node_down 事件,因为全局网络事件适用于所有节点,并且将导致所有节点关闭。

对网络接口故障执行的操作

在发生网络接口故障的情况下, PowerHA SystemMirror 将执行以下操作:

  • 如果包含服务 IP 标签的网络接口发生故障并且在同一节点上没有任何网络接口可用(因此,无法执行 swap_adapter 事件),那么它仅将与发生故障的服务网络接口相关联的资源组移动到其他节点。
  • 如果网络接口发生故障,并且这可能导致对受影响的资源组启动 rg_move,那么将检查可用的网络接口。 具有可用网络接口的最高优先级节点将尝试获取资源组。
  • 在释放资源组之前, PowerHA SystemMirror 会检查网络接口在加入集群的节点上是否可用。 如果没有可用的网络接口,那么不会释放资源组。

以上操作采用资源组定义中的可用节点。

hacmp.out 文件包含的消息将告知您选择性失败转移操作将导致的集群活动。