如何在资源验证期间增加远程资源管理器的响应时间

在资源验证期间, IBM.RecoveryRM 会尝试确定集群所管理的所有资源的状态。 资源验证在域启动之后或在主 IBM.RecoveryRM 守护程序移至新节点之后运行。 在大型集群中,某些资源管理器可能无法在分配的时间范围内对主 IBM.RecoveryRM 作出响应。 主 IBM.RecoveryRM 守护程序终止,并且主角色由集群中的另一个 IBM.RecoveryRM 守护程序选取,期望资源验证完成。 如果其中一个远程资源管理器无法在超时时间段内对主 IBM.RecoveryRM 进行响应,那么这可能会导致主 IBM.RecoveryRM 守护程序在节点之间反复交换的链式反应。

可以使用以下过程来调整时间设置:
  • 将模板配置文件 /usr/sbin/rsct/share/RecoveryRM.cfg 复制到 /var/ct/cfg
  • /var/ct/cfg/RecoveryRM.cfg中编辑复制的文件。 取消注释以下条目并增加缺省时间段。 例如:

    #resource_verification_allowed_retries 200 到例如 resource_verification_allowed_retries 300

  • 保存文件。

与缺省重试周期 200ms一起计算,总体等待时间为:

resource_verification_allowed_retries x resource_verification_retry_period

如果使用缺省值,那么总体时间为: 200 x 200ms = 40secs。

如果使用此示例中的值,那么总体时间为: 200 x 300ms = 60secs。

在每个节点上调整配置文件后,使用调整后的值启动集群。