如何在资源验证期间增加远程资源管理器的响应时间
在资源验证期间, IBM.RecoveryRM 会尝试确定集群所管理的所有资源的状态。 资源验证在域启动之后或在主 IBM.RecoveryRM 守护程序移至新节点之后运行。 在大型集群中,某些资源管理器可能无法在分配的时间范围内对主 IBM.RecoveryRM 作出响应。 主 IBM.RecoveryRM 守护程序终止,并且主角色由集群中的另一个 IBM.RecoveryRM 守护程序选取,期望资源验证完成。 如果其中一个远程资源管理器无法在超时时间段内对主 IBM.RecoveryRM 进行响应,那么这可能会导致主 IBM.RecoveryRM 守护程序在节点之间反复交换的链式反应。
可以使用以下过程来调整时间设置:
- 将模板配置文件
/usr/sbin/rsct/share/RecoveryRM.cfg复制到/var/ct/cfg。 - 在
/var/ct/cfg/RecoveryRM.cfg中编辑复制的文件。 取消注释以下条目并增加缺省时间段。 例如:从
#resource_verification_allowed_retries 200到例如resource_verification_allowed_retries 300。 - 保存文件。
与缺省重试周期 200ms一起计算,总体等待时间为:
resource_verification_allowed_retries x resource_verification_retry_period
如果使用缺省值,那么总体时间为: 200 x 200ms = 40secs。
如果使用此示例中的值,那么总体时间为: 200 x 300ms = 60secs。
在每个节点上调整配置文件后,使用调整后的值启动集群。