重试计数和重新启动时间间隔

重新启动行为取决于您在 SMIT 中配置的如下两个参数:retry countrestart interval

  • 重试次数。 重试计数指定 PowerHA® SystemMirror® 在考虑应用程序失败并执行后续失败转移或通知操作之前应尝试重新启动的次数。
  • 重启间隔。 重新启动时间间隔规定了重新启动的应用程序在重试计数重置为零之前(从而在发生一下个故障之前完成监视器活动)必须保持稳定状态的秒数。
注: 如果要创建仅在启动监视方式下使用的应用程序监视器,请不要同时指定这两个参数。

如果应用程序在重试计数耗尽之前成功启动,那么重新启动时间间隔将生效。 通过重置重新启动计数,将防止在应用程序在延长时间段内失败若干次之后进行不必要的失败转移操作。 例如,应用程序计数设置为 3(缺省值)的某个被监视的应用程序可能会两次重新启动失败,然后成功启动并顺利运行一周,之后再次失败。 应将此第三次失败计为调用失败转移策略之前三次新重新启动尝试的一次新失败。 正确设置的重新启动时间间隔将确保如下正确行为:在之前的失败后,如果应用程序成功启动并且被认为处于稳定状态,那么将计数重置为零。

请注意不要将重新启动时间间隔设置为过短的时间段。 如果时间段过短,那么计数可能在下一个失败尚未发生时便已提前重置为零,并且将永远不会发生失败转移或通知活动。