应用程序监视

您可以通过 SMIT 界面来监视一组您定义的应用程序。

您可以配置多个应用程序监视器并将其与一个或多个应用程序控制器相关联。 通过支持每个应用程序多个监视器, PowerHA® SystemMirror® 可以支持更复杂的配置。 例如,您可以为使用中的 Oracle 并行服务器的每个实例配置一个监视器。 或者,您也可以配置一个定制监视器以检查数据库以及进程终止监视器的运行状况,从而立即检测数据库进程的终止。

您在 SMIT 中为每个监视器分配一个唯一名称。

可以配置进程监视器或定制监视器。 例如,您可以为 SystemMirror 提供一个定制脚本,用于向数据库发送请求以检查 SystemMirror 是否在运行。 脚本中的非零出口指示受监视应用程序失败, PowerHA SystemMirror 通过尝试恢复包含该应用程序的资源组进行响应。

在配置了每个监视器的情况下,当检测到问题时, PowerHA SystemMirror 会尝试重新启动应用程序,并继续执行指定的重新启动计数。 在重新启动计数内无法重新启动应用程序时,为 PowerHA SystemMirror 选择下列其中一个响应:

  • “失败转移”选项将导致包含应用程序的资源组失败转移到根据资源策略而具有次最高优先级的节点。
  • 通知选项会导致 PowerHA SystemMirror 生成 server_down 事件,以通知集群发生故障。

您可以通过“Notify Method”、“Cleanup Method”和“Restart Method”来为应用程序监视器定制重新启动过程。

注: 如果系统资源控制器 (SRC) 配置为重新启动应用程序,那么这可能会干扰应用程序监视所执行的操作。 为应用程序禁用 SRC 重新启动(应用程序启动和停止脚本不应使用 SRC,除非应用程序不可重新启动)。 对于定制监视器的情况,脚本负责更正操作。 将根据脚本返回值来支持应用程序监视采取的操作。

如果监视的应用程序由系统资源控制器来控制,请检查以确保 action:multi-O-Q-O 指定在子系统异常停止的情况不重新启动。 -Q 指定不允许子系统的多个实例同时运行。 可以使用以下命令来检查这些值:

lssrc -Ss <Subsystem> | cut -d : -f 10,11

如果值不是 -O-Q,那么必定是使用 chssys 命令更改了值。