确定问题源

一旦您确定了有问题,就需要找到问题的根源。

如果检测到 PowerHA® SystemMirror® 存在问题,请执行以下操作进行初步问题分析:

  1. 使用 snap -e 命令收集 PowerHA SystemMirror 快照。 在检测到问题之后,应该尽快完成此操作,因为收集的日志文件包含错误时间窗口。
  2. 使用 /usr/es/sbin/cluster/clstat 和 /usr/es/sbin/cluster/utilities/clRGinfo 命令来确定集群和资源组的状态。
  3. 如果发生事件错误,请检查 /var/hacmp/log/hacmp.out 文件以找到该错误。 如果 AIX® 命令失败,请使用 snap 命令主动收集相应 AIX 组件的进一步调试数据。 为进一步确定 PowerHA SystemMirror 的问题,最常使用的标志是 snap -egGtL
  4. 参考 /var/hacmp/log/clverify.log 和 /var/hacmp/log/autoverify.log 文件以了解最新集群验证的结果。 运行集群验证。
  5. 如果 C-SPOC 命令失败,请参考 /var/hacmp/log/cspoc.log.long 文件。
  6. 验证节点之间的网络连接。
  7. 检查错误日志 (errpt -a) 以确定在故障的时间窗口中是否记录了错误。