检测 ESS 故障

在直接管理环境中没有检测 ESS 子系统故障的简单方法。

您可以检查在所有卷组中由 LVM_SA_QUORCLOSE 错误指示的定额丢失。 这些错误将写入 AIX® 错误日志。 PowerHA® SystemMirror® 检查 AIX 错误日志文件中是否出现 LVM_SA_QUORCLOSE 错误,如果出现,则通知群集管理器有选择地移动受影响的资源组。 这种 PowerHA SystemMirror 功能被称为音量组丢失时的选择性切换。

注: 如果未发生失败转移,请检查 AIX 错误日志中是否出现 LVM_SA_QUORCLOSE 错误。 当 AIX 错误日志缓冲区已满时,将废弃新条目,直到缓冲区中有可用空间并且错误日志条目通知您此问题为止。

已经发现有些存储子系统在遇到问题时会生成大量错误日志条目。 如果错误日志不够大,那么这些错误日志条目可能超出错误日志,从而导致 LVM_SA_QUORCLOSE 丢失。 要避免此问题,请使用以下命令将错误日志配置为具有足够空间:

errdemon -B 1048576 -s 10485760

这会将错误日志缓冲区大小设置为 1MB,并将日志大小设置为 10 MB。