存储库磁盘故障
您必须正确计划存储库磁盘故障以及更正与存储库磁盘故障相关的问题所需要执行的操作。
PowerHA® SystemMirror® 集群可容忍存储库磁盘故障。 如果集群中的任何节点遇到与存储库磁盘有关或者与访问存储库磁盘有关的错误,那么该集群进入受限制方式。 在此操作方式下,您无法使用大多数与拓扑相关的操作。 例如,无法添加节点,或者节点无法连接集群。 但是,可以执行关键的集群功能。 例如,可以将资源组从活动节点移到备用节点。
当存储库磁盘失败时,会将磁盘故障通知管理员。 PowerHA SystemMirror 继续通知管理员版本库磁盘故障,直到故障排除。 要在版本库磁盘发生故障时获取通知或自定义事件处理,请参阅 配置事件前和事件后处理主题。
PowerHA SystemMirror 和 Cluster Aware AIX® (CAA) 支持实时版本库磁盘替换,您可以用它来替换故障或正在运行的版本库磁盘。 CAA 会使用集群信息来重新填充该新磁盘,并且开始将该磁盘用作存储库磁盘。
PowerHA SystemMirror 7.2.0 或更高版本支持自动存储库磁盘替换 (ARR) 功能。 ARR 使用 CAA 并将失败的存储库磁盘自动更换为备份存储库磁盘。 只有通过 PowerHA SystemMirror 配置备份存储盘时,ARR 功能才可用。
要使用 ARR 功能,您所在环境必须满足下列需求:
- 集群或站点标识了备份存储库磁盘。
- PowerHA SystemMirror 已安装 7.2.0 或更高版本。
- 安装了以下版本之一的 AIX 操作系统:
- AIX 7.1.4 或更高版本
- AIX 7.2.0 或更高版本
CAA 通过检查 I/O 错误以及验证磁盘是否处于活动状态来监视存储库磁盘故障。 会定期执行这些验证检查,而不是每次读取或写入存储库磁盘时都进行验证检查。 即使是进行测试,也不要直接写入存储库磁盘。 直接异步写入存储库磁盘可能会导致操作系统和 CAA 操作突然中断,从而导致不可预测的结果。