对存储子系统的手动恢复进行故障诊断

在线编辑

PowerHA® SystemMirror® Enterprise Edition 7.1.2 或更高版本支持各种存储子系统，通过监控故障和自动恢复故障，为应用程序和服务提供高可用性。存储子系统使用各种复制技术管理主数据中心和辅助数据中心之间的数据复制。

如果存储子系统在线且可用， PowerHA SystemMirror Enterprise Edition 7.1.2 或更高版本可在切换和回退期间自动管理复制的数据。不过，以下情况说明了在哪些情况下 PowerHA SystemMirror Enterprise Edition 不会自动管理复制的数据，以及何时需要人工干预：

PowerHA SystemMirror Enterprise Edition 无法确定存储子系统、存储链接或设备组的状态。在这种情况下， PowerHA SystemMirror Enterprise Edition 会停止群集事件处理，并在 /var/hacmp/log/hacmp.out 日志文件中显示纠正措施。要排除存储子系统的故障，请查看 /var/hacmp/log/hacmp.out 日志文件中 RECOMMENDED USER ACTIONS 部分的信息。
当存储子系统恢复在线时，必须从 SMIT 界面选择 Problem Determination Tools > 从脚本故障恢复 PowerHA SystemMirror ，手动恢复群集事件处理。
跨不同站点的分区集群发生故障转移。主分区和辅助分区开始将数据写入本地存储子系统。主分区恢复且存储链路重新联机后，必须确定是否可合并两个站点中的数据，以及一个站点的数据是否可替换另一个站点的数据。在这种情况下，您不希望 PowerHA SystemMirror Enterprise Edition 使用自动恢复功能。
要将 PowerHA SystemMirror Enterprise Edition 配置为使用手动恢复，请完成以下步骤：
1. 从命令行输入 smit sysmirror。
2. 在 SMIT 界面，选择群集应用程序和资源 > 资源。
3. 选择要配置手动恢复的存储子系统。
4. 从恢复操作字段中，选择 MANUAL。
如果中断影响源站点与目标站点之间的所有镜像链路，那么主存储器上的 IBM FlashSystem® A9000 或 IBM® XIV® Storage System 可能不会故障转移到辅助存储器。在此场景中，镜像一致性组关系仍处于活动状态，但 mirror_switch_roles 命令失败。如果希望镜像一致性组故障转移到辅助存储器，那么必须手动执行以下步骤:
1. 通过运行以下命令来取消激活主存储器上的镜像一致性组关系:
```
mirror_deactivate -y cg=cgname
```
2. 在辅助存储器上，通过运行以下命令将一致性组的角色更改为 Primary :
```
mirror_change_role -y cg=cgname role=Master
```
3. 在主存储器上，通过运行以下命令将一致性组的角色更改为 Slave :
```
mirror_change_role -y cg=cgname role=Slave
```
  注: 更改辅助存储器上一致性组的角色时，辅助存储器上的卷组可能处于 Varied ON 状态，因为辅助存储器上的镜像卷不再处于只读方式。在主存储器上运行 mirror_change_role 命令时，将发生时间延迟，因为主机上的 I/O 活动已中断。要避免时间延迟，请先停止主机上的磁盘 I/O 活动，然后再运行 mirror_change_role 命令。

重要信息: 命令行界面 (CLI) 命令的输入和输出语法使用 "Master" ， "SMaster" 和 "Slave" 卷的旧术语，在除 CLI 引用之外的任何文档中，这些术语称为 "Primary" ， "辅助" 和 "Ter专上"。这种不一致是必要的妥协，是避免更改客户使用的旧 CLI 命令所必需的，也是为了使 CLI 术语保持全面一致。新术语有助于强调多站点 HA/DR ，高可用性 (HyperSwap) 和灾难恢复 (同步和异步镜像) 的最新功能之间的共通性。它在 CLI 参考外部使用，在这里可以解释更广泛的概念。