验证 NFS 服务器高可用性策略

安装并配置 NFS 服务器之后,请验证您的设置是否正确。

要验证安装和配置以使 NFS 服务器具有高可用性,请使用以下示例设置继续执行以下步骤:
  1. 检查 NFS 服务器是否已准备就绪可供使用。
    已使用 IP 地址 192.168.2.4使 NFS 服务器具有高可用性。 要导出的目录为 /work。 在尝试从 NFS 客户机安装导出的文件系统之前,您需要检查 NFS 服务器是否已准备好进行 NFS 客户机连接,以及是否真的将 /etc/exports 中定义的所有文件系统导出到指定的主机。 应用示例设置设置,请输入
    showmount –e 192.168.2.4
    exportfs
    这两个命令的输出应对应于 /etc/exports的内容:
    #cat /etc/exports
    /work node-3(rw,sync)
    #showmount –e 192.168.2.4
    xport list for 192.168.2.4:
    /work node-3
    #exportfs
    /work node-3

    如果发生任何错误,请先解决这些错误,然后再继续执行后续步骤。

  2. 从 NFS 客户机访问自动化 NFS 服务器。
    使用以上示例,检查 NFS 客户机是否能够安装从 192.168.2.4导出的 NFS 文件系统。 NFS 客户机上的安装点为 /mnt/work。 从 NFS 客户机上的命令提示符,以 root 用户身份运行以下命令:
    #mount 192.168.2.4:/work /mnt/work
    如果未发生任何错误,请使用 mount 命令检查结果。
    #mount
    对于此示例,此命令报告具有以下条目的所有已安装文件系统的列表:
    192.168.2.4:/work on /mnt/work type nfs (rw,soft,addr=192.168.2.4)
  3. 测试 NFS 服务器故障转移:

    在验证自动 NFS 服务器在一个节点上工作后,可以尝试故障转移。 在具有 node-1 和 node-2的双节点集群中,从当前运行 NFS 服务器的自动化中排除该节点,并查看它是否在另一个节点上启动。 假定 NFS 服务器在 node-2上运行,请输入:

    samctrl -u a node-2
    这会将 node-2 添加到从自动化中排除的节点列表中。 等待故障转移启动。 然后使用 lssam 命令检查 nfsserver-rg 中的资源:
    Online IBM.ResourceGroup:nfsserver-rg Nominal=Online
         |- Online IBM.AgFileSystem: nfsserver-data-varlibnfs
            |- Online IBM.AgFileSystem:nfsserver-data-varlibnfs:node-1
           '- Offline IBM.AgFileSystem:nfsserver-data-varlibnfs:node-2 Node=Excluded
         |- Online IBM.Application:nfsserver-server
            |- Online IBM.Application:nfsserver-server:node-1
            '- Offline IBM.Application:nfsserver-server:node-2 Node=Excluded
         '- Online IBM.ServiceIP:nfsserver-ip-1
            |- Online IBM.ServiceIP:nfsserver-ip-1:node-1
            '- Offline IBM.ServiceIP:nfsserver-ip-1:node-2 Node=Excluded
    注: 托管导出的文件系统的组也将移至 node-1。
    您始终可以使用 lssamctrl 命令来检查哪些节点被排除,以显示 SAMControl 信息:
    SAMControl:
            TimeOut                = 60
            RetryCount             = 3
            Automation             = Auto
            ExcludedNodes          = {node-2}
            ResourceRestartTimeOut = 5

    确保安装在 NFS 客户机上的 NFS 服务器仍在工作,例如通过访问安装目录。

    现在可以再次将 node-2 包含到自动化中,请输入:
    samctrl -u d node-2

    参数 d 用于从已排除的节点列表中删除该节点。 NFS 服务器在节点 node-1上处于联机状态后,您应该能够访问和修改 NFS 客户机的 NFS 数据。

    在使用 samctrl成功完成此测试方案之后,可以运行更高级的方案,例如节点故障。 在开始之前,请确保满足以下先决条件:
    • 确保已排除节点的列表中没有任何节点。 您可以使用命令 lssamctrl 进行验证。
    • 如果仅具有 2-node-cluster (如上例中所示) ,请确保正确设置了仲裁器。 有关仲裁的更多信息,请参阅 配置仲裁

    如果满足这些先决条件,那么可以通过重新引导当前运行 NFS 服务器的节点或按电源按钮来测试故障转移。 NFS 服务器应该故障转至其他节点,并且 NFS 客户机仍能够连接已安装的 NFS 数据。