SevOne NMS 升级过程指南

关于

本文档介绍SevOneNMS 的升级过程。 如果要执行升级,可以使用命令行界面或图形用户界面安装程序。

重要: 对于自助服务升级
  • SevOne 要求客户主动提交一份工作单,让 IBM SevOne 支持部门知道客户将执行升级。 这样, IBM SevOne 支持部门就能帮助客户做好升级准备和就绪工作。
  • 有关附加组件/定制,请在升级前联系 IBM 技术客户团队IBM SevOne 支持IBM 专家实验室
重要: 容器化

从 SevOne NMS 7.0.0 开始, SevOne 使用容器技术进行分发,使软件的部署更加可靠。 要在 SevOne 设备上运行管理命令,管理员现在必须在目标容器的上下文中执行命令。

默认情况下, SevOne 的容器部署设置为只读

注意: stopIcon 在转向容器技术后,如果您有 Expert Labs 定制,请勿继续 SevOne NMS 7.0.0 或更高版本。 请首先联系专家实验室。 如果您已经部署了任何自己的自定义脚本,那么在写入现在位于只读 pod 中的目录结构时,您可能还需要对这些自定义脚本进行修改。
注意: 已废弃/删除的功能和函数

stopIcon

请勿升级到 SevOne NMS 7.0.0 或更高版本(无论您使用的是以前的哪个 SevOne NMS 版本),直到您查看了已废弃/删除的特性和功能列表。 如需指导,请联系 IBM 技术客户团队IBM SevOne 技术支持IBM 专家实验室

重要说明:

要升级到SevOneNMS7.1.0,必须使用的最低版本是SevOneNMS7.0.1

升级到 "SevOneNMS "7.1.x - when performing an 升级 to SevOne NMS 7.1.0, you 必须 be on SevOne NMS 7.0.1+. If you have SevOne NMS prior to SevOne NMS 7.0.1, you 必须 first upgrade to SevOne NMS 7.0.1 before continuing with an upgrade to SevOne NMS 7.1.0. 有关升级到 SevOne NMS 7.0.1 的详细信息,请参阅 SevOne NMS 升级流程指南

从SevOneNMS7.1.0降级 - 只能降级到SevOneNMS7.0.1 版本。 例如,如果您从SevOneNMS7.0.2升级到 SevOneNMS7.1.0,现在想降级,您将降级到SevOneNMS7.0.1,而不是 SevOneNMS7.0.2

本文档提供了有关如何使用以下命令进行升级/降级的详细信息:

重要: 在开始升级到 SevOne NMS 7.1.x 之前, 必须检查升级前的 AWS 实例类型(如果有)。 如果您当前使用的是 AWS 实例类型 r4.<x> 并需要迁移到支持的 AWS 实例类型 r6i.<x> 请参阅 AWS INSTANCE TYPES FOR SEVONE APPLIANCES 部分了解详情。
重要: 最低磁盘要求、

对于所有平台,如果 / 大于 80GB,那么需要 45GB 可用磁盘空间。

除此之外,

  • 在集群 没有 Openstack上,
    • / 上的可用磁盘空间必须大于 20GB。
  • 在集群 使用 Openstack上,
    • /data 上的可用磁盘空间必须大于 20GB。
注: 术语用法 ...

在本指南中,如果存在,

  • [对 master的任何引用] 或
  • [如果 CLI 命令(用于 NMSKubernetesRedis )包含主站 ]和/或
  • [其输出包含 master ]],它表示领导者控制平面

如果提到奴隶工人 ,则是指追随者代理人

Ansible 可用于升级 SevOne NMS。 请在 SevOne 支持门户网站 上发出请求,以获取最新的正向/逆向迁移 tarball 文件以及升级所需的 签名工具

警告: 元数据:从SevOneNMS7.1.0 开始,设备位置命名空间已开箱即用(OOTB)。 如果这些命名空间已经存在,现在将分别重命名为 "Device.custom和 "Location.custom
要点: 先决条件: 在启动升级之前,请确保
  1. 所有 必需 端口都 已打开。 请参阅 SevOne NMS Port Number Requirements Guide 以获取详细信息。
  2. 升级预检查期间需要端口 60006。
  3. 您可以根据 SevOne NMS 安装指南-虚拟设备 > 硬件需求部分获得所需的 CPU ,总 vCPU 核心数, RAM (GB) ,硬盘驱动器等。
    注:由于技术进步,资源需求可能会发生变化。

    在虚拟机部署上执行 SevOne NMS 版本升级意味着在虚拟机上的部署是在先前的 SevOne NMS 版本上完成的。 因此,当前虚拟机的硬件规范将位于先前在其上部署或升级到的虚拟机的 SevOne NMS 版本上。 如果此升级的目标 SevOne NMS 版本与虚拟机上的当前配置具有不同的硬件规范,请务必在升级之前根据 SevOne NMS 升级的目标版本的当前记录需求来调整硬件资源。

    如果 CPU , vCPU 核心总数和 RAM (GB) 与目标版本需求不匹配,请与基础架构团队讨论以调整虚拟机所需的资源。

    如果硬盘空间需要增加以符合 SevOne NMS 的目标版本需求,那么必须考虑以下内容。

    • 请与基础架构团队联系,以在系统管理程序结束时增加虚拟机上的磁盘空间。
    • 一旦在管理程序级别成功调整了磁盘空间大小,在开始升级之前,必须按照 " 扩展逻辑卷 "一节的说明完成以下步骤。

    如果虚拟机的任何定制需求/规范高于 SevOne NMS 安装指南-虚拟设备 > 硬件需求部分中记录的规范,请联系 技术客户经理 以讨论定制需求的详细信息。

注: WiFi 解决方案适用于您的环境吗?

如果您的环境中有 WiFi 解决方案,并且想要从 SevOne NMS 7.0.x 升级到 SevOne NMS 7.1.x ,则必须在开始升级之前检查以下内容。

以下内容适用于您希望接入点 (AP) 设备具有前缀或 AP 设备已经具有前缀的情况。
  1. 使用 ssh ,以支持 或根用户身份登录 SevOne NMS 设备( SevOne NMS 群集的群组长)。
    
    ssh support@<NMS appliance>
    
    OR 
    
    ssh root@<NMS appliance>
    
  2. 转到 /config/collectors/wifi/configuration 目录。
    
    cd /config/collectors/wifi/configuration
    
  3. 使用您选择的文本编辑器,检查 wifi_global_settings.json 文件中的 NO_PREFIX 标志。
    
    vi wifi_global_settings.json
    
  4. NO_PREFIX 标志必须设置为 false。 如果标志设置为 true ,则编辑 wifi_global_settings.json 文件,并将标记设为 false。 如果缺少 NO_PREFIX 标记,请在文件中添加该标记并将其设置为 false
    
    {
        "AP_ESS_AGG_BL": "",
        "AP_ESS_AGG_BL_ALL": false,
        "COLLECT_STATION_USERNAME": true,
        "NO_PREFIX": false,
        "WLC_ESS_BL": "",
        "WLC_ESS_WL": "",
        "WLC_VERBOSE": 2,
        "COLLECT_AUDIT_LOGS": true
    }
    
  5. 保存 wifi_global_settings.json 文件

现在可以开始升级了。

重要提示 :升级后,启用 WiFi 插件之前,请检查 /config/collectors/wifi/configuration/wifi_global_settings.json 中的 NO_PREFIX 标志,确保它仍然设置为 false。 如果没有,请在启用 WiFi 插件前将标记设为 false

准备升级

注意:

必须使用 SevOne NMS 7.0.1 才能升级到 SevOne NMS 7.1.0。

示例# 1:在小型群集上将 SevOne NMS 7.0.1 升级到 SevOne NMS 7.1.0
  • 群集设置
    • 集群包括 4 xvPAS 20Ks,无 DNC,无 HSA
    • 群集正在监控 800 台设备、79,200 个对象和 548,800 个指标
    • 回填 3 个月的数据
    • 已配置 SDB 导出
  • 时间安排
    • 升级需要 ~30 分钟
      升级总时间 耗用时间
      即时图表宕机 ~ 5 分钟
      设备管理器可用性 ~ 5 分钟
      采集中断(SNMP / ICMP) - 数据丢失 < 5 分钟
      中断警报 未检测到;< 5 分钟
      陷阱生成 未检测到;< 5 分钟
      系统数据处理中断 5 分钟
      重启群集 3-5 分钟
      注意:重启过程中可能会出现中断,但上表中并未反映。
示例# 2:在大型群集上将 SevOne NMS 7.0.1 升级到 SevOne NMS 7.1.0
  • 群集设置
    • 群组由 20 x(PAS200Ks、DNC、HSA)组成
    • 群集正在监控 800 台设备、79,200 个对象和 548,800 个指标
    • 回填 3 个月的数据
    • 已配置 SDB 导出
  • 时间安排
    • 升级需要 ~2 小时 15 分钟
      升级总时间 耗用时间
      即时图表宕机 ~ 5 分钟
      设备管理器可用性 ~ 5 分钟
      采集中断(SNMP / ICMP) - 数据丢失 < 5 分钟
      中断警报 未检测到;< 5 分钟
      陷阱生成 未检测到;< 5 分钟
      系统数据处理中断 未追踪
      重启群集 8-10 分钟
      注意:重启过程中可能会出现中断,但上表中并未反映。

注意 :时间可能因群集而异。

重要信息: 是否使用了流模板?

从 SevOne NMS 6.5.0开始,如果流模板包含字段 95 ,那么您将在流模板中看到以下名称更改。

字段号 预先存在的字段名称 新建字段名称
95 应用程序标记 应用程序标识
45010 引擎 ID-1 Application Engine 标识
45011 应用程序标识 应用程序选择器标识
  1. 使用ssh,以支持身份登录SevOneNMS 设备(SevOneNMS 群集的群组组长)。
    ssh support@<NMS appliance>
  2. 您需要以根用户身份运行。 输入以下命令运行/切换为根用户。
    
    sudo su
  3. 转到/data目录。
    
    cd /data
    
  4. 检查升级目录是否存在。 如果没有,那就创建它。
    
    mkdir upgrade
    
  5. 将目录更改为/data/upgrade
    
    cd /data/upgrade
    
  6. 检查 NMS 设备正在运行的版本。 例如,下面的输出显示 NMS 设备位于 SevOne NMS 7.0.1 上。 您必须使用 SevOne NMS 7.0.1 或更高版本,才能升级到 SevOne NMS 7.1.0。 该命令将带您进入 NMS 容器,并检索当前使用的 SevOne NMS 版本。
    示例
    
    podman exec -it nms-nms-nms SevOne-show-version
                
    SevOne 版本: 7.0.1
    内核版本: 4.18.0-553.8.1.el8_10.x86_64 #1 SMP Fri Jun 14 03:19:37 EDT 2024
    nginx 版本: 1.14.1
    MySQL 版本: 10.6.18-MariaDB
    PHP 版本: 8.3.9
    SSH/SSL 版本: OpenSSH_8.0p1, OpenSSL 1.1.1k FIPS 2021 年 3 月 25 日
    REST API 版本: 2.1.47, Build time 2024-05-16T06:53:00+0000, Hash 07f225e
    
        英特尔® 至强® 处理器
        2 个内核 @ 2199.998MHz
        8GB 内存
        4GB 交换
        150 GB/分区
        150 GB /数据分区
     
  7. 验证操作系统版本。 确认版本为Red Hat Enterprise Linux(RHEL)。
    
    cat /etc/redhat-release
              
    Red Hat Enterprise Linux 发布 8.10 (Ootpa)
  8. Using curl -kO, copy the signature tools 校验和值 file (签名工具-<最新version>-build.<###>.tgz.sha256.txt) received from SevOne to /data/upgrade directory. 例如,signature-tools-2.0.3-build.1.tgz.sha256.txt
  9. 使用curl -kO,将从SevOne收到的签名工具文件(signature-tools-<最新版本>-build.<###>.tgz)复制到/data/upgrade目录。 例如,signature-tools-2.0.3-build.1.tgz
  10. 验证签名工具 校验和是否在/data/upgrade目录中。
    
    cd /data/upgrade
    
    sha256sum --check signature-tools-<latest version>-build.<###>.tgz.sha256.txt

    示例

    
    sha256sum --check signature-tools-v2.0.3-build.1.tgz.sha256.txt
              
    signature-tools-v2.0.3-build.1.tgz: 好的
    
  11. 解压缩 特征符工具 tar 文件。
    tar -xzvf signature-tools-<latest version>-build.<###>.tgz -C / 

    示例

    tar -xzvf signature-tools-v2.0.3-build.1.tgz -C / 
  12. 使用curl -kO,将从SevOne收到的 forward tarball 文件(<forwardSevOneNMS tarball>.tar.gz)复制到/data/upgrade目录。 例如,SevOneNMS7.1.0 的压缩包文件。
  13. 使用curl -kO,将从SevOne收到的校验和文件(<forward SevOne NMStarball>.sha256.txt)复制到/data/upgrade目录。
  14. 更改目录。
    cd /data/upgrade
  15. (可选) 验证正向 tarball 的签名。

    确保使用有效且可信的证书,

    
    /usr/local/bin/SevOne-validate-image -i v7.1.0-build<enter build number>.tar.gz -s v7.1.0-build<enter build number>.tar.gz.sha256.txt
              
    INFO:从图像文件中提取代码签名证书...
    图片由 SevOne Release 于 Tue, 15 Oct 2024 16:50:34 +0000 签署。
    
    证书是可信的。
    证书主题=
        commonName                = International Business Machines Corporation
        organizationalUnitName = IBM CCSS
        organizationName          = International Business Machines Corporation
        localityName = 阿蒙克
        stateOrProvinceName = 纽约
        countryName = 美国
    
    证书颁发者=
        commonName = DigiCert 受信任 G4 代码签名 RSA4096 SHA384 2021 CA1
        organizationName = DigiCert, Inc.
        countryName = 美国
    
    信息: 检查图像的签名
    
    可以安装图像。
    

    如果证书不可信或签名不匹配,请联系 SevOne 支持团队

准备好升级设置后,可以继续升级 使用图形用户界面安装程序升级使用命令行界面升级

使用图形用户界面安装程序升级

  1. 从您选择的网络浏览器中输入SevOneNMS 设备的URL。 例如,<SevOneNMS 设备 IP 地址>
  2. 单击左侧群集层次结构中的 厘米集群群集 ,然后选择右侧的群集升级选项卡,使用图形用户界面升级群集。 此选项卡将包含SevOneNMS 图形用户界面安装程序和升级历史记录的所有详细信息。

    clusterUpgradeUPG

  3. 如果已经执行了 "为升级做好准备"一节中的步骤,则已获得所需的升级文件,可以跳过 "步骤 1:通过 SFTP 服务器获取升级工件"下的字段。 如果没有,并且/data/upgrade文件夹中没有所需的升级文件,请执行 "准备升级 "一节中的步骤,或在以下字段中输入要升级的SevOneNMS 的值。
    • 服务器 IP- 供SevOneNMS 使用的 SFTP 服务器的 IP 地址或主机名。
    • 端口- 远程服务器上运行 SFTP 服务器的端口号。 默认值为端口 22。 SevOneNMS 将向该端口发送报告。
    • Username- 用于从远程服务器复制人工制品的用户名。
    • 密码-SevOneNMS 验证 SFTP 服务器所需的密码。
    • 升级工件的FilePath- 要下载 tar 文件的远程 SFTP 服务器上的工件路径。 用户必须具有读取工件的权限。
    • 单击 " 获取升级工件 "按钮,获取 SevOne NMS 用于升级的工件。 工件会被放到群集领导者的 /data/upgrade 目录中。
      注意:

      如果已在"群集管理器">"群集设置"选项卡>"SFTP"子选项卡上配置了 SFTP 服务器,则除路径外,将获取相同的配置。 您可以使用相同的服务器,也可以在此配置不同的服务器。

      根据文物的大小,这一步骤可能需要一些时间。

      如果没有 SFTP,可直接将工件复制到 Cluster Leader 的/data/upgrade目录。

  4. 在 "步骤 2:添加域名"部分,在以下字段中输入要升级的SevOneNMS 的值。
    • 域名- 输入用逗号分隔的域名,请勿https:// 例如,test.sevone.com,test2.sevone.com
    • 单击 "保存域名"按钮保存域名。
  5. 在 "步骤 3:运行安装程序以使用新下载的升级工件和查看URL"部分,单击 "运行安装程序"按钮,使用工件中的最新版本升级SevOneNMS。 以下内容在后台处理。
    • 从工具中提取最新的安装程序。
    • 安装程序已升级到最新版本。
    • 生成安装程序的URL。

    clusterUpgradeRunInstallerComplete

    您可以进入生成的URL,通过图形用户界面启动升级。 按照升级阶段一节中的步骤操作。

  6. 群集升级历史"部分显示使用图形用户界面安装程序进行的所有先前升级的群集升级历史。
    详情如下
    • 起始版本- 升级前群集的SevOneNMS 版本。
    • 前向版本- 群集升级到的SevOneNMS 版本。
    • 现状 - The status of the upgrade. 即表明升级是正在进行、成功还是失败。
    • 升级完成时间- 该字段显示完成升级所需的时间。

升级阶段

  1. 使用您选择的浏览器,输入上述步骤中安装程序返回的URL。 例如 https://10.49.10.156:9443/.
  2. 输入登录凭证以启动升级阶段。

    ssuLaunchUpgradeStages

要点: 下面是升级使用图形用户界面执行的各种阶段。 请等待阶段成功完成,然后再移至下一个阶段。

检查升级阶段

此阶段检查更新是否可用于 SevOne NMS 集群。

createUpgrade

  • darkThemeGUIinstaller - 表示可以切换到深色主题。
  • 当前版本 -表示 SevOne NMS 集群的当前版本。
  • 升级可用 -表示可用更新的版本。 升级工件(tarball)必须位于 Active Cluster Leader 的 /data/upgrade目录中,该阶段才能检测到可用的更新。
  • 阅读发行说明 -提供指向要升级到的 SevOne NMS 版本发行说明的链接。
  • 有限功能- 提供群集的升级统计数据和测试参数,如
    • 总升级时间
    • 对轮询的估计中断
    • 网络流的估计中断
    • 警报的估计中断
    • SURF UI 的估计中断 (用户界面)
    • 对 SURF 报告的估计中断
    • 估算的来自 DI 的报告中断情况 (Data Insight)
    • 为以上每个估计的测试环境提供的测试参数
      注: 统计信息可能根据集群大小和测试环境变量而有所不同。
  • 如果存在高于当前 SevOne NMS 版本的版本的工件,那么可以通过单击 继续升级前来进入下一个阶段。
注: 在升级,升级和运行状况检查之前的阶段,您将观察任务状态更新。

升级前阶段

"升级前" 阶段仅对 SevOne NMS 集群运行升级前检查,以确保系统已准备好进行升级。

单击 运行升级前 以确保 SevOne NMS 集群在升级过程中运行状况良好。 其中一些检查包括:
  • 对等连接
  • MySQL 复制和总体 NMS 运行状况
  • 可用磁盘空间
    注: 运行升级前检查可能需要几分钟时间。

preUpgrade

  1. 顶部显示升级前检查的总体状态和进度。 状态可以是 正在进行中成功失败
  2. 同级下,是同级,对等状态和完成进度的列表。 同级的状态可以是:
    1. 不可访问 -表示运行预检查时同级不可访问。
    2. 失败 -表示某些检查在同级上失败。
    3. 已完成 -表示检查已成功完成。

      示例

      preUpgradeStatus

      注: 通过在 同级 部分中选择行,可以查看各个同级上每个任务的状态。 搜索框允许您搜索列表中的任务。

      preUpgradePerPeerTask

      上面截图中的每个 downloadIcon 都执行不同的下载。 您可以下载:

      1. 对等日志
      2. 同级中每个任务的日志
      3. 集群中的所有日志

      单击 下载系统日志 以将系统日志下载到文件。

      所有下载的文件都保存在缺省下载文件夹中。

      完成后,您可以查看和下载每项任务的日志, viewDownloadIcon

      单击 viewIcon 时,会弹出日志查看器。 单击 复制到剪贴板 以复制日志查看器中的内容并将其粘贴到文件中。

      日志查看器

      
      [
        {
          "content": {
            "changed": true,
            "cmd": "podman exec nms-nms-nms SevOne-act check checkout",
            "delta": "0:00:33.941077",
            "end": "2024-10-16 04:16:01.286613",
            "rc": 0,
            "start": "2024-10-16 04:15:27.345536",
            "stderr_lines": [
              ""
            ],
            "stdout_lines": [
              "[ OK ]   No Errors Detected"
            ]
          },
          "ended": "2024-10-16 04:16:01.405758+00:00",
          "peer_name": "127.0.0.1",
          "started": "2024-10-16 04:15:26.609710+00:00",
          "status": "ok",
          "task_name": "Run SevOne-act check checkout"
        }
      ]
      
  3. 摘要 - 阶段底部的摘要显示所选同行和整个群组的任务分解。

    upgradeSummary

    • 总计 -表示集群上对等任务或整体任务的总任务数。
    • 确定 -表示已成功运行的任务数。
    • 已跳过 -表示已跳过的任务数。 并非所有任务都可以在所有同级上运行。 某些任务可能仅在 "集群引导程序" 或 "活动设备" 上运行,而某些任务可能未在某些设备类型 (例如, DNC) 上运行。 在这种情况下,可能会跳过某些同级的任务。
    • 失败 -表示失败的任务数。 您可以查看任何所选同级的每个任务的个别日志。
    • 已忽略 : 表示要忽略其失败的任务/检查。 这些任务/检查失败不会导致阶段失败。
    • 不可访问 -表示由于同级不可访问而失败的任务数。 这是同级变为不可访问并且将不会执行其余任务之后的第一个任务。
    • 未执行 -表示未执行的任务数。 这可能是因为同级不可访问和/或检查之间已停止。
      重要信息: 某些检查 (例如 md5-hack lsof ) 可能失败。 此时,将在整体检查状态中忽略这两项检查的结果。 如果这两项检查中的任何一项失败,那么升级前阶段仍将显示为 Passed。 但是,如果任何其他检查失败,并且需要强制升级,那么可以使用 CLI 来执行升级。

      如果任何预检查失败,强烈建议联系 SevOne 支持人员

在升级前阶段成功完成后,单击 继续 以转至 备份 阶段。

后备台

在执行实际升级之前运行备份。 单击 运行备份 并等待备份成功完成。 此阶段执行几个脚本来备份数据库和几个对系统至关重要的文件夹。 此阶段在 集群引导程序 上运行,并且是 可选

backupUpgrade

选择同级时,它将显示所选同级的任务列表。 搜索框提供在任务列表中进行搜索的功能。

backupUpgradeSearchTasks

注: 大型集群上的备份可能需要一些时间。

备份成功完成后,单击 继续

升级阶段

重要信息: 一旦启动 Upgrade 阶段,请 不要 关闭或刷新选项卡。 此阶段可能需要几分钟时间。

在此阶段,将执行实际 NMS 升级到最新版本。 在升级过程中,您将具有有限的功能。 单击 运行升级。 用户界面工作流程与升级前阶段相同。 允许您从用户界面 当且仅当 运行升级,但预检查已成功。 大多数用户界面组件与升级前检查相同。 您可以查看个别同级和总体集群状态。 底部摘要面板显示同级和整体状态。 在升级时,执行将在第一个失败任务的同级上停止。 其余任务将在底部摘要面板中显示为 "未执行"。

upgradeStatus

任务 下的搜索框提供了在任务列表中进行搜索的功能。

升级阶段成功完成后,您现在已准备好执行运行状况检查。 单击 继续

健康检查阶段

重要信息

目标发行版必须具有新的内核版本。 在执行运行状况检查之前, 必须 重新引导机器以装入新的内核并启动所有服务。 请 不要 跳过此步骤。


podman exec -it nms-nms-nms /bin/bash

SevOne-shutdown reboot

单击 运行状况检查 以在成功升级后运行 SevOne NMS 运行状况检查。 这些检查与升级前检查相同。

upgradeHealthCheck

选择同级时,它将显示所选同级的任务列表。 搜索框提供在任务列表中进行搜索的功能。

注意:健康检查成功完成后,可单击 "完成 "完成升级并返回 "检查升级 "阶段。 只要下一次升级可用,您就可以再次升级 SevOne NMS 群集。

upgradeComplete

从命令行界面确认 NMS 设备正在运行SevOneNMS7.1.0 版本。

示例


podman exec -it nms-nms-nms SevOne-show-version
            
SevOne 版本: 7.1.0
内核版本: 4.18.0-553.22.1.el8_10.x86_64 #1 SMP Wed Sep 11 18:02:00 EDT 2024
nginx 版本: 1.24.0
MySQL 版本: 10.6.19-MariaDB
PHP 版本: 8.3.12
SSH/SSL 版本: OpenSSH_8.0p1, OpenSSL 1.1.1k FIPS 2021 年 3 月 25 日
REST API 版本: 2.1.47, Build time 2024-08-26T14:05:20+0000, Hash 6d6a9c5

    英特尔® 至强® 处理器
    2 个内核 @ 2199.998MHz
    8GB 内存
    4GB 交换
    150 GB/分区
    150 GB /数据分区

升级后清除

清理/data/upgrade目录。


rm /data/upgrade/installRPMs.tar

rm /data/upgrade/DigiCert-cs.crt

rm /data/upgrade/ibm-sevone-cs.crt

rm -rf /data/upgrade/ansible
重要信息: 成功完成升级后,您可以转至 升级后阶段 ,除其他步骤外,可能需要重新引导。 但是,此时可以选择 重新引导。 在这种情况下,如果打开或刷新 GUI 安装程序,您将看到 内部服务器错误。 要在不重启的情况下解决这个问题,可执行以下命令重启服务并访问 URL;例如、 https://10.49.10.156:9443/.

systemctl restart sevone-installer-gunicorn.service

升级后阶段

所有升级阶段成功完成后,请参阅下面的升级后步骤部分。

使用命令行界面升级

  1. 在开始升级之前,建议您执行升级预检,以识别并解决已知的潜在升级阻塞问题。
    
    SevOne-act check checkout --full-cluster
    
    SevOne-act check listening-ports --full-cluster
    
  2. 一旦预检查成功完成,并确定和解决了已知的潜在升级受阻问题,请清理 /data/upgrade 目录。
    
    rm /data/upgrade/installRPMs.tar
    
    rm /data/upgrade/DigiCert-cs.crt
    
    rm /data/upgrade/ibm-sevone-cs.crt
    
    rm -rf /data/upgrade/ansible
    
  3. 将目录更改为/data/upgrade
    
    cd /data/upgrade
    
  4. 解压升级tar 文件。
    
    tar -xzvf v7.1.0-build<enter build number>.tar.gz
    
  5. 将目录更改为/data/upgrade/ansible
    
    cd /data/upgrade/ansible
    
  6. 运行升级脚本启动从SevOneNMS7.0.1SevOneNMS7.1.0 的升级。
    
    ./upgrade.sh
    
    重要:根据群集的大小,升级时间可能会有所不同;请等待升级成功完成。
    注意:以下标记为区分大小写的参数。 如果传递的标志/参数不止一个,则必须用单/双引号传递。

    重要: 对于升级前标志-e和-f、

    可以添加-e标记,跳过升级前的错误。

    可以添加-f标记,跳过升级前检查并强制安装。

    不过,即使通过-e-f标志,也不会跳过某些预检查。 例如,在执行升级时,当前的SevOneNMS 版本必须是要升级到的SevOneNMS 版本之前的版本。 否则,您将收到"NMS 的起始版本应小于 NMS 的前进版本 消息。

    • -a:避免使用游戏本标签运行。
    • -c:防止hosts.ini自动再生。 如果将此标记作为选项,hosts.ini将自动重新生成。
    • -e:如果发现升级前错误,则跳过该错误,仅在不使用-f选项时适用。
    • -f:跳过升级前检查并强制安装。
    • -n:n: 不要在屏幕会话中启动。 用于自动构建。
    • -s:s: 在不使用 UI 日志记录器的情况下运行升级。
    • -x:使用--hub-spoke-network选项进行升级前检查。
    • -h:显示此帮助。

    例如,

    跳过所有升级前检查运行升级、

    
    ./upgrade.sh -f

    使用轮毂-轮辐标志运行升级、

    
    ./upgrade.sh -x
    1. 安装程序将启动名为 ansible-{version}的屏幕会话。
      重要信息: 必须 拆离终端上的屏幕会话,因为正在进行的进程位于内存中,并且在升级期间软件包在设备上可能不再可用。

      在屏幕中完成 ansible-playbook 执行后,必须 退出 屏幕会话。

      在升级时使用单独的 ssh 连接到框,可能会在终端上显示一些 PHP/其他警告。 SevOne 建议您等待升级过程成功完成。

    2. 将同时更新所有 同级 / 主机 上的包。 [标记 :prepare_rpm , install_rpm , docker_setup]
    3. 数据库迁移在 clustermaster (mysqlconfig 和 mysqldata) 和 活动同级 (仅限 mysqldata) 上运行。 [标记: 数据库]
    4. 系统补丁同时在 所有同级 上运行。 [标记 :systempatch]
    5. 最后将在 所有主机 上执行清除操作。 [标记: 清除]
    6. 您的计算机上安装了SevOneNMS7.1.0。

      升级将打开 " TUI (基于文本的用户界面) " 或 " 终端用户界面 " 窗口,该窗口将进度拆分为 3 列。

      重要信息: 如果无法与屏幕会话交互,那么仍必须能够在 列 1中查看进度。 允许升级完成。
      • 列 1: 主机面板-显示每个主机的进度。
      • 列 2: "任务" 面板-显示正在执行的任务。
      • 列 3: "日志" 面板-显示与每个任务关联的日志。
        重要信息: FYI
        • F1 以显示/隐藏 HELP。
        • Ctrl + C-终止可执行。

        要在面板/列之间导航,请按:

        • 1 -选择列 1 (主机面板)
        • 2 -选择列 2 ("任务" 面板)
        • 3 -选择列 3 ("日志" 面板)
        • 向上箭头 -将光标/日志向上移动
        • 向下箭头 -将光标/日志下移
        • 向左箭头 -向左移动光标/日志
        • 向右箭头 -向右移动光标/日志

        要从屏幕方式拆离,请按 Ctrl + A ,后跟字母 d。 要附加到屏幕方式,请输入 screen r

        升级

        upgradeUILogger

        单击 F1 以在记录器中显示 HELP 菜单

        upgradeUILoggerHelp

  7. 成功升级到SevOneNMS7.1.0 后,检查版本以确保您使用的是SevOneNMS7.1.0,即SevOneNMS7.1.0,如下例所示。

    示例

    
    podman exec -it nms-nms-nms SevOne-show-version
                
    SevOne 版本: 7.1.0
    内核版本: 4.18.0-553.8.1.el8_10.x86_64 #1 SMP Fri Jun 14 03:19:37 EDT 2024
    nginx 版本: 1.24.0
    MySQL 版本: 10.6.19-MariaDB
    PHP 版本: 8.3.12
    SSH/SSL 版本: OpenSSH_8.0p1, OpenSSL 1.1.1k FIPS 2021 年 3 月 25 日
    REST API 版本: 2.1.47, Build time 2024-08-26T14:05:20+0000, Hash 6d6a9c5
    
        英特尔® 至强® 处理器
        2 个内核 @ 2199.998MHz
        8GB 内存
        4GB 交换
        150 GB/分区
        150 GB /数据分区
重要信息: 升级后

有关升级后的步骤,请参阅下面的 "升级后阶段"部分。

为降级做好准备

注意:

从 SevOne NMS 7.1.0 降级时, 只能降级到 SevOne NMS 7.0.1。

示例# 1:在小型群集上将 SevOne NMS 7.1.0 降级为 SevOne NMS 7.0.1
  • 群集设置
    • 集群包括 4 xvPAS 20Ks,无 DNC,无 HSA
    • 群集正在监控 800 台设备、79,200 个对象和 548,800 个指标
    • 回填 3 个月的数据
    • 已配置 SDP 导出
  • 时间安排
    • 降级需要 ~44 分钟
    • 系统不可用约 6 分钟,让pod重新启动
示例# 2:在大型群集上将 SevOne NMS 7.1.0 降级为 SevOne NMS 7.0.1
  • 群集设置
    • 群组由 20 x(PAS200Ks、DNC、HSA)组成
    • 群集正在监控 800 台设备、79,200 个对象和 548,800 个指标
    • 回填 3 个月的数据
    • 未配置 SDP 导出
  • 时间安排
    • 降级需要 ~1 小时 30 分钟
    • 系统不可用约 6 分钟,让pod重新启动

注意 :时间可能因群集而异。

  1. 使用ssh,以支持身份登录SevOneNMS 设备(SevOneNMS 群集的群组组长)。
    ssh support@<NMS appliance>
  2. 您需要以根用户身份运行。 输入以下命令运行/切换为根用户。
    
    sudo su
  3. 转到/data目录。
    
    cd /data
    
  4. 检查升级目录是否存在。 如果没有,那就创建它。
    
    mkdir upgrade
    
  5. 将目录更改为/data/upgrade
    
    cd /data/upgrade
    
  6. 检查 NMS 设备正在运行的版本。 例如,下面的输出显示 NMS 设备位于 SevOne NMS 7.1.0 上。 进行降级时,您将降级到 SevOne NMS 7.0.1。 例如,如果您从 SevOne NMS 7.0.2 升级,现在想继续降级,您将降级到 SevOne NMS 7.0.1 ,而不是 SevOne NMS 7.0.2。 该命令将带您进入 NMS 容器,并检索当前使用的 SevOne NMS 版本。
    示例
    
    podman exec -it nms-nms-nms SevOne-show-version
                
    SevOne 版本: 7.1.0
    内核版本: 4.18.0-553.8.1.el8_10.x86_64 #1 SMP Fri Jun 14 03:19:37 EDT 2024
    nginx 版本: 1.24.0
    MySQL 版本: 10.6.19-MariaDB
    PHP 版本: 8.3.12
    SSH/SSL 版本: OpenSSH_8.0p1, OpenSSL 1.1.1k FIPS 2021 年 3 月 25 日
    REST API 版本: 2.1.47, Build time 2024-08-26T14:05:20+0000, Hash 6d6a9c5
    
        英特尔® 至强® 处理器
        2 个内核 @ 2199.998MHz
        8GB 内存
        4GB 交换
        150 GB/分区
        150 GB /数据分区
     
  7. 验证操作系统版本。 确认版本为Red Hat Enterprise Linux(RHEL)。
    
    cat /etc/redhat-release
              
    Red Hat Enterprise Linux 发布 8.10 (Ootpa)
  8. Using curl -kO, copy the signature tools 校验和值 file (签名工具-<最新version>-build.<###>.tgz.sha256.txt) received from SevOne to /data/upgrade directory. 例如,signature-tools-2.0.3-build.1.tgz.sha256.txt
  9. 使用curl -kO,将从SevOne收到的签名工具文件(signature-tools-<最新版本>-build.<###>.tgz)复制到/data/upgrade目录。 例如,signature-tools-2.0.3-build.1.tgz
  10. 验证签名工具 校验和是否在/data/upgrade目录中。
    
    cd /data/upgrade
    
    sha256sum --check signature-tools-<latest version>-build.<###>.tgz.sha256.txt

    示例

    
    sha256sum --check signature-tools-v2.0.3-build.1.tgz.sha256.txt
              
    signature-tools-v2.0.3-build.1.tgz: 好的
    
  11. 解压缩 特征符工具 tar 文件。
    tar -xzvf signature-tools-<latest version>-build.<###>.tgz -C / 

    示例

    tar -xzvf signature-tools-v2.0.3-build.1.tgz -C / 
  12. 使用curl -kO,将从SevOne收到的反向压缩包文件(<reverseSevOneNMS tarball>.tar.gz)复制到/data/upgrade目录。 例如,SevOneNMS7.1.0 的压缩包文件。
  13. 使用curl -kO,将从SevOne收到的校验和文件(<reverse SevOne NMStarball>.sha256.txt)复制到/data/upgrade目录。
  14. 更改目录。
    cd /data/upgrade
  15. (可选)验证反向压缩包的签名。

    确保使用有效且可信的证书,

    
    /usr/local/bin/SevOne-validate-image -i v7.1.0-to-v7.0.1-build<enter build number>.tar.gz -s v7.1.0-to-v7.0.1-build<enter build number>.tar.gz.sha256.txt
              
    INFO:从图像文件中提取代码签名证书...
    图片由 SevOne Release 于 Tue, 15 Oct 2024 16:11:10 +0000 签署。
    
    证书是可信的。
    证书主题=
        commonName                = International Business Machines Corporation
        organizationalUnitName = IBM CCSS
        organizationName          = International Business Machines Corporation
        localityName = 阿蒙克
        stateOrProvinceName = 纽约
        countryName = 美国
    
    证书颁发者=
        commonName = DigiCert 受信任 G4 代码签名 RSA4096 SHA384 2021 CA1
        organizationName = DigiCert, Inc.
        countryName = 美国
    
    信息: 检查图像的签名
    
    可以安装图像。

    如果证书不可信或签名不匹配,请联系 SevOne 支持团队

准备好降级设置后,就可以继续使用命令行界面进行降级。

使用命令行界面降级

  1. 开始降级前,清理/data/upgrade目录。
    
    rm /data/upgrade/installRPMs.tar
    
    rm /data/upgrade/DigiCert-cs.crt
    
    rm /data/upgrade/ibm-sevone-cs.crt
    
    rm -rf /data/upgrade/ansible
    
  2. 将目录更改为/data/upgrade
    
    cd /data/upgrade
    
  3. 解压降级tar 文件。
    
    tar -xzvf v7.1.0-to-v7.0.1-build<enter build number>.tar.gz
    
  4. 将目录更改为/data/upgrade/ansible
    
    cd /data/upgrade/ansible
    
  5. 运行降级脚本启动从SevOneNMS7.1.0SevOneNMS7.0.1 的降级。
    
    ./reverse.sh
    
    重要:根据群集的大小,降级时间可能会有所不同;请等待降级成功完成。
    注意:以下标记为区分大小写的参数。 如果传递的标志/参数不止一个,则必须用单/双引号传递。
    • -a:避免使用游戏本标签运行。
    • -e:如果发现升级前错误,则跳过该错误,仅在不使用-f选项时适用。
    • -f:跳过升级前检查并强制安装。
    • -n:n: 不要在屏幕会话中启动。 用于自动构建。
    • -s:s: 在不使用 UI 日志记录器的情况下运行升级。
    • -x:使用--hub-spoke-network选项进行升级前检查。
    • -h:显示此帮助。

    例如,

    跳过所有升级前检查,运行降级、

    
    ./reverse.sh -f

    使用轮毂-辐条标志运行降级、

    
    ./reverse.sh -x

    要跳过升级前的错误检查来运行降级、

    
    ./reverse.sh -e
    1. 安装程序将启动名为 ansible-{version}的屏幕会话。
      重要信息: 必须 拆离终端上的屏幕会话,因为正在进行的进程位于内存中,并且在降级期间软件包可能在设备上不再可用。

      在屏幕中完成 ansible-playbook 执行后,必须 退出 屏幕会话。

      在降级时使用与框的单独 ssh 连接,可能会在终端上显示一些 PHP/其他警告。 SevOne 建议您等待降级过程成功完成后再执行。

    2. 将同时更新 所有同级/主机 上的软件包。 [标记 :prepare_rpm , install_rpm 和 docker_setup]
    3. 反向数据库迁移在 clustermaster (mysqlconfig 和 mysqldata) 和 活动同级 (仅限 mysqldata) 上运行。 [标记: 数据库]
    4. 系统补丁同时在 所有同级 上运行。 [标记 :systempatch]
    5. 最后将在 所有主机 上执行清除操作。 [标记: 清除]
    6. 如果您使用的是 SevOne NMS 7.1.0 , SevOne NMS 7.0.1 现在已安装在您的机器上,因为 SevOne NMS 7.1.0 是由 SevOne NMS 7.0.1 升级而来的。

      降级将打开 " TUI (基于文本的用户界面) " 或 " 终端用户界面 " 窗口,该窗口会将进度分割为 3 列。

      重要信息: 如果无法与屏幕会话交互,那么仍必须能够在 列 1中查看进度。 允许降级完成。
      • 列 1: 主机面板-显示每个主机的进度。
      • 列 2: "任务" 面板-显示正在执行的任务。
      • 列 3: "日志" 面板-显示与每个任务关联的日志。
        重要信息: FYI
        • F1 以显示/隐藏 HELP。
        • Ctrl + C-终止可执行。

        要在面板/列之间导航,请按:

        • 1 -选择列 1 (主机面板)
        • 2 -选择列 2 ("任务" 面板)
        • 3 -选择列 3 ("日志" 面板)
        • 向上箭头 -将光标/日志向上移动
        • 向下箭头 -将光标/日志下移
        • 向左箭头 -向左移动光标/日志
        • 向右箭头 -向右移动光标/日志

        要从屏幕方式拆离,请按 Ctrl + A ,后跟字母 d。 要附加到屏幕方式,请输入 screen r

        降级

        reverseUILogger

        单击 F1 以在记录器中显示 HELP 菜单

        reverseUILoggerHelp

  6. 成功降级到SevOneNMS7.0.1 后,请检查版本以确保您使用的是SevOneNMS7.0.1,如下例所示。

    示例

    
    podman exec -it nms-nms-nms SevOne-show-version
                
    SevOne 版本: 7.0.1
    内核版本: 4.18.0-553.22.1.el8_10.x86_64 #1 SMP Wed Sep 11 18:02:00 EDT 2024
    nginx 版本: 1.14.1
    MySQL 版本: 10.6.18-MariaDB
    PHP 版本: 8.3.9
    SSH/SSL 版本: OpenSSH_8.0p1, OpenSSL 1.1.1k FIPS 2021 年 3 月 25 日
    REST API 版本: 2.1.47, Build time 2024-05-16T06:53:00+0000, Hash 07f225e
    
        英特尔® 至强® 处理器
        2 个内核 @ 2199.998MHz
        8GB 内存
        4GB 交换
        150 GB/分区
        150 GB /数据分区
    
  7. 检查已安装的内核软件包。

    检查内核版本

    
    podman exec -it nms-nms-nms SevOne-show-version
    OR
    rpm -qa | grep kernel
    OR
    uname -r
    要点: 内核会在降级过程中自动更新,而并非每个 NMS 发行版都有新的内核。

    根据 NMS 发行版,内核版本必须为:

    SevOne NMS 版本 内核版本
    NMS7.0.1 4.18.0-553.el8_10.x86_64
    NMS7.1.0 4.18.0-553.8.1.el8_10.x86_64

    内核版本基于 NMS 发行版。

    内核版本必须基于 NMS 发行版。 否则,必须通过执行以下步骤来重新引导整个集群以应用新内核,否则不需要重新引导。

    
    SevOne-shutdown reboot
  8. 确认 NMS 设备正在运行SevOneNMS7.0.1 版本。
    
    podman exec -it nms-nms-nms SevOne-show-version
                
    SevOne 版本: 7.0.1
    内核版本: 4.18.0-553.8.1.el8_10.x86_64 #1 SMP Fri Jun 14 03:19:37 EDT 2024
    nginx 版本: 1.14.1
    MySQL 版本: 10.6.18-MariaDB
    PHP 版本: 8.3.9
    SSH/SSL 版本: OpenSSH_8.0p1, OpenSSL 1.1.1k FIPS 2021 年 3 月 25 日
    REST API 版本: 2.1.47, Build time 2024-05-16T06:53:00+0000, Hash 07f225e
    
        英特尔® 至强® 处理器
        2 个内核 @ 2199.998MHz
        8GB 内存
        4GB 交换
        150 GB/分区
        150 GB /数据分区
    
  9. 清理/data/upgrade目录。
    
    rm /data/upgrade/installRPMs.tar
    
    rm /data/upgrade/DigiCert-cs.crt
    
    rm /data/upgrade/ibm-sevone-cs.crt
    
    rm -rf /data/upgrade/ansible
    
    
  10. 执行以下命令以识别错误 (如果有)。
    SevOne-act check checkout --full-cluster --verbose

记录文件

日志文件可在 /var/log/SevOne/ansible-reverse/<toVersion>/<timestamp>/<peerIP>.log 中找到。

例如,/var/log/SevOne/ansible-reverse/v7.1.0/<timestamp>/<peerIP>.log

  • 每个同级都将有自己的日志文件位于 集群引导者
  • 将为降级的每次运行创建新的日志文件,并按时间戳记文件夹进行拆分

升级后的步骤

注意:如果升级后的 NMS 版本的内核版本高于升级前的内核版本,操作系统 只需要重新启动 post-SevOne后的 NMS。 将重新引导集群 必须 中的每个设备以装入新内核并启动每个设备上的所有服务。 升级后,有两个可能的选项可用于重新启动集群中的设备,您可以选择以下任意一个首选选项。

选项 1: 通过在主/辅助设备之间执行故障转移来重新引导设备

选项 2: 在不进行故障转移的情况下重新引导设备

重要: 在任一选项中,请确保先成功重新启动所有其他设备,然后再对集群引导程序 active 设备执行重新启动操作。

要点: 升级成功完成后,请继续执行以下步骤。

如果 updater 进程正在运行,那么用于关闭/重新引导设备的命令将不会继续,并且您将收到一条消息,建议您使用 -- force 选项。

建议使用强制操作,因为这可能会导致短期数据丢失。 更新程序调度为每 2 个小时开始运行一次,甚至在超过该小时的 30 分钟时开始运行。 例如,从 0 0 开始: 30 ,02:30 和 04:30 等。 updater 进程预计将运行约 1800 秒 (30 分钟)。 但是,在非常大和繁忙的设备上,有时可能需要几分钟的时间。 因此,计划在更新程序进程 运行时重新引导设备。

查找集群引导者

在使用上述其中一个选项重新引导集群中的设备之前,必须记下集群中作为集群引导者的设备。 从 管理 > 集群管理器 > 集群概述 选项卡> 字段 集群引导者 提供作为 引导者的设备的名称。 例如,如以下截屏中所示, pandora-01集群引导者

isClusterLeader

(选项 1) 通过在主/辅助设备之间执行故障转移来重新引导设备

在执行设备重新引导时不需要执行故障转移/故障恢复,但为了最大限度减少由于重新引导而导致的轮询停机时间,此选项可用于在主/辅助设备之间执行故障转移,重新引导和故障恢复。

注: 在升级时,辅助设备可能是该对的活动设备。 在以下步骤中,假定并引用了主设备处于活动状态且辅助设备处于被动状态。 在继续执行以下步骤之前,必须始终检查哪个设备是该对的当前主动/被动设备。

必须按每个同级手动执行故障转移操作,建议不要同时在多个同级上执行故障转移。 但是,可以同时以 4 到 5 设备的批处理方式重新引导多个设备。 请务必注意,集群引导程序对的故障转移步骤必须在重新引导所有其他设备后最后完成。

注: 在没有关联辅助设备的单个设备同级上不可能执行故障转移操作。 对于此类同级,在重新启动活动设备时,设备仍需要重新引导。

首先重新引导辅助设备 (包括集群引导辅助设备)

标识以确认对的被动设备。 从 管理 > 集群管理器 > 左侧导航栏中,展开同级以确定该对中的哪个设备当前处于被动状态。 例如,以下截屏中显示的 10.129.13.121 是该对的被动设备。

passiveAppliance

  1. 使用ssh,以支持 登录每个SevOneNMS被动的设备,包括群集领导者被动设备。
    ssh support@<NMS 'passive' appliance>
  2. 重新引导 被动 设备。
    
    podman exec -it nms-nms-nms /bin/bash
    
    SevOne-shutdown reboot
    注: 对每个被动设备 (包括集群引导被动设备) 重复以上步骤。
    重要信息: 可以同时以批处理方式重新启动不同同级的多个被动设备。 SevOne 建议同时对 5 设备执行不超过 4 的操作,以保持操作可管理。

在重新引导辅助设备后检查并确认复制状态

在重新引导后备份被动设备后,请确认复制对每个对都有好处-复制可能需要几分钟时间。 执行以下命令以检查已重新引导的设备的系统正常运行时间和复制状态。


podman exec -it nms-nms-nms /bin/bash

uptime

SevOne-act check replication

SevOne-masterslave-status
要点: 在继续执行下一步之前,请确保复制检查未报告任何错误。

执行故障转移操作以使辅助设备成为活动设备 (所有同级,但集群引导程序除外)

现在可以执行故障转移操作。 从 管理 > 集群管理器 > 左侧导航栏,展开同级以选择对的 活动 设备。 在右上角,单击 gearIcon 并选择 " 故障转移 "选项。 有关更多详细信息,请参阅 集群管理器 > 设备级别操作部分。

secondaryToActive

要点: 操作失败可能需要几分钟才能完成。 您可能需要刷新浏览器以反映故障转移后同级的新状态。

在设备故障转移后检查复制状态

故障转移完成后,确认复制适用于每个对。 如果复制滞后,那么复制可能需要几分钟才能赶上。 执行以下命令以检查已重新引导的设备的系统正常运行时间和复制状态。


podman exec -it nms-nms-nms /bin/bash

SevOne-act check replication

SevOne-masterslave-status
要点: 在继续执行下一步之前,请确保复制检查未报告任何错误。

现在,您已准备好重新启动 设备。

执行主设备的重新启动 (除集群引导程序之外的所有同级)

故障转移后,先前步骤中重新引导的辅助设备现在将是当前 主动 设备,而 设备现在将处于当前 被动 状态。 从 "用户界面> 管理 > 集群管理器" 标识以确认对的被动设备。 在左侧导航栏中,展开同级以识别该对中的哪个设备当前处于该对的被动状态。

刷新浏览器以确认故障转移成功,并且 设备现在报告为 被动

activeApplianceNowPassive

现在,使用SSH登录被动设备作为支持,并执行重启。

警告: 此时请勿重新启动集群引导程序活动设备。

podman exec -it nms-nms-nms /bin/bash

SevOne-shutdown reboot
重要信息: 可以同时以批处理方式重新启动不同同级的多个被动设备。 SevOne 建议同时对 5 设备执行不超过 4 的操作,以保持操作可管理。 请确保此时 重新启动集群引导程序设备。

执行故障转移操作,使主设备成为活动设备 (所有同级,但集群领导者除外)

现在可以执行故障转移操作。 从 管理 > 集群管理器 > 左侧导航栏,展开同级以选择对的 活动 设备。 在右上角,单击 gearIcon 并选择 " 故障转移 "选项。 有关更多详细信息,请参阅 集群管理器 > 设备级别操作部分。

primaryToActive

要点: 操作失败可能需要几分钟才能完成。 您可能需要刷新浏览器以反映故障转移后同级的新状态。

在设备故障转移后检查复制状态

故障转移完成后,请确认复制对每个对都有好处-复制可能需要几分钟时间。 执行以下命令以检查已重新引导的设备的系统正常运行时间和复制状态。


podman exec -it nms-nms-nms /bin/bash

uptime

SevOne-act check replication

SevOne-masterslave-status
要点: 在继续执行下一步之前,请确保复制检查未报告任何错误。

重新引导所有具有单个设备的同级 (个没有辅助设备的同级)

标识没有任何辅助设备的所有设备。 从 管理 > 集群管理器 > 左侧导航栏,展开同级以确定哪个同级具有单个设备。 例如,如以下截屏中所示, 10.129.15.139 没有任何关联的被动设备。

singleAppliancePeer

现在,使用SSH登录作为支持的所有单个主设备,并执行重启。

警告: 请确保此时 重新启动 Cluster Leader 设备。

podman exec -it nms-nms-nms /bin/bash

SevOne-shutdown reboot

执行故障转移操作,使 "辅助集群引导程序" 成为活动设备

在对集群引导者进行故障转移之前,请对复制执行集群范围的检查,以确保未报告任何错误。

注: 如果是 Hub-Spoke 环境,请向以下命令添加 -hub-辐-network 选项。

podman exec -it nms-nms-nms /bin/bash

SevOne-act check replication --full-cluster

现在,您可以对集群引导程序同级执行故障转移操作。 从 管理 > 集群管理器 > 左侧导航栏中,展开同级以选择集群引导程序对的 活动 设备。 在右上角,单击 gearIcon 并选择 " 故障转移 "选项。 有关更多详细信息,请参阅 集群管理器 > 设备级别操作部分。

makeClusterLeaderSecondary

注: 这将执行集群引导程序的故障转移,使集群引导程序成为作为 活动 设备的辅助集群引导程序。 "故障转移" 操作可能需要几分钟才能完成。 刷新浏览器以确认故障转移成功,并且主设备现在报告为 被动

在集群引导设备故障转移后检查复制状态

在重新引导后备份被动设备后,请确认复制对每个对都有好处-复制可能需要几分钟时间。 使用命令行界面从主设备执行以下命令以确认复制状态。


podman exec -it nms-nms-nms /bin/bash

SevOne-act check replication

SevOne-masterslave-status
要点: 在继续执行下一步之前,请确保复制检查未报告任何错误。

执行集群引导程序主设备的重新引导

故障转移后,集群引导程序辅助设备现在将是 主动 设备,并且主设备将处于 被动 状态。 从 "用户界面> 管理 > 集群管理器" 标识以确认对的被动设备。 在左侧导航栏中,展开 Cluster Leader 同级以确定该对中的哪个设备当前是该对的被动设备。

刷新浏览器以确认故障转移成功,并且集群负责人 设备现在报告为 被动

clusterLeaderPrimaryIsPassive

现在,以支持身份使用SSH登录 Cluster Leader 被动设备并执行重启。


podman exec -it nms-nms-nms /bin/bash

SevOne-shutdown reboot

执行故障转移操作,使集群引导者成为活动设备的主要引导者

现在可以执行故障转移操作。 从 管理 > 集群管理器 > 左侧导航栏中,标识 "集群引导程序" 对的活动设备,然后选择该对的活动设备。 在右上角,单击 gearIcon 并选择 " 故障转移 "选项。 有关更多详细信息,请参阅 集群管理器 > 设备级别操作部分。

clusterLeaderSecondaryIsActive

要点: 操作失败可能需要几分钟才能完成。 您可能需要刷新浏览器以反映故障转移后同级的新状态。

clusterLeaderPrimaryIsActive

在设备故障转移后检查复制状态

一旦故障转移完成,请确认复制对集群领导者同级有利-复制可能需要几分钟时间。 使用命令行界面从辅助设备执行以下命令以确认复制状态。


podman exec -it nms-nms-nms /bin/bash

SevOne-act check replication

SevOne-masterslave-status

(选项 2) 在不进行故障转移的情况下重新引导设备

如果升级位于完整的维护窗口中,并且在重新启动设备期间可接受轮询中断,那么您可以选择按任何顺序执行重新启动设备。 但是, SevOne 始终建议首先重新启动 passive 设备,然后重新启动所有同级的 active 设备。

首先重新引导辅助设备 (包括集群引导辅助设备)

标识以确认对的被动设备。 从 管理 > 集群管理器 > 左侧导航栏中,展开同级以确定该对中的哪个设备当前处于被动状态。 例如,以下截屏中显示的 10.129.13.121 是该对的被动设备。

passiveAppliance

  1. 使用ssh,以支持 登录每个SevOneNMS被动的设备,包括群集领导者被动设备。
    ssh support@<NMS 'passive' appliance>
  2. 重新引导 被动 设备。
    
    podman exec -it nms-nms-nms /bin/bash
    
    SevOne-shutdown reboot
    注: 对每个被动设备 (包括集群引导被动设备) 重复以上步骤。
    重要信息: 可以同时以批处理方式重新启动不同同级的多个被动设备。 SevOne 建议同时对 5 设备执行不超过 4 的操作,以保持操作可管理。

执行主设备的重新启动 (除集群引导程序以外的所有同级)

标识以从 "用户界面> 管理 > 集群管理器" 确认对的活动设备。 在左侧导航栏中,展开同级以确定对中的哪个设备当前处于活动状态。

restartPrimaryAppliance

现在,以支持身份使用SSH登录活动设备并执行重启。

警告: 此时请勿重新启动集群引导程序活动设备。

podman exec -it nms-nms-nms /bin/bash

SevOne-shutdown reboot
重要信息: 可以同时以批处理方式重新启动不同同级的多个被动设备。 SevOne 建议同时对 5 设备执行不超过 4 的操作,以保持操作可管理。 请确保此时 重新启动集群引导程序设备。

执行集群引导程序主设备的重新引导

重新启动集群中的所有其他设备后,必须重新启动集群引导程序 设备。 通过 "用户界面> 管理 > 集群管理器" 标识以确认 "集群引导程序" 对的活动设备。 在左侧导航栏中,展开 Cluster Leader 同级以确定该对中的哪个设备当前处于活动状态。

rebootClusterLeaderPrimary

现在,以支持身份使用SSH登录到群集领导者活动设备并执行重启。


podman exec -it nms-nms-nms /bin/bash

SevOne-shutdown reboot

确认集群中的所有设备都已重新启动

从活动集群引导程序执行以下脚本。

for IP in $(SevOne-peer-list); do echo -en "IP: $IP \t"; ssh $IP 'echo -e "Hostname: $(hostname) \t
System Uptime: $(uptime)" '; done
要点: 如果任何设备的 系统正常运行时间 反映可能已错过要重新启动的系统,请执行使用故障转移过程重新启动设备的步骤 (必要时)。

不需要再次重新启动集群引导程序。

装入内核并启动服务

  1. 清理/data/upgrade目录。
    
    rm /data/upgrade/installRPMs.tar
    
    rm /data/upgrade/DigiCert-cs.crt
    
    rm /data/upgrade/ibm-sevone-cs.crt
    
    rm -rf /data/upgrade/ansible
    
  2. 在重新引导成功完成后, SSH 返回到 SevOne NMS 集群的活动集群引导程序,以检查已安装的 内核 软件包。 请参阅下表以确认您具有正确的内核版本。

    检查内核版本

    
    podman exec -it nms-nms-nms /bin/bash
    
    SevOne-show-version
    OR
    rpm -qa | grep kernel
    OR
    uname -r
    重要: 内核会在升级过程中自动更新,并非每个 NMS 版本都有新内核。
    根据 NMS 发行版,内核版本必须为:
    SevOne NMS 版本 内核版本
    NMS7.1.0 4.18.0-553.8.1.el8_10.x86_64
    NMS7.0.1 4.18.0-553.el8_10

    内核版本基于 NMS 发行版。

    内核版本必须基于 NMS 发行版。 否则,必须通过执行以下步骤来重新引导整个集群以应用新内核,否则不需要重新引导。

    
    podman exec -it nms-nms-nms /bin/bash
    
    SevOne-shutdown reboot
  3. 验证操作系统版本。 升级后确认版本为 Red Hat Enterprise Linux
    cat /etc/redhat-release
                
    Red Hat Enterprise Linux 发布 8.9 (Ootpa)
  4. 执行以下命令以识别错误 (如果有)。
    SevOne-act check checkout --full-cluster --verbose

记录文件

日志文件可在 /var/SevOne/ansible-upgrade/<fromVersion-toVersion>/<timestamp>/<peerIP>.log 中找到

例如, /var/SevOne/ansible-upgrade/v7.0.1-v7.1.0/<timestamp>/<peerIP>.log

  • 每个同级都将有自己的日志文件位于集群引导者上。
  • 将为升级的每次运行创建新的日志文件,并按时间戳记文件夹进行拆分。