通过 IBM Fusion HCI 用户界面监控硬件

IBM Fusion HCI 用户界面提供了增强的硬件监控体验。 通过硬件监控,您可以快速确定 IBM Fusion HCI 中需要关注的硬件组件。

硬件监控可提供服务器和交换机及其组件(如 CPU、DIMM、存储驱动器、适配器、风扇和 PSU)的整体和单个健康状况及库存信息。

转到 IBM Fusion HCI 用户界面中的基础架构 > 概述 ,查看硬件设备的图形视图。 在 " 资源摘要 "部分,您可以找到节点、交换机和服务节点的总数及其健康状态。 将鼠标悬停在硬件设备的图形视图上,可识别机架上的设备。 此外,您还可以放大和缩小,轻松聚焦到机架的特定部分进行详细检查,并使用添加机架来添加额外的机架,这在有三个以上机架需要检查时非常有用。
  • 对于节点,它显示硬件名称、健康状态、节点类型、库存和机架单元。
  • 对于交换机,它显示硬件名称、健康状态、交换机类型、库存和机架单元。
  • 对于服务节点,它显示硬件名称、健康状况、节点类型、库存和机架单元。

IBM Fusion HCI 机架的图形视图中,硬件组件的颜色代表健康状态。 此外,您还可以在硬件设备的图形视图下查看不同的颜色及其显著性。 将根据节点和交换机在实际物理机架中的相应位置显示这些节点和交换机。 有关机架单元编号和位置的更多信息,请参阅硬件概述

下图显示了包含单个机架的样本 " 概述 " 仪表板页面。 在此示例中,机架单元 18 的管理交换机显示降级状态,机架单元 8 的存储节点和机架单元 20 的高速交换机显示临界状态。

图 1。 显示机架及其组件的概述页面
机架在 RU23 中显示 AFM 节点的降级状态,在 RU15中显示 Storage 节点的临界状态。
下图显示了基本机架和扩展机架设置。 在本例中,位于机架单元 18 的基础机架上的管理交换机和位于机架单元 2 的扩展机架上的存储节点失去了供电:
图 2。 发生严重错误的基本机架和扩展机架
图中显示了基本机架和扩展机架。 基本机架 RU 19 显示严重错误,而扩展机架 RU 7 显示严重错误。
您可以根据 IBM Fusion HCI 用户界面上显示的图例确定存在硬件问题的节点:
  • 颜色为绿色表示硬件的状态为正常且正常。
  • 颜色红色表示硬件中存在严重错误,需要注意。
  • 颜色灰色指示硬件处于不活动状态和电源关闭状态。
  • 带有对角条纹的颜色蓝色指示正在硬件上执行操作,例如,电源启动,电源关闭或固件升级。
  • 颜色黄色表示警告。

有关节点和交换机监控的更多信息,请参阅节点监控交换机监控