定义资源定制警报

您可以定义资源的属性、容量和性能发生两个或更多变化时触发的警报。

关于此任务

要定义定制警报,请选择要组合以触发警报的常规属性、容量和性能指标,并指定其条件和阈值。 可以将资源及其内部资源的条件组合到一个定制警报。 满足资源的属性和容量的条件且资源的性能超出阈值范围时,会触发警报。

例如,您可以创建一个自定义警报,当 SAN 卷控制器系统上卷的总体响应时间少于每次操作 20 毫秒 系统上节点的系统 CPU 利用率大于 70% 时发出通知。 “总体响应时间”指标用于测量为卷上每个 I/O 操作提供服务所需的平均毫秒数。 “系统 CPU 利用率”指标用于测量节点上的处理器忙于处理系统 I/O 任务的平均时间百分比。

步骤

  1. 要为资源定义警报,请选择下列其中一个选项:
    选项 步骤
    为策略定义警报
    1. 转至 配置 > 警报策略
      注意: 无法编辑缺省警报策略。 要创建可编辑的警报策略,请右键单击缺省警报策略并选择复制策略。 可以根据需要编辑复制的策略。
    2. 双击策略。
    3. 在 " 警报定义 " 选项卡上单击 编辑警报定义
    为不受策略管理的资源定义警报
    1. 转至资源的资源列表页面。 例如,要定义块存储系统的警报,请转至 资源 > Block Storage 系统要定义交换机的警报,请转至 资源 > 交换机
    2. 右键单击想要定义其警报的资源,然后单击查看警报定义
    3. 单击 编辑警报定义
  2. 单击 定制
  3. "创建警报" 图标 单击 "创建警报" 图标,然后输入警报的名称。
  4. 指定警报的严重性。
    指定严重性可以帮助您快速确定并解决在资源上检测到的严重条件。 可以指定的严重性取决于贵组织的准则和过程。
    选项 描述
    "严重警报" 图标
    严重
    对于严重且需要解决的警报指定此严重性。 例如,对于通知您“端口发送带宽百分比”大于或等于 85% 的警报,分配紧急严重性。 定制警报的缺省严重性为“严重”。
    警告警报图标
    警告
    对于并不严重但表示存在潜在问题的警报指定此严重性。 例如,对于通知您“端口发送带宽百分比”大于或等于 75% 但小于 85% 的警报,分配警告严重性。
    参考警报图标
    参考
    对于可能不需要任何操作来解决问题,且主要用于参考目的的警报指定此严重性。
  5. 选择警报的组件、类别和组。
    例如,选择“存储系统”、“容量”和“可用容量”。
  6. 要为常规或容量属性生成警报,请指定警报条件。
    条件可以包含诸如 >=<=更改之类的运算符。 条件还可以包括诸如压缩比率和压缩比率变化百分比之类的值。
    例如,对于“可用容量”之类的容量属性,您可以指定当资源池上的可用容量小于或等于 50 GiB 时生成警报。
    可用容量警报
    提示:
    • 并非所有属性都需要条件才能生成警报。 例如,您可以针对“已删除卷”属性启用警报,但不需要指定任何条件。
    • 某些属性可以使用不是包含更改之类的运算符。 例如,对于 DS8000® 的固件属性,可以选择运算符 "包含" 并在值字段中输入 R5 。 这样,当固件为 R5 级别而不是较新版本(例如,R6.1、R6.2 或 R6.3)时,就会触发警报。 如果您希望在存储系统的固件还原为旧版时收到通知,您可使用此警报定义。
  7. 可选: 单击 查看历史记录 以查看资源容量的图表。 使用该图表可评估资源的当前和历史容量趋势,以帮助确定警报的阈值。
    该图表使用彩色线条表示可以为警报定义的不同阈值和严重性:
    • 严重警报:红色
    • 警告警报:橙色
    • 参考警报:蓝色
    要定制图表,请单击排名前 10 位排名末 10 位以根据容量显示资源,单击时间段,然后更改显示的数据的起始和结束日期。
  8. 要为性能指标生成警报,请指定警报条件。
    条件包含运算符和阈值。
    1. 选择运算符。
      运算符用于确定是在资源性能大于或等于还是小于或等于指定阈值时触发警报。
    2. 输入阈值。
      例如,要在存储系统的“总 I/O 速率”大于或等于 500 个操作/秒时触发警报,请输入值 500
      阈值提示:
      • IBM Storage Insights Pro 为阈值提供了建议值,这些值在不同环境中差异不大。 例如,“端口发送带宽百分比”的缺省阈值大于或等于警告警报的 75%,且大于或等于严重警报的 85%。

        但是,对于用于测量吞吐量和响应时间的指标而言,阈值可以因工作负载、硬件型号、高速缓存内存量以及其他因素而变化。 在这些情况下,没有建议值。 为了帮助确定资源的阈值,将随着时间收集性能数据,以建立该资源的正常性能行为和期望性能行为的基线。 确定一组基线值之后,定义测量到的性能行为超出通常期望的范围以外时触发的警报。

      • 对于某些指标,较低值可能指示较大的压力,而较高的值可能指示空闲行为。 例如,“高速缓存占用时间阈值”指标的较小阈值可能指示存在性能问题。
  9. 可选: 单击 查看历史记录 以查看资源性能的图表。 使用该图表可评估资源的当前性能与历史性能,以帮助确定警报阈值。
    该图表使用彩色线条表示可以为警报定义的不同阈值和严重性:
    • 严重警报:红色
    • 警告警报:橙色
    • 参考警报:蓝色
    要定制图表,请单击排名前 10 位排名末 10 位以根据性能显示资源,单击时间段,然后更改显示的数据的起始和结束日期。
  10. 重复警报图标 复制警报。
    使用此操作将第二个和后续条件添加到警报。
  11. 重复步骤 5 - 10 以向警报添加更多条件。
  12. 可选: 如果要向策略联系人或全局警报通知地址以外的联系人发送警报违例的电子邮件通知,请在 电子邮件覆盖 字段中输入电子邮件地址。
    提示: 如果在 电子邮件覆盖 字段中输入电子邮件地址,那么只有该电子邮件地址接收警报的通知。 以下联系人不会收到通知:
    • 任何指定为策略联系人的电子邮件地址(如果该警报在警报策略中)。
    • 为警报通知指定的任何全局电子邮件地址。 要查看全局警报通知地址,请转至 配置 > 设置
  13. 可选: 单击 查看其他选项 以指定接收警报通知的频率。
    使用这些设置可避免针对部分条件触发太多的警报。
  14. 单击 保存更改

结果

要查看 IBM Storage Insights Pro 生成的所有警报,请转到 GUI 中的 Dashboards > Alerts