站点可靠性工程 (SRE) 和 DevOps 开发运维团队精疲力尽。规模日益庞大的 IT 资产、工具过载和工作的待命性质都在一个总体问题中发挥着作用，即警报疲劳。

警报疲劳（有时称为报警疲劳）是指“由于过多的警报而导致的精神和操作疲惫状态”。这会削弱 DevOps 开发运维、安全运营中心 (SOC)、站点可靠性工程 (SRE) 和其他负责 IT 性能和安全的团队的响应能力和效能，是一个普遍存在的重大问题。

Vectra 的《2023 年威胁检测状态》报告（基于对拥有 1,000 名或以上员工的公司的 2,000 名 IT 安全分析师的调查）发现，SOC 团队平均每天处理 4,484 个警报。其中，67% 由于大量误报和警报疲劳而被忽视。报告还发现，71% 的分析师认为，“由于对威胁检测能力缺乏可见性和信心”，他们的组织可能已经“在不知情的情况下受到损害”。



虽然 Vectra 报告重点关注安全性，但负责监控应用程序和基础设施性能的团队也面临着类似的过重负担。例如，一个错误配置可能会导致成百上千个性能警报，这场“警报风暴”可能会分散 IT 团队的注意力或使其敏感度降低，并导致对严重警报和实际问题的响应延迟。那些真正出现的问题可能代价高昂。



是什么导致了这种倦怠？智能体式 AI 能否成为可扩展解决方案的一部分？