As equipes de engenharia de confiabilidade do site (SRE) e DevOps estão esgotadas. Extensas propriedades de TI, sobrecarga de ferramentas e a natureza de plantão do trabalho desempenham um papel em um problema abrangente: fadiga de alerta.

A fadiga de alertas (também conhecida como fadiga de alarmes) refere-se a “um estado de esgotamento mental e operacional causado por um número avassalador de alertas”. Ele corrói a capacidade de resposta e a eficácia do DevOps, da central de operações de segurança (SOC), da engenharia de confiabilidade local (SRE) e de outras equipes responsáveis pelo desempenho e pela segurança de TI, sendo um problema generalizado e consequente.

O relatório “2023 State of Threat Detection” da Vectra (com base em uma pesquisa com 2 mil analistas de segurança de TI entrevistados em empresas com mil ou mais funcionários) descobriu que as equipes de SOC enviam uma média de 4.484 alertas por dia. Desses, 67% são ignorados devido ao alto volume de falsos positivos e à fadiga de alerta. O relatório também descobriu que 71% dos analistas acreditavam que sua organização poderia já ter sido “comprometida sem seu conhecimento, devido à falta de visibilidade e confiança nos recursos de detecção de ameaças”.



Embora o relatório da Vectra assuma um foco específico para a segurança, as equipes encarregadas de monitorar o desempenho de aplicações e infraestrutura enfrentam sobrecarga semelhante. Por exemplo, uma única configuração incorreta pode causar centenas ou milhares de alertas de desempenho, uma "tempestade de alertas" que pode distrair ou dessensibilizar as equipes de TI e causar respostas atrasadas a alertas críticos e problemas reais. Esses problemas reais podem custar caro.



O que está motivando esse esgotamento? A IA agêntica pode fazer parte de uma solução escalável?