Tim rekayasa keandalan situs (SRE) dan DevOps kelelahan. Aset TI yang luas, jumlah alat yang berlebihan, dan sifat pekerjaan di mana karyawan harus selalu siap sedia, semuanya berperan dalam masalah yang menyeluruh: kelelahan peringatan.

Kelelahan peringatan (kadang-kadang disebut kelelahan alarm) mengacu pada “kondisi kelelahan mental dan operasional yang disebabkan oleh terlalu banyaknya peringatan.” Hal ini mengikis daya tanggap dan efektivitas DevOps, pusat operasi keamanan (SOC), rekayasa keandalan situs (SRE), dan tim lain yang bertanggung jawab atas kinerja dan keamanan TI, dan merupakan masalah yang meluas dan berdampak besar.

Laporan “2023 State of Threat Detection” dari Vectra (berdasarkan survei terhadap 2.000 analis keamanan TI di perusahaan dengan 1.000 karyawan atau lebih) menemukan bahwa tim SOC menanggapi rata-rata 4.484 peringatan per hari. Dari jumlah tersebut, 67% diabaikan karena tingginya volume positif palsu dan kelelahan peringatan. Laporan tersebut juga menemukan bahwa 71% analis meyakini bahwa organisasi mereka mungkin telah “disusupi tanpa sepengetahuan mereka akibat kurangnya visibilitas dan kepercayaan terhadap kemampuan deteksi ancaman.”



Sementara laporan Vectra mengambil fokus khusus keamanan, tim yang bertanggung jawab untuk memantau kinerja aplikasi dan infrastruktur menghadapi kelebihan beban yang sama. Misalnya, satu kesalahan konfigurasi dapat menyebabkan ratusan atau ribuan peringatan kinerja, “badai peringatan” yang dapat mengalihkan perhatian atau membuat tim TI tidak peka dan menyebabkan respons tertunda terhadap peringatan penting dan masalah nyata. Masalah nyata tersebut bisa jadi mahal.



Apa yang mendorong kelelahan ini dan dapatkah AI agen menjadi bagian dari solusi yang dapat diskalakan?