Sebagian besar teknologi keamanan melindungi data sensitif dengan mencegah akses yang tidak sah ke jaringan, atau dengan mendeteksi dan memblokir perilaku mencurigakan atau berbahaya oleh pengguna yang sah atau tidak sah, antarmuka pemrograman aplikasi (API), perangkat Internet of Things (IoT), atau entitas lainnya.
Teknologi-teknologi ini telah mengubah keamanan data serta deteksi dan respons ancaman menjadi lebih baik. Namun adopsi komputasi cloud yang pesat, pengembangan cloud native yang tangkas, serta kecerdasan buatan (AI) dan machine learning (ML) menyebabkan risiko dan kerentanan keamanan data yang tidak selalu dapat diatasi oleh teknologi ini; yang pada gilirannya dapat membuat organisasi berisiko mengalami pelanggaran data dan pelanggaran kepatuhan terhadap peraturan.
Risiko data yang paling utama adalah data bayangan—data yang dicadangkan, disalin, atau direplikasi ke penyimpanan data yang tidak dipantau, dikelola, atau diatur oleh tim, kebijakan, atau kontrol keamanan yang sama seperti data asli. Misalnya, sebagai bagian dari pengembangan dan pengujian berulang mereka, tim DevOps mungkin membuat sejumlah penyimpanan data baru setiap hari, dan menyalin data sensitif kepada mereka. Satu kesalahan konfigurasi dapat membuat data di salah satu atau semua toko ini lebih rentan terhadap akses yang tidak sah.
Permintaan data untuk pemodelan AI atau ML juga berkontribusi pada data bayangan, karena organisasi memperluas akses data ke lebih banyak pengguna yang kurang memahami keamanan dan tata kelola data yang tepat. Dan peningkatan adopsi lingkungan multicloud (penggunaan layanan dan aplikasi cloud dari berbagai penyedia) dan hybrid cloud (infrastruktur yang menggabungkan dan mengatur lingkungan cloud publik dan cloud privat) menyebarkan risiko.
Menurut Laporan Biaya Pelanggaran Data IBM 2025, 72% pelanggaran data melibatkan data yang disimpan di lingkungan cloud, dan 30% data yang dilanggar disimpan di berbagai jenis lingkungan komputasi termasuk private cloud, cloud publik, hybrid cloud, dan on premises.