대부분의 보안 기술은 네트워크에 대한 무단 액세스를 방지하거나 권한이 있거나 권한이 없는 사용자, 애플리케이션 프로그래밍 인터페이스(API), 사물 인터넷(IoT) 디바이스 또는 기타 주체의 의심스럽거나 악의적인 행동을 감지하고 차단하여 민감한 데이터를 보호합니다.
이러한 기술은 데이터 보안과 위협 탐지 및 대응을 더 나은 방향으로 변화시켰습니다. 하지만 클라우드 컴퓨팅, 민첩한 클라우드 네이티브 개발, 인공 지능(AI) 및 머신 러닝(ML)의 급속한 도입으로 인해 이러한 기술이 항상 해결하지 못하는 데이터 보안 위험과 취약성이 발생하고 있습니다. 이로 인해 조직은 데이터 유출 및 규정 준수 위반의 위험에 처할 수 있습니다.
이러한 데이터 위험 중 가장 중요한 것은 섀도 데이터로, 원본 데이터와 동일한 보안 팀, 보안 정책 또는 보안 제어에 의해 모니터링, 관리 또는 통제되지 않는 데이터 저장소에 백업, 복사 또는 복제된 데이터입니다. 예를 들어, DevOps 팀은 반복적인 개발 및 테스트의 일환으로 매일 수많은 새 데이터 저장소를 생성하고 민감한 데이터를 여기에 복사할 수 있습니다. 한 번의 잘못된 구성으로 인해 이러한 저장소 중 일부 또는 전체 데이터가 무단 액세스에 더욱 취약해질 수 있습니다.
조직이 적절한 데이터 보안 및 거버넌스에 대한 이해도가 낮은 더 많은 사용자에게 데이터 액세스를 확대함에 따라 AI 또는 ML 모델링용 데이터에 대한 수요도 섀도 데이터의 원인이 됩니다. 또한 멀티클라우드 환경(여러 공급자의 클라우드 서비스 및 애플리케이션 사용)과 하이브리드 클라우드(퍼블릭 클라우드와 프라이빗 클라우드 환경을 결합하고 조율하는 인프라)의 도입이 증가하면서 위험이 확산되고 있습니다.
IBM Cost of a Data Breach Report 2025에 따르면, 데이터 침해의 72%는 클라우드 환경에 저장된 데이터와 관련이 있으며, 침해된 데이터의 30%는 프라이빗 클라우드, 퍼블릭 클라우드, 하이브리드 클라우드 및 온프레미스를 포함한 여러 유형의 컴퓨팅 환경에 저장되어 있다고 합니다.