발견되지 않고 관리되지 않는 데이터, 즉 흔히 섀도 데이터라고 불리는 데이터는 특히 민감한 정보를 포함할 경우 심각한 보안 위험을 초래합니다. IBM의 2024 데이터 유출 비용(CODB) 보고서에 따르면, 섀도 데이터가 관련된 데이터 침해는 전체 사고의 3분의 1을 차지하며, 평균 비용은 527만 달러로 보고서에 산정된 평균 침해 비용보다 16% 더 높습니다.
조직의 모든 데이터를 보호하는 핵심은 데이터가 네트워크에 어떻게, 어디로 유입되는지와 어떻게, 어디에 공유되고 저장되는지를 이해하는 것입니다. 따라서 강력한 데이터 디스커버리 프로세스는 데이터 보안과 데이터 보호 모두에서 핵심적인 요소입니다. AI와 ML을 활용해 민감한 데이터를 포함한 파일을 자동으로 식별하도록 시스템을 학습시키면 이러한 노력을 더욱 강화할 수 있습니다.
데이터 디스커버리 관행은 조직의 전체 공격 표면을 줄이는 데에도 도움이 됩니다. 공격 표면이란 해커가 민감한 데이터에 무단으로 액세스하거나 사이버 공격을 감행하는 데 사용할 수 있는 조직의 모든 취약점, 경로, 수단을 의미합니다. 데이터 디스커버리를 통해 사용되지 않거나 중복된 데이터가 제거되고, 가장 필요한 민감한 데이터만 남게 됩니다. 조직은 이후 이러한 핵심 자산을 중심으로 데이터 보안 조치의 우선순위를 정하고 맞춤화할 수 있습니다.