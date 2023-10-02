오늘날 대부분의 기업은 방대한 양의 다크 데이터를 저장합니다. 1,300명 이상의 비즈니스 및 IT 의사 결정권자를 대상으로 한 Splunk의 글로벌 리서치 설문조사에서 응답자의 60%가 조직 데이터의 절반 이상을 다크 데이터로 간주한다고 했습니다. 응답자의 3분의 1은 이 수치가 75% 이상이라고 답했습니다.2

다크 데이터가 축적되는 이유는 조직이 빅 데이터 레이크에 캡처할 수 있는 모든 정보를 저장하는 것이 중요하다는 아이디어를 받아들였기 때문입니다. 이는 부분적으로 저렴한 스토리지의 출현 때문이며, 이에 따라 언젠가 가치가 높아지는 때 대비하여 많은 데이터를 저장하는 것을 정당화할 수 있게 되었습니다.

결국 대부분의 기업은 저장된 데이터의 일부도 사용하지 않습니다. 스토리지 저장소가 메타데이터 레이블을 적절하게 문서화하지 않거나, 일부 데이터가 통합 툴에서 읽을 수 없는 형식이거나, 쿼리를 통해 데이터를 검색할 수 없기 때문입니다.

모든 데이터 분석의 품질은 분석 툴이 신속하고 상세하게 액세스할 수 있는 정보에 따라 달라지기 때문에 다크 데이터는 좋은 데이터 분석을 수행하는 데 있어 주요 제한 요소입니다.

다크 데이터의 또 다른 문제는 책임, 막대한 스토리지 비용, 팀이 잠재적으로 어떤 데이터를 사용할 수 있는지 대한 인식 부족으로 인한 기회 손실이 발생하는 점입니다.