Sebagian besar perusahaan saat ini menyimpan data gelap dalam jumlah besar. Dalam survei penelitian global Splunk terhadap lebih dari 1.300 pengambil keputusan bisnis dan TI, 60 persen responden melaporkan bahwa setengah atau lebih dari data organisasi mereka dianggap gelap. Sepertiga responden melaporkan jumlah ini sebesar 75 persen atau lebih.2

Data gelap terakumulasi karena organisasi telah menganut gagasan bahwa menyimpan semua informasi yang dapat mereka tangkap di dalam data lake besar adalah hal yang berharga. Hal ini sebagian disebabkan oleh munculnya penyimpanan yang murah, yang mempermudah justifikasi untuk menyimpan begitu banyak data—kalau-kalau suatu saat data tersebut bisa bermanfaat.

Pada akhirnya, sebagian besar perusahaan tidak pernah menggunakan bahkan sebagian kecil dari apa yang mereka simpan karena tempat penyimpanan tidak mendokumentasikan label metadata dengan tepat. Beberapa data dalam format yang tidak dapat dibaca oleh alat terintegrasi atau data tidak dapat diambil melalui kueri.

Data gelap merupakan faktor penghalang utama dalam menghasilkan analisis data yang baik karena kualitas analisis data apa pun bergantung pada informasi yang dapat diakses oleh alat analitik, baik secara cepat maupun secara detail.

Masalah lain dari data gelap adalah bahwa hal ini menciptakan kewajiban, biaya penyimpanan yang signifikan, dan peluang yang terlewatkan karena tim tidak menyadari data apa saja yang berpotensi tersedia bagi mereka.