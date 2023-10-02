Hoy en día, la mayoría de las compañías almacenan grandes cantidades de datos oscuros. En la encuesta de investigación global de Splunk a más de 1300 responsables de la toma de decisiones empresariales y de TI, el 60 % de los encuestados informaron que la mitad o más de los datos de su organización se consideran oscuros. Un tercio de los encuestados informó que esta cantidad es del 75 % o más.2

Los datos oscuros se acumulan porque las organizaciones adoptaron la idea de que es valioso almacenar toda la información que puedan capturar en grandes lagos de datos. Esto se debe en parte a la llegada de sistemas de almacenamiento económicos, que hicieron fácil justificar el almacenamiento de tantos datos (en caso de que algún día se vuelvan valiosos).

Al final, la mayoría de las compañías nunca usan ni siquiera una fracción de lo que almacenan porque el depósito de almacenamiento no documenta adecuadamente las etiquetas de metadatos, algunos de los datos están en un formato que las herramientas integradas no pueden leer o los datos no se pueden recuperar a través de una consulta.

Los datos oscuros son un factor limitante importante para producir un buen análisis de datos porque la calidad de cualquier análisis de datos depende del cuerpo de información accesible para las herramientas de analytics, tanto de forma rápida como con todo detalle.

Otros problemas con los datos oscuros son que crean responsabilidades, costos de almacenamiento significativos y oportunidades perdidas debido a que los equipos no se dan cuenta de qué datos están potencialmente disponibles para ellos.