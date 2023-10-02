Hoy en día, la mayoría de las empresas almacenan grandes cantidades de datos oscuros. En la encuesta de investigación global de Splunk a más de 1300 responsables de la toma de decisiones empresariales y de TI, el 60 por ciento de los encuestados informaron que la mitad o más de los datos de su organización se consideran oscuros. Un tercio de los encuestados informó que esta cantidad era del 75 por ciento o más.2

Los datos oscuros se acumulan porque las organizaciones han adoptado la idea de que es valioso almacenar toda la información que puedan capturar en big data lakes. Esto se debe en parte a la llegada del almacenamiento económico, que ha facilitado la justificación del almacenamiento de tantos datos, en caso de que algún día se vuelvan valiosos.

Al final, la mayoría de las empresas nunca utilizan ni siquiera una fracción de lo que almacenan porque el depósito de almacenamiento no documenta adecuadamente las etiquetas de metadatos, algunos de los datos están en un formato que las herramientas integradas no pueden leer o los datos no se pueden recuperar mediante una consulta.

Los datos oscuros son un factor limitante importante para producir un buen análisis de datos, ya que la calidad de cualquier análisis de datos depende del cuerpo de información accesible a las herramientas de análisis, tanto con prontitud como con todo detalle.

Otros problemas con los datos oscuros son que generan responsabilidades, importantes costes de almacenamiento y pérdida de oportunidades debido a que los equipos no se dan cuenta de los datos que pueden tener a su disposición.