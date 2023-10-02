La maggior parte delle aziende oggi memorizza grandi quantità di dark data. Nel sondaggio di ricerca globale di Splunk su oltre 1.300 responsabili delle decisioni aziendali e IT, il 60% dei rispondenti ha riferito che metà o più dei dati della propria organizzazione è considerato oscuro. Un terzo dei rispondenti ha riferito che questa quantità è pari o superiore al 75%.2

I dark data si accumulano perché le organizzazioni hanno accettato l'idea che sia prezioso archiviare tutte le informazioni che possono acquisire nei big data lake. Questo in parte è dovuto all'avvento di uno storage economico, che ha reso facile giustificare la memorizzazione di così tanti dati, nel caso in cui un giorno diventassero preziosi.

Alla fine, la maggior parte delle aziende non utilizza nemmeno una parte di quanto memorizza, in quanto il serbatoio di storage non documenta adeguatamente le etichette dei metadati, alcuni dati sono in un formato che gli strumenti integrati non riescono a leggere oppure i dati non sono recuperabili tramite query.

I dark data sono uno dei principali fattori limitanti nella produzione di una buona analisi dei dati perché la qualità di qualsiasi analisi dei dati dipende dal corpus di informazioni accessibili agli strumenti di analisi, sia tempestivamente sia in modo completo.

Altri problemi relativi ai dark data sono che creano responsabilità, costi di storage significativi e opportunità mancate a causa del fatto che i team non si rendono conto dei dati potenzialmente disponibili per loro.