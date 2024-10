In termini di reperibilità per iniziative di analisi dei dati tempestive e complete, i dark data possono essere dati strutturati, dati non strutturati o dati semistrutturati.

I dati strutturati sono informazioni aggiunte a un foglio di calcolo o a campi di database chiaramente definiti prima di essere memorizzati.



I file di log del server, i dati dei sensori dell'Internet of Things (IoT), i database di gestione delle relazioni con i clienti (CRM) e i sistemi ERP (Enterprise Resources Planning) sono esempi di dark data creati da fonti di dati strutturati.



Sebbene la maggior parte delle forme di dati sensibili, come gli estratti conto bancari elettronici, le cartelle cliniche e i dati crittografati dei clienti, siano in genere in forma strutturata, è difficile visualizzarli e classificarli a causa di problemi di autorizzazione.



A differenza dei dati strutturati, i dati non strutturati includono informazioni che non possono essere organizzate in database o fogli di calcolo per l'analisi senza conversione, codifica, suddivisione in livelli e strutturazione.



Corrispondenze e-mail, PDF, documenti di testo, post sui social, registrazioni di call center, registri delle chat e riprese video di sorveglianza sono esempi di dark data creati da fonti di dati non strutturate.



I dati semi-strutturati sono dati non strutturati che contengono alcune informazioni in campi dati definiti. Sebbene non presentino la stessa facilità del data discovery dei dark data come dei dati strutturati, è possibile ricercarli o catalogarli.



Gli esempi includono codice HTML, fatture, grafici, tabelle e documenti XML.