Hinsichtlich ihrer Auffindbarkeit für zeitnahe und vollständige Datenanalyse-Initiativen kann es sich bei Dark Data um strukturierte Daten, unstrukturierte Daten oder halbstrukturierte Daten handeln.
Strukturierte Daten sind Informationen, die vor der Speicherung in klar definierte Tabellen- oder Datenbank -Felder eingefügt werden.
Server-Protokolldateien, Internet der Dinge (IoT) -Sensordaten, Kundenbeziehungsmanagement (CRM)-Datenbanken und ERP-Systeme sind Beispiele für Dark Data, die aus strukturierten Datenquellen erstellt werden.
Obwohl die meisten Arten sensibler Daten, wie elektronische Kontoauszüge, Krankenakten und verschlüsselte Kundeninformationen, in der Regel in strukturierter Form vorliegen, ist deren Einsicht und Kategorisierung aufgrund von Berechtigungsproblemen schwierig.
Im Gegensatz zu strukturierten Datenenthalten unstrukturierte Daten Informationen, die nicht in Datenbanken oder Tabellenkalkulationen organisiert werden können, um sie ohne Konvertierung, Kodierung, Tiering und Strukturierung zu analysieren.
E-Mail-Korrespondenzen, PDFs, Textdokumente, Social-Media-Beiträge, Aufzeichnungen von Call-Centern, Chat-Protokolle und Überwachungsvideos sind Beispiele für Dark Data, die aus unstrukturierten Datenquellen entstehen.
Halbstrukturierte Daten sind unstrukturierte Daten, die einige Informationen in definierten Datenfeldern enthalten. Obwohl sie sich nicht so gut wie strukturierte Daten zur Datenerkennung von Dark Data eignen, können sie durchsucht oder katalogisiert werden.
Beispiele hierfür sind HTML-Code, Rechnungen, Grafiken, Tabellen und XML-Dokumente.