Quanto à sua capacidade de descoberta para iniciativas completas e oportunas de análise de dados, os dados obscuros podem ser dados estruturados, não estruturados ou semiestruturados.
Dados estruturados são informações adicionadas a campos claramente definidos de planilhas ou banco de dados antes de serem armazenados.
Arquivos de log de servidores, dados de sensores da Internet das Coisas (IoT) , bancos de dados de gerenciamento de relacionamento com o cliente (CRM) e sistemas de planejamento de recursos empresariais (ERP) são exemplos de dados obscuros criados a partir de fontes de dados estruturados.
Embora a maioria dos dados sensíveis — como extratos bancários eletrônicos, registros médicos e dados criptografados de clientes — geralmente estejam em formato estruturado, sua visualização e categorização são difíceis devido a questões de permissão.
Diferentemente dos dados estruturados, os dados não estruturados incluem informações que não podem ser organizadas em bancos de dados ou planilhas para análise sem conversão, codificação, classificação e estruturação.
Correspondências por e-mail, PDFs, documentos de texto, postagens em redes sociais, gravações de centrais de atendimento, logs de bate-papo e imagens de câmeras de segurança são exemplos de dados obscuros criados a partir de fontes de dados não estruturados.
Dados semiestruturados são dados não estruturados que contêm algumas informações em campos de dados definidos. Embora não possua a mesma facilidade de descoberta de dados obscuros que os dados estruturados, é possível pesquisá-los ou catalogá-los.
Exemplos incluem código HTML, faturas, gráficos, tabelas e documentos XML.