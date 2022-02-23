Tags
Como garantir a qualidade, o valor e a confiabilidade dos dados

A qualidade dos dados posteriormente depende diretamente da qualidade dos dados na primeira milha. Já na ingestão, dados precisos e confiáveis garantirão que os dados usados posteriormente para análise de dados, visualização e ciência de dados sejam de alto valor.

Para uma empresa, isso faz toda a diferença entre ter um benefício dos dados e tê-los em segundo plano na tomada de decisões. Neste post de blog, descrevemos a importância da qualidade de dados, como auditar e monitorar seus dados e como obter sua liderança, colegas e diretoria — a bordo.

Tópicos abordados:

  • Observabilidade proativa de dados
  • Auditoria de qualidade de dados
  • Qualidade de dados ou valor de dados?
  • Como abordar a diretoria executiva e o conselho
  • Como treinar internamente
  • A maldição do "Outro"
  • Melhores práticas para começar: garantir a qualidade de dados em toda a empresa

Observabilidade proativa de dados

Gerenciar dados é como correr uma maratona. Muitos fatores determinam o resultado final, e é um processo longo. No entanto, suponhamos que um corredor lide com o pé e quebrou o calcanhar nessa primeira milha. Nesse caso, ela não concluirá a maratona com sucesso. Da mesma forma, se os dados não forem monitorados desde a ingestão, o restante do pipeline será afetado negativamente.

Como podemos garantir a gestão de dados durante essa primeira milha da jornada de dados?

Os dados entram no pipeline de várias fontes: APIs externas, quedas de dados de provedores externos, puxando de um banco de dados e outros. O monitoramento de dados nos pontos de ingestão garante que os engenheiros de dados possam obter uma observabilidade proativa dos dados que chegam.

Isso permite que eles discutam e corrijam dados para garantir que o processo seja saudável e confiável desde o início.

Ao obter observabilidade proativa dos pipelines de dados, os engenheiros de dados podem:

  • Confie nos dados
  • Identifique facilmente os pontos de ruptura
  • Corrija correções rapidamente antes que eles cheguem ao dashboard ou ao armazém

Auditar dados para qualidade

Os engenheiros de dados que desejam revisar seu pipeline ou auditar e monitorar uma fonte de dados externa podem usar as seguintes perguntas durante sua avaliação:

  1. Qual é o escopo da cobertura?
  2. Como os dados estão sendo rastreados?
  3. Existe uma referência de dados mestre que inclui requisitos e metadados?
  4. O cliente está definido da maneira certa?
  5. Existe uma hierarquia comum?
  6. As taxonomias aproveitam os requisitos comerciais?
  7. Os locais estão definidos corretamente?
  8. Há alguma duplicata?
  9. Os dados foram pesquisados antes da criação de novas entidades?
  10. Os dados estão estruturados para permitir integrações e interoperabilidade perfeitas?

Agora que já vimos como os engenheiros de dados podem abordar a qualidade de dados, vamos ver como conseguir a adesão de outros stakeholders na empresa.

Qualidade de dados ou valor dos dados?

Engenheiros de dados frequentemente falam sobre a qualidade dos dados. No entanto, ao mudar o foco da conversa para o valor dos dados, outros stakeholders nas organizações podem ser incentivados a participar de forma mais significativa do processo de dados. Isso é importante para atrair atenção, recursos e garantir suporte contínuo.

Para isso, recomendamos falar sobre como os dados se alinham com os objetivos de negócios. Caso contrário, os stakeholders externos podem achar que a conversa gira em torno apenas da limpeza dos dados.

Quatro critérios para determinar o valor dos dados para engenheiros e empresas:

  • Relevância: os dados atendem ao objetivo de negócios?
  • Cobertura: os dados abrangem todo o mercado, permitindo que a empresa os coloque em operação?
  • Estrutura: os dados estão estruturados para que a empresa possa usá-los?
  • Precisão: os dados estão completos e corretos?

Como abordar a diretoria executiva e o conselho

Ao mudar a conversa para o valor dos dados em vez de sua qualidade, os diretores executivos e o conselho podem ser incentivados a investir mais recursos no pipeline de dados. Veja como abordá-los:

  1. Comece com as razões pelas quais o gerenciamento de dados é de importância estratégica para sua empresa. Mostre como os dados podem ajudar a executar intenções estratégicas.
  2. Explicar como gerenciar e analisar dados podem ajudar a empresa a chegar onde precisa ir. Mostre como os dados podem expandir, melhorar e proteger os negócios. Você pode tecer os quatro critérios anteriores para enfatizar seus pontos.
  3. Vincule os dados a departamentos específicos. Mostre como os dados podem ajudar a melhorar a eficiência operacional, aumentar as vendas e mitigar riscos. Nenhum outro departamento pode afirmar que ajudou a crescer, melhorar e proteger todos os departamentos na mesma medida que a engenharia de dados.
  4. Não se concentre no processo e na tecnologia — caso contrário, você terá uma audiência muito pequena.

Como treinar internamente

Além da liderança da empresa, também é importante ter as pessoas a bordo na empresa. Isso ajudará na análise e no monitoramento de dados. Os engenheiros de dados geralmente precisam que os funcionários da empresa participem do esforço contínuo de manutenção dos dados. Por exemplo, os vendedores são obrigados a preencher vários campos em um CRM ao adicionar uma nova oportunidade.

Recomendamos investir tempo na gestão de pessoas, como treinamento e garantir que todos estejam em sintonia com a importância da qualidade de dados. Por exemplo, explicar como a identificação precisa de discrepâncias pode ajudar a descobrir uma anomalia na empresa (em vez de uma anomalia nos dados, o que poderia acontecer se as pessoas não atualizassem os dados de forma consistente e abrangente).

A praga do “Outro”

A auditoria do valor dos dados é fundamental porque afeta diretamente a capacidade de tomar decisões com base neles. Se você precisar de um exemplo para convencer os funcionários a participar do gerenciamento de dados, lembre-os de “a maldição do 'outro'”.

Quando unidades de negócios como marketing, produto e vendas monitoram dashboard, e uma grande fatia é intitulada "outros", elas não têm todos os dados de que precisam e sua tomada de decisão fica prejudicada. Este é o resultado da falta de gerenciamento de dados e gestão de dados.

Melhores práticas para começar: garantir a qualidade de dados em toda a empresa

Como os engenheiros de dados podem transformar a qualidade de dados em prática? Vamos amarrar tudo o que abordamos em um plano praticável.

Etapa 1: audite a situação dos dados

Primeiro, avalie quais domínios devem ser cobertos e como eles estão sendo gerenciados. Isso inclui tipos de dados como:

  • Dados de relacionamento com clientes, fornecedores, parceiros, possíveis clientes, cidadãos, pacientes e clientes
  • Dados da marca de produtos, serviços, ofertas, banners e muito mais

Identifique os erros nas diferentes etapas do pipeline, começando pela ingestão.

Etapa 2: mostre o pipeline de dados

Apresente a situação dos dados aos diversos stakeholders. Mostre como os dados são gerenciados desde o ponto de entrada até o produto final. Em seguida, explique como o valor atual dos dados está afetando suas decisões. Apresente os pontos de erro e sugira maneiras de corrigi-los.

Etapa 3: priorize os problemas a serem corrigidos

Construa um plano priorizado para impulsionar a mudança. Determine quais problemas corrigir primeiro. Inclua a identificação de fontes e como elas enviam dados, gerenciamento de dados internos e treinamento de funcionários. Obtenha a adesão ao plano e prossiga com a sua execução.

Conclusão

Garantir a qualidade de dados é de responsabilidade dos engenheiros de dados e de toda a organização. O monitoramento da qualidade de dados começa na fonte. No entanto, ao obter a adesão dos funcionários e da gerência, os engenheiros de dados podem garantir que receberão os Recursos e a atenção necessários para monitorar e corrigir problemas de dados em todo o pipeline e ajudar o negócio a crescer.

