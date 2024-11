Alguns anos atrás, uma mudança de configuração inócua no Microsoft Dynamics CRM de um grande varejista significou que o número de estoque exibido em cada item on-line deixou de refletir a realidade. O contador simplesmente parou de atualizar.

As pessoas continuaram comprando, mas o número de volume permaneceu constante. No momento em que a equipe de engenharia de dados foi alertada, as coisas ficaram ruins.

A maioria dos itens estava disponível para compra online, mas também para retirada na loja. Muitas pessoas optaram pela retirada na loja. Os pedidos foram processados e, mesmo assim, itens que não existiam foram vendidos. Assim, os consumidores visitavam lojas onde os associados de varejo se esforçavam para encontrar substitutos ou prometer descontos ou de alguma forma acalmá-los. Linhas formadas. Os visitantes da loja tinham que esperar para comprar e eram desanimados com tantas pessoas atacando seus telefones com raiva. E como levou dias para descobrir o problema e para o pipeline ser corrigido, passou mais alguns dias até que as coisas fossem resolvidas.

Considerando a perda de reputação da marca, o erro custou dezenas de milhões e não precisava ter acontecido.

Ou seja, os problemas de dados são complexos. Eles podem ser difíceis de identificar e resolver, e crescem de forma invisível. É fácil cair na armadilha de achar que tudo está funcionando só porque você ainda está extraindo alguns insights, mesmo enquanto acumula uma quantidade crescente de dívidas de dados subterrâneos.

Além disso, os sinais mais verdadeiros de problemas de qualidade de dados também tendem a ser indicadores atrasados. Por exemplo, os consumidores dizendo a você. Ou, como no exemplo anterior de CRM para varejo, com milhares de gerentes de varejo e vice-presidentes regionais contando tudo. Isso é ruim. Isso significa que os dados estão em seu sistema há algum tempo e levará dias para que uma correção dê resultados. Fale sobre a falta de expectativas dos consumidores.

Esta é a situação em que a startup de transporte marítimo Shipper se encontrou e por que eles investiram tanto para evitar que isso ocorresse. Sua equipe de engenharia de dados apresenta dados o mais próximo possível do tempo real para um aplicativo que ajuda os fornecedores de comércio eletrônico a entregar seu estoque em um porto de embarque. Não são apenas as expectativas dos seus consumidores com que precisam se preocupar, mas os consumidores de seus consumidores. E às vezes, quando o sistema estava desatualizado havia dois dias, ele criava ondas em cascata de expectativas perdidas. Por isso eles investiram pesado em gerenciamento de qualidade de dados e ferramentas que poderiam apresentar alertas antecipados com verificações automáticas.

O gerenciamento da qualidade dos dados é uma forma de tornar as verificações de qualidade dos dados automáticas e abrangentes, de modo que você esteja combatendo as forças da entropia em seus conjuntos de dados e pipelines com uma quantidade igual e oposta de força.