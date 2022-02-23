Gerenciar dados é como correr uma maratona. Muitos fatores determinam o resultado final, e é um processo longo. No entanto, suponhamos que um corredor lide com o pé e quebrou o calcanhar nessa primeira milha. Nesse caso, ela não concluirá a maratona com sucesso. Da mesma forma, se os dados não forem monitorados desde a ingestão, o restante do pipeline será afetado negativamente.

Como podemos garantir a gestão de dados durante essa primeira milha da jornada de dados?

Os dados entram no pipeline de várias fontes: APIs externas, quedas de dados de provedores externos, puxando de um banco de dados e outros. O monitoramento de dados nos pontos de ingestão garante que os engenheiros de dados possam obter uma observabilidade proativa dos dados que chegam.

Isso permite que eles discutam e corrijam dados para garantir que o processo seja saudável e confiável desde o início.

Ao obter observabilidade proativa dos pipelines de dados, os engenheiros de dados podem: