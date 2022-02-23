Gérer les données, c’est courir un marathon. De nombreux facteurs déterminent le résultat final, et c’est un long processus. Supposons toutefois qu’une coureuse trébuche et se blesse la cheville au premier kilomètre. Dans ce cas, elle ne réussira pas à terminer le marathon. De même, si les données ne sont pas contrôlées dès l’ingestion, le reste du pipeline en subira les conséquences.

Comment garantir la gouvernance des données lors de cette première étape du parcours des données ?

Les données entrent dans le pipeline à partir de différentes sources : API externes, données provenant de fournisseurs extérieurs, extraction d’une base de données, etc. La surveillance des données aux points d’ingestion permet aux ingénieurs de données d’obtenir une observabilité proactive des données entrantes.

Ceci leur permet de manipuler et d'appliquer des correctifs aux données pour s'assurer que le processus est sain et fiable dès le départ.

En améliorant l'observabilité proactive des pipelines de données, les ingénieurs des données peuvent :