Comment garantir la qualité, la valeur et la fiabilité des données

La qualité des données en aval dépend directement de la qualité des données en amont. Dès l’ingestion, des données précises et fiables garantissent une grande valeur des données utilisées en aval pour l’analytique, la visualisation et la science des données.

Pour une entreprise, cela fait toute la différence entre avoir l’avantage des données et jouer les seconds rôles lors de la prise de décisions. Dans cet article de blog, nous décrivons l’importance de la qualité des données, comment auditer et surveiller vos données, mais aussi comment rallier vos dirigeants, collègues et conseil d’administration.

Thèmes abordés :

  • Observabilité proactive des données
  • Auditer la qualité des données
  • Qualité des données ou valeur des données ?
  • Comment aborder les dirigeants et le conseil d’administration ?
  • Comment former en interne ?
  • Le fléau de l’« Autre »
  • Bonnes pratiques pour commencer : garantir la qualité des données dans toute l’entreprise

Observabilité proactive des données

Gérer les données, c’est courir un marathon. De nombreux facteurs déterminent le résultat final, et c’est un long processus. Supposons toutefois qu’une coureuse trébuche et se blesse la cheville au premier kilomètre. Dans ce cas, elle ne réussira pas à terminer le marathon. De même, si les données ne sont pas contrôlées dès l’ingestion, le reste du pipeline en subira les conséquences.

Comment garantir la gouvernance des données lors de cette première étape du parcours des données ?

Les données entrent dans le pipeline à partir de différentes sources : API externes, données provenant de fournisseurs extérieurs, extraction d’une base de données, etc. La surveillance des données aux points d’ingestion permet aux ingénieurs de données d’obtenir une observabilité proactive des données entrantes.

Ceci leur permet de manipuler et d'appliquer des correctifs aux données pour s'assurer que le processus est sain et fiable dès le départ.

En améliorant l'observabilité proactive des pipelines de données, les ingénieurs des données peuvent :

  • Faire confiance aux données
  • Identifiez facilement les points de rupture
  • Réparer rapidement les problèmes avant qu’ils n’arrivent dans l’entrepôt ou le tableau de bord

Auditer la qualité des données

Les ingénieurs de données qui souhaitent examiner leur pipeline ou auditer et surveiller une source de données externe peuvent poser les questions suivantes lors de leur évaluation :

  1. Quel est le périmètre de couverture ?
  2. Comment les données sont-elles suivies ?
  3. Existe-t-il des données de référence qui incluent les exigences et les métadonnées ?
  4. Le client est-il défini correctement ?
  5. Existe-t-il une hiérarchie commune ?
  6. Les taxonomies tirent-elles parti des exigences métier ?
  7. Les zones géographiques sont-elles correctement définies ?
  8. Y a-t-il des doublons ?
  9. Les données ont-elles été recherchées avant de créer de nouvelles entités ?
  10. Les données sont-elles structurées de manière à permettre des intégrations et une interopérabilité sans faille ?

Maintenant que nous avons vu comment les ingénieurs de données peuvent aborder la qualité des données, voyons comment obtenir l’adhésion d’autres parties prenantes dans l’entreprise.

Qualité des données ou valeur des données ?

Les ingénieurs des données parlent souvent de la qualité des données. Cependant, en changeant la conversation pour parler de la valeur des données, d'autres parties prenantes dans les Entreprises pourraient être encouragées à prendre une part plus importante dans le processus des données. Ceci est important pour attirer l'attention, les Ressources et l'assistance continue.

Pour ce faire, nous vous recommandons de discuter de la manière dont les données s’alignent sur les objectifs de l’entreprise. Sinon, les parties prenantes externes pourraient penser que la conversation tourne uniquement autour du nettoyage des données.

4 critères pour déterminer la valeur des données - pour les ingénieurs et l'entreprise :

  • Pertinence : les données répondent-elles à l’objectif métier ?
  • Couverture : les données couvrent-elles l’intégralité du marché, permettant ainsi à l’entreprise de les mettre en œuvre ?
  • Structure : Les données sont-elles structurées de manière à ce que l'entreprise puisse les utiliser ?
  • Exactitude : les données sont-elles complètes et correctes ?

Comment aborder les dirigeants et le conseil d’administration ?

En faisant porter la conversation sur la valeur des données plutôt que sur leur qualité, on peut encourager les dirigeants et le conseil d'administration à investir davantage de Ressources dans le pipeline de données. Voici comment les aborder :

  1. Commencez par expliquer pourquoi la gestion des données revêt une importance stratégique pour votre entreprise. Montrez comment les données peuvent faciliter la mise en œuvre des objectifs stratégiques.
  2. Expliquez comment la gestion et l’analyse des données peuvent aider l’entreprise à atteindre ses objectifs. Montrez comment les données peuvent développer, améliorer et protéger l’entreprise. Vous pouvez intégrer les quatre critères précédents pour renforcer vos arguments.
  3. Reliez les données à des services spécifiques. Montrez comment les données peuvent contribuer à améliorer l’efficacité opérationnelle, à accroître les ventes et à atténuer les risques. Aucun autre service ne peut prétendre contribuer à la croissance, à l’amélioration et à la protection de tous les services dans les mêmes proportions que l’ingénierie des données.
  4. N’insistez pas sur les processus et les technologies, vous risquez de perdre une partie de votre audience.

Comment s'entraîner en interne

Outre la direction de l’entreprise, il est également important de faire participer les membres de l’entreprise. Cela facilitera l’analyse et le suivi des données. Les ingénieurs de données ont souvent besoin que les employés de l’entreprise participent à l’effort continu de maintenance des données. Par exemple, les commerciaux doivent remplir plusieurs champs dans un CRM lorsqu’ils ajoutent une nouvelle opportunité.

Nous vous recommandons d’investir du temps dans la gestion du personnel, par exemple en le formant et en veillant à ce que tout le monde soit au courant de l’importance de la qualité des données. Par exemple, expliquez comment l’identification précise des écarts peut aider à découvrir une anomalie commerciale (plutôt qu’une anomalie des données, ce qui peut se produire si les utilisateurs ne mettent pas à jour les données de manière cohérente et complète).

Le fléau de l’« Autre »

L’audit de la valeur des données est crucial car il a un impact direct sur la capacité à prendre des décisions à partir de ces données. Si vous avez besoin d’un exemple pour convaincre les employés de participer à la gestion des données, rappelez-leur « le fléau de l’Autre ». »

Lorsque des unités commerciales telles que le marketing, les produits et les ventes surveillent des tableaux de bord et qu’une grande partie est intitulée « Autre », elles ne disposent pas de toutes les données dont elles ont besoin et leurs prises de décisions sont ralenties. Ceci est le résultat d’un défaut de gestion et de gouvernance des données.

Bonnes pratiques pour commencer : garantir la qualité des données dans toute l’entreprise

Comment les ingénieurs des données transforment-ils la théorie abstraite de la qualité des données en action concrète ? Mettons en œuvre un plan exploitable avec tous les thèmes que nous avons couverts.

Étape 1 : auditer l’état des données

Tout d’abord, évaluez les domaines qui devraient être couverts et la qualité de leur gestion. Cela inclut des types de données tels que :

  • Données relatives aux relations avec les clients, les fournisseurs, les partenaires, les prospects, les citoyens, les patients et les clients
  • Données sur la marque provenant de produits, de services, d'offres, de bannières, etc.

Identifier les erreurs aux différentes étapes du pipeline, en commençant par l’ingestion.

Étape 2 : présenter le pipeline de données

Présentez la situation des données aux différentes parties prenantes. Montrez comment les données sont gérées depuis le point d'entrée jusqu'au produit final. Ensuite, expliquez comment la valeur actuelle des données affecte leurs décisions. Présentez les points d'erreur et suggérez des correctifs.

Étape 3 : hiérarchiser les problèmes

Élaborez un plan hiérarchisé pour conduire le changement. Déterminez les problèmes à corriger en priorité. Incluez l’identification des sources et la manière dont elles envoient les données, la gestion des données et la formation des employés. Obtenez l’adhésion au plan et passez à l’exécution.

Conclusion

Il incombe aux ingénieurs des données de veiller à la qualité de ces dernières, mais aussi au reste de l’entreprise. Le suivi de la qualité des données commence à la source. Cependant, en obtenant l’adhésion des employés et de la direction, les ingénieurs des données peuvent s’assurer les ressources et l’attention nécessaires pour surveiller et résoudre les problèmes liés aux données tout au long du pipeline, et aider l’entreprise à se développer.

