Qu’est-ce que l’intendance des données ?

Deux personnes assises à un bureau regardant un grand écran d’ordinateur et une tablette.

Auteurs

Alice Gomstyn

Staff Writer

IBM Think

Alexandra Jonker

Staff Editor

IBM Think

Qu’est-ce que l’intendance des données ?

L’intendance des données est un ensemble de pratiques de gestion visant à garantir la qualité et l’accessibilité des données. Ces programmes s’inscrivent généralement dans le cadre des politiques de gouvernance des données d’une organisation.
 

Les intendants des données sont chargés de gérer les programmes d’intendance des données. Ils ont notamment pour mission de définir des mesures de la qualité des données, de gérer les métadonnées et les données de référence, d’effectuer la traçabilité des données et de classer les données sensibles.

Les intendants des données disposent d’un éventail de technologies et d’outils, notamment l’intelligence artificielle (IA), les catalogues de données, les bases de données relationnelles, les plateformes de qualité des données ou encore les logiciels de gouvernance des données.

Design 3D de balles roulant sur une piste

Les dernières actualités et informations en matière d’IA 


La newsletter hebdomadaire Think vous apporte toute l’actualité sur l’IA, le cloud et bien d’autres sujets. 

Pourquoi l’intendance des données est-elle importante ?

Aujourd’hui, les entreprises collectent et analysent plus de données que jamais en vue d’en tirer des informations précieuses. Cependant, la collecte et l’analyse des données ne suffisent pas pour garantir les résultats. L’intendance des données permet une utilisation efficace des données au sein d’une culture axée sur ces dernières.

Ces dernières années, avec l’adoption croissante de l’IA, l’intendance des données a pris une importance supplémentaire. En effet, les systèmes d’IA consomment et produisent énormément de données. L’intendance des données permet donc d’en assurer la qualité et l’intégrité afin que les processus alimentés par l’IA soient efficaces, conformes aux réglementations gouvernementales et en phase avec la gouvernance et les normes éthiques de l’IA.

De bons programmes d’intendance des données permettent de curer correctement les données en améliorant leur qualité, accessibilité, sécurité et facilité d’utilisation. Les intendants des données veillent à ce que les employés puissent accéder à des données utiles et précises afin de favoriser la prise de décisions et les gains de productivité induits par l’IA. Parmi les autres avantages de l’intendance des données, on peut citer une interprétation plus cohérente des données et une meilleure préparation aux audits.

Pour ce faire, les intendants des données collaborent généralement avec de nombreuses parties prenantes comme les propriétaires de données, les analystes de données, les experts en science des données et les utilisateurs professionnels.

Les employés qui ne sont pas officiellement reconnus comme des « intendants des données » peuvent néanmoins en assumer certaines responsabilités et consacrer beaucoup de temps à répondre aux besoins de leur organisation en matière de données, par exemple en les inventoriant et en évaluant leur qualité. Cependant, certains experts en gestion des données affirment que la formalisation des rôles d’intendance des données est importante car elle témoigne du sérieux de l’entreprise quant à la gestion de la qualité des données1.

AI Academy

La gestion des données est-elle le secret de l’IA générative ?

Découvrez pourquoi des données de haute qualité sont essentielles pour une utilisation réussie de l’IA générative.

Quelle est la différence entre l’intendance des données et la gouvernance des données ?

La gouvernance et l’intendance des données sont des concepts distincts mais liés. Les programmes de gouvernance des données des entreprises contribuent à garantir l’intégrité et la sécurité des données par le biais de politiques, de normes et de procédures relatives à leur collecte, propriété, stockage, traitement et utilisation. De nombreuses responsabilités en matière d’intendance des données impliquent la mise en œuvre des règles définies dans les cadres de gouvernance des données. À ce titre, l’intendance des données peut être considérée comme « l’aspect opérationnel » de la gouvernance des données2.

Quels sont les différents types d’intendants des données ?

Les entreprises disposant d’un programme d’intendance des données plus mature peuvent avoir différents types d’intendants des données :

  • Intendant des données métier : Ces personnes sont spécialisées dans la gestion des données au sein de fonctions précises, telles que le marketing ou le service client.

  • Intendant des données techniques : Ces personnes possèdent une expertise technique dans les processus et systèmes de données, notamment les processus d’extraction, de transformation et de chargement (ETL) et les entrepôts de données.

  • Intendant des données d’entreprise : les intendants des données d’entreprise dirigent les communautés d’intendants des données au sein de l’entreprise et assurent la liaison avec les autres cadres.3

Quels sont les cas d’utilisation de l’intendance des données ?

Voici quelques cas d’utilisation de l’intendance des données :

  • Master Data Management
  • Amélioration de la qualité des données
  • Gestion des métadonnées
  • Gestion des données de référence
  • Résolution d’identité
  • Sécurité de l’information et protection de la confidentialité des données
  • Traçabilité des données
  • Gestion des risques liés aux processus métier

Master Data Management

L’intendance des données joue souvent un rôle clé dans la gestion des données de référence (MDM), qui désigne la gestion des données essentielles d’une organisation par le biais de technologies, d’outils et de processus. Les entreprises utilisent la MDM pour créer une source d’information unique qui regroupe des données provenant de diverses sources, de sorte que tous les utilisateurs puissent travailler à partir des mêmes informations.

Les entreprises et les intendants des données commencent souvent à mettre en œuvre la MDM dans un seul domaine de données (groupements logiques de données similaires, tels que les données des clients ou des employés) avant de l’étendre à l’ensemble des données de l’organisation4.

Amélioration de la qualité des données

Les intendants des données veillent à améliorer la qualité des données en examinant le contenu de leur base de données. Cette pratique est connue sous le nom de profilage des données. Ils collaborent également avec les parties prenantes pour définir les données, élaborer des indicateurs de qualité des données et établir des business rules (par exemple, les valeurs considérées comme valides ou non valides).

Par exemple, comme expliqué dans le livre « Data Stewardship », lorsque les données collectées sont l’état civil d’un client, une règle peut stipuler que « célibataire », « marié », « veuf » ou « divorcé » sont des valeurs valides, tandis que le manque de réponse est considéré comme non valide.5 Les intendants des données proposent également des solutions pour résoudre les problèmes de qualité des données, le cas échéant.

Gestion des métadonnées

Les métadonnées sont des informations qui décrivent un point ou un jeu de données, comme la date de création ou l’auteur. Les intendants des données peuvent être chargés de créer des métadonnées de qualité et d’évaluer la qualité des métadonnées existantes. Comme pour les données, les intendants des données sont chargés de résoudre les problèmes de qualité des métadonnées.

Gestion des données de référence

Les intendants des données gèrent souvent les données de référence, c’est-à-dire les données qui permettent de classer les autres données au sein de l’entreprise. Les indicatifs de pays, les informations sur les devises et les codes de produits sont des exemples de données de référence. En s’appuyant sur la documentation correspondante, les intendants des données enregistrent les valeurs valides des données de référence, déterminent si de nouvelles valeurs valides sont nécessaires et réconcilient les valeurs des données de référence dans les différents systèmes.

Dans le dernier cas, pour reprendre l’exemple de l’état civil, l’intendant des données est chargé de déterminer les mesures à prendre lorsqu’un système autorise les données « veuf » et « divorcé » comme données d’état civil, alors qu’un autre n’accepte que les termes « marié » et « célibataire ».6

Résolution d’identité

Souvent, plusieurs instances de données représentent la même entité. Prenons l’exemple d’un client qui apparaît plusieurs fois dans la base de données d’une chaîne de pharmacies parce qu’il a eu différentes ordonnances traitées dans différentes officines.

Grâce à un processus connu sous le nom de résolution d’identité, les intendants des données déterminent si plusieurs instances de données font référence à la même entité. Dans le cas du client de pharmacie, par exemple, la résolution d’identité permet de détecter, lors du traitement des ordonnances, les interactions potentiellement dangereuses des différents médicaments.7

Sécurité de l’information et protection de la confidentialité des données

La sécurité de l’information est la protection des informations importantes contre tout accès, divulgation, utilisation, modification ou perturbation non autorisés. En vertu de la réglementation sur la confidentialité des données, les entreprises sont tenues de mettre en œuvre des protections renforcées pour les informations sensibles telles que les données de santé. Elles doivent également se conformer aux dispositions régissant le partage des données, la limitation de leur collecte et bien d’autres choses encore. Les intendant des données peuvent jouer un rôle dans la protection des données et la conformité réglementaire en créant et en établissant des classifications de sécurité pour différents types de données.

Traçabilité des données

La traçabilité des données est le processus qui consiste à suivre le cycle de vie des données, afin de bien comprendre leur origine, leur évolution et leur destination finale. Les intendants des données peuvent effectuer la traçabilité des données, permettant ainsi à l’organisation de garantir l’intégrité des données à des fins d’établissement de rapports réglementaires.

Gestion des risques liés aux processus métier

Une mauvaise qualité des données peut mettre en péril les processus métier. Les intendants des données collaborent parfois avec les responsables des processus métier en vue de déterminer l’utilisation des données dans un processus donné et le degré de vulnérabilité de ce processus en cas de mauvaise qualité des données8.

Quels outils et technologies soutiennent l’intendance des données ?

Les entreprises peuvent mettre en œuvre divers outils et solutions pour faciliter leurs tâches d’intendance des données :

  • Intelligence artificielle (IA)
  • Catalogue de données
  • Outils de profilage et d’analyse des données
  • Systèmes de gestion des bases de données relationnelles (SGBDR)
  • Logiciel de gouvernance des données

Intelligence artificielle

La relation entre l’IA et l’intendance des données peut être considérée comme symbiotique. Alors que l’intendance des données permet de garantir que les systèmes d’IA sont alimentés par des données de qualité, les outils pilotés par l’IA optimisent les tâches d’intendance des données. Par exemple, les outils de préparation des données pilotés par l’IA vérifient la validité et signalent les erreurs telles qu’un formatage incorrect, tandis que les outils de prévention des pertes de données pilotés par l’IA détectent les informations sensibles et appliquent des contrôles de sécurité, le cas échéant.

Catalogue de données

Un catalogue de données est un inventaire de tous les actifs de données d’une organisation. Sa vocation est d’aider les professionnels des données, dont les intendants, à trouver facilement et rapidement des informations. Les métadonnées associées à chaque actif de données permettent d’effectuer des recherches dans le catalogue.

Outils de profilage et d’analyse des données

Les outils de profilage et d’analyse des données permettent d’évaluer la cohérence et la qualité des données. Certains outils permettent notamment d’identifier les anomalies, de valider les sources de données et de résumer les résultats de l’analyse dans des rapports personnalisés.

Systèmes de gestion des bases de données relationnelles

Un des moyens utilisés par les intendants des données pour organiser ces dernières consiste à utiliser des bases de données relationnelles (BDR). Une BDR est un type de base de données dans laquelle les données sont organisées en lignes et en colonnes. Les tables ainsi obtenues peuvent être reliées entre elles pour mettre en évidence les relations entre les points de données. Les intendants des données et d’autres personnes utilisent des SGDBR pour maintenir et mettre à jour les BDR.

Logiciel de gouvernance des données

Les logiciels de gouvernance des données intègrent souvent des outils de profilage et d’analyse des données ainsi que des capacités pilotées par l’IA. Parmi ces fonctionnalités, on trouve l’enrichissement des métadonnées par l’IA, la création de catalogues de données, la traçabilité des données et la mise en place d’un contrôle d’accès aux données basé sur les rôles.

Notes de bas de page

Tous les liens sont externes à ibm.com.

1, 4 Allen et al. « Multi-Domain Master Data Management », Morgan Kaufmann, 10 avril 2015.

2, 3, 5, 6, 7, 8 Plotkin. « Data Stewardship, Second Edition ». Academic Press. 20 novembre 2020.

Solutions connexes
Logiciels et solutions de gestion des données

Élaborez une stratégie de gestion des données qui élimine les silos, réduit la complexité et améliore la qualité des données pour offrir une expérience client et collaborateur exceptionnelle.

Découvrir les solutions de gestion des données
IBM watsonx.data

Watsonx.data vous permet d’adapter le dimensionnement des analyses et de l’IA à toutes vos données, où qu’elles se trouvent, grâce à un entrepôt de données ouvert, hybride et gouverné.

Découvrir watsonx.data
Services de conseil pour les données et les analyses

Avec IBM Consulting, exploitez les données de votre entreprise et développez une organisation basée sur les informations pour tirer des avantages métier.

Découvrir les services d’analytique
Passez à l’étape suivante

Élaborez une stratégie de gestion des données qui élimine les silos, réduit la complexité et améliore la qualité des données pour offrir une expérience client et collaborateur exceptionnelle.

Découvrir les solutions de gestion des données Découvrir watsonx.data