Qu'est-ce que la gouvernance des données ?

Découvrez comment la gouvernance des données permet aux entreprises de rentabiliser au maximum leurs actifs de données.

Personnel médical utilisant une tablette dans un environnement de clinique
Qu'est-ce que la gouvernance des données ?

La gouvernance des données favorise la disponibilité, la qualité et la sécurité des données d'une organisation grâce à différentes politiques et normes. Ces processus déterminent les propriétaires des données, les mesures de sécurité des données et les utilisations prévues pour les données. Globalement, l'objectif de la gouvernance des données est de gérer des données de haute qualité, qui soient à la fois sécurisées et facilement accessibles pour permettre d'en extraire des informations métier approfondies.

Le big data et les initiatives de transformation numérique sont les principaux moteurs des programmes de gouvernance des données. Au fur et à mesure de l’augmentation du volume des données issues de nouvelles sources, telles que les technologies de l'Internet des objets (IoT), les organisations doivent réévaluer leurs pratiques de gestion des données afin de faire évoluer leur veille économique. Les programmes de gouvernance des données efficaces cherchent à améliorer la qualité des données, à réduire les silos de données, à assurer la conformité et la sécurité, et à distribuer correctement l'accès aux données.


Gouvernance des données et gestion des données : comparatif

La portée de la gestion des données est plus large que celle de la gouvernance des données. Elle peut être définie comme la pratique consistant à ingérer, traiter, sécuriser et stocker les données d'une organisation, les données étant ensuite utilisées pour la prise de décisions stratégiques afin d'améliorer les résultats métier. Cette définition englobe la gouvernance des données, mais elle inclut également d'autres domaines du cycle de vie de la gestion des données, tels que le traitement, le stockage et la sécurité. Comme ces autres domaines de la gestion des données peuvent également impacter leur gouvernance, toutes les équipes en charge de ces domaines doivent collaborer pour mettre en œuvre une stratégie de gouvernance des données. Par exemple, une équipe de gouvernance des données peut identifier des points communs entre des ensembles de données disparates, mais si elle veut les intégrer, elle devra s'associer à une équipe de gestion des données pour définir le modèle et l'architecture des données permettant de mettre en place ces relations. Un autre exemple peut être l'accès aux données : l'équipe de gouvernance des données peut définir les politiques d'accès à des types de données spécifiques, par exemple les informations identifiant la personne (PII). De son côté, l'équipe de gestion des données fournira cet accès directement ou mettra en place le mécanisme fournissant cet accès, par exemple en utilisant des rôles d'utilisateurs définis en interne pour approuver l'accès.  


Avantages de la gouvernance des données

La mise en place d'une infrastructure de gouvernance des données peut accroître la valeur des données au sein de votre organisation. Comme la gouvernance des données contribue à améliorer l'exactitude globale des données, elle a également un impact sur les résultats basés sur ces données, qu'il s'agisse de simples décisions métier prises au quotidien ou d'initiatives d'automatisation plus complexes. Les autres principaux avantages sont les suivants :

  • Impulser une utilisation à grande échelle et la maîtrise des données – Un accès limité aux données au sein d'une organisation comporte le risque de brider l'innovation et de créer des dépendances vis-à-vis des experts de domaine dans le cadre des processus métier. Les pratiques de gouvernance des données créent une voie permettant aux équipes interdisciplinaires de se réunir pour créer une compréhension commune des données entre les systèmes (par exemple, en rapprochant les différences entre des données indépendantes d'un domaine). Cette compréhension commune peut ensuite se manifester sous la forme de normes de données, permettant de documenter les définitions des données et des métadonnées dans un endroit centralisé, tel qu'un catalogue de données. Cette documentation, à son tour, devient la base des solutions en libre-service, telles que les API, qui permettent de disposer de données cohérentes et d'un accès fédéré à celles-ci dans toute l'organisation.   
  • Assurer la sécurité, la confidentialité des données et la conformité – Les politiques de gouvernance des données permettent de répondre aux exigences des réglementations gouvernementales concernant les données sensibles et la confidentialité, telles que le Règlement général sur la protection des données (RGPD) de l'UE, la loi américaine HIPAA (Health Insurance Portability and Accountability Act), et les exigences sectorielles telles que les normes de sécurité des données de l'industrie des cartes de paiement (PCI DSS). Les violations de ces exigences réglementaires peuvent entraîner de coûteuses amendes gouvernementales et un désaveu du public. Pour éviter ces conséquences, les entreprises adoptent des outils de gouvernance des données afin de mettre en place des garde-fous qui empêchent les violations de données et leur utilisation abusive.
  • Données de haute qualité – La gouvernance des données garantit l'intégrité, l'exactitude, l'exhaustivité et la cohérence des données. Des données de bonne qualité permettent aux entreprises de mieux comprendre leurs flux de travail et leurs clients, ainsi que de déterminer comment optimiser leurs performances métier globales. Cependant, des erreurs dans les mesures de performance peuvent orienter une organisation dans la mauvaise direction, mais les outils de gouvernance des données peuvent remédier aux inexactitudes potentielles. Par exemple, les outils de lignage de données permettent aux propriétaires des données de retracer l'historique des données tout au long de leur cycle de vie, y compris les informations sur la source ou les transformations de données qui ont été appliquées pendant les processus ETL ou ELT. Cela permet d'examiner en détail la cause première de toute erreur de données.
  • Promouvoir l'analyse des données – Les données de qualité servent de tremplin à des initiatives plus avancées en matière d'analyse des données et de science des données. Il peut s'agir de rapports de business intelligence ou de projets d'apprentissage automatique prédictifs plus complexes. Ces derniers peuvent uniquement être hiérarchisés lorsque les principales parties prenantes ont confiance dans les données sous-jacentes ; sinon, ils risquent de ne pas être adoptés.

Les enjeux de la gouvernance des données

Bien que les avantages de la gouvernance des données soient clairs, les initiatives de gouvernance des données doivent surmonter un certain nombre d'obstacles pour réussir. En voici quelques-uns :

  • Alignement organisationnel : Au début d'un programme de gouvernance des données, l'un des plus grands défis consistera à aligner les parties prenantes de toute l'organisation afin de déterminer les actifs de données clés et leurs définitions et formats respectifs. Les politiques réglementaires peuvent dans une certaine mesure structurer les conversations sur les données des clients, mais il peut être plus difficile de se mettre d'accord sur d'autres ensembles de données qui relèvent du Master Data Management (MDM), comme les données plus spécifiques aux produits.
  • Absence de sponsorisation adaptée : Les bons programmes de gouvernance des données nécessitent généralement une sponsorisation à deux niveaux : celui de la direction et celui des contributeurs individuels. Les directeurs des données (Chief Data Officers -CDO) et les intendants de données sont essentiels pour la communication et la hiérarchisation de la gouvernance des données au sein d'une organisation. Le CDO peut assurer la supervision et l'imputation des responsabilités des équipes de données afin de garantir l'adoption des politiques de gouvernance. Les intendants de données peuvent contribuer à sensibiliser les producteurs et les consommateurs de données à ces politiques afin d'encourager la conformité dans l'ensemble de l'organisation.
  • Architecture et processus de données pertinents - Sans les bons outils et une architecture de données adéquate, les entreprises peineront à déployer un programme efficace de gouvernance des données. À titre d'exemple, les équipes peuvent découvrir des données redondantes dans différentes fonctions, mais les architectes de données devront développer des modèles et des architectures de données appropriés pour pouvoir fusionner et intégrer les données dans l'ensemble des systèmes de stockage. Les équipes peuvent également avoir besoin d'adopter un catalogue de données pour créer un inventaire des actifs de données dans l'ensemble de l'organisation. Si elles possèdent déjà un catalogue, elles peuvent avoir besoin de mettre en place un processus de gestion des métadonnées, qui garantit que les données sous-jacentes sont pertinentes et à jour.

Solutions IBM

IBM Cloud Pak for Data

Prévoyez les résultats plus rapidement à l'aide d'une plateforme construite sur une architecture de matrice de données. Collectez, organisez et analysez des données, peu importe où elles se trouvent.


IBM Watson Knowledge Catalog

Activez les données prêtes à l'emploi pour l'IA et l'analyse avec un catalogage intelligent, optimisé par une gestion active des métadonnées et des règles



Pour aller plus loin

IBM Cloud Pak for Data exploite les microservices et ses principales capacités de données et d'IA pour automatiser l'intégration intelligente des données dans les systèmes distribués, offrant aux entreprises une vue globale des performances de l'entreprise. Cela facilite une collecte, une organisation et un aperçu plus rapides des données d'entreprise, et permet aux entreprises de prendre des décisions à plus grande échelle. Les équipes de gestion des données peuvent également être sûres que leurs données sont sécurisées grâce aux cadres de sécurité compétitifs d'IBM qui permettent de garantir le respect des politiques réglementaires et de réduire tout risque de conformité. Découvrez comment IBM Cloud Pak® for Data et IBM Streams peuvent vous aider à comprendre et à gérer l'architecture de données de votre entreprise dans plusieurs environnements.