My IBM Se connecter S’abonner
Qu’est-ce que la gouvernance des données ?

Qu’est-ce que la gouvernance des données ?

Découvrir la solution de gouvernance des données d’IBM S’inscrire à la newsletter Think
Collage représentant des nuages, des diagrammes circulaires et des graphiques

Mise à jour : 20 septembre 2024 
Contributeurs
 : Jim Holdsworth, Matthew Kosinski

Qu’est-ce que la gouvernance des données ?

Qu’est-ce que la gouvernance des données ?

La gouvernance des données est une discipline de gestion des données qui met l’accent sur la qualité, la sécurité et la disponibilité des données de l’entreprise. Afin de garantir l’intégrité et la sécurité des données, la gouvernance définit et met en œuvre des politiques, des normes et des procédures pour la collecte, la possession, le stockage, le traitement et l’utilisation des données. 

L’objectif de la gouvernance des données est de garantir des données sûres, de qualité et facilement accessibles, à des fins de découverte de données et de Business Intelligence. À l’instar d’un centre de contrôle aérien, la gouvernance des données permet de garantir que les données sont vérifiées et qu’elles circulent dans des pipelines sécurisés vers des points de terminaison et des utilisateurs de confiance.

L’intelligence artificielle (IA), le big data et la transformation numérique sont les principaux catalyseurs des programmes de gouvernance des données. Face au volume croissant de données provenant de nouvelles sources comme l’Internet des objets (IdO), les entreprises doivent repenser leurs pratiques de gestion des données pour faire évoluer leurs processus de Business Intelligence (BI).

Les programmes de gouvernance des données permettent aux entreprises de protéger et de gérer de grandes quantités de données. En effet, elles sont en mesure d’améliorer la qualité des données, de réduire les silos de données, de mettre en place des politiques de conformité et de sécurité, et de contrôler l’accès aux données de manière appropriée.

Gouvernance des données pour les responsables des données

Cet eBook explore des sujets liés à la gouvernance des données et à la confidentialité, tels que l’évolutivité, les normes à l’échelle de l’entreprise et la traçabilité des données.

Contenu connexe
watsonx.governance
Gouvernez les modèles d’IA générative créés dans watsonx.ai et ceux développés sur des plateformes tierces
Obtenir l’e-book sur l’IA générative
Gouvernance des données et gestion des données

Gouvernance des données et gestion des données

La gouvernance des données est une branche de la gestion des données qui consiste à collecter, à traiter et à utiliser les données de manière sûre et efficace, afin de favoriser une prise de décision stratégique et améliorer les résultats de l’entreprise.

Outre la gouvernance des données, la gestion des données englobe d’autres aspects du cycle de vie des données tels que le traitement, le stockage et la sécurité. Ces différents aspects du processus de gestion des données sont intimement liés. 

Parce que ces autres aspects de la gestion des données ont un impact sur la gouvernance des données, les différentes équipes doivent collaborer pour élaborer et suivre une stratégie de gouvernance des données. 

Supposons que l’équipe chargée de la gouvernance des données identifie les points communs de plusieurs jeux de données disparates. Pour intégrer ces données, elle doit normalement collaborer avec une équipe de gestion des données afin de définir le modèle de données, ainsi que leur architecture.

Un autre exemple est celui de l’accès aux données. Ici, une équipe de gouvernance des données définit des politiques pour encadrer l’accès à certains types de données, comme les données personnelles. Ensuite, l’équipe de gestion des données se charge de fournir cet accès directement, ou de créer un mécanisme à cet effet, souvent le contrôle d’accès basé sur les rôles (RBAC)

Cadres de gouvernance des données

Cadres de gouvernance des données

Le cadre de gouvernance des données détaille les structures et les processus mis en place par l’entreprise pour gérer les actifs de données critiques. Il définit la propriété des données, ainsi que les responsabilités associées, et précise la manière dont les données doivent être traitées pour garantir leur qualité, leur sécurité et leur conformité.

Il n’existe pas de cadre des exigences unique, car les cadres des exigences sont généralement des feuilles de route qui reflètent les besoins de chaque organisation (systèmes de données, sources de données, protocoles des secteurs et réglementations du gouvernement).

Les cadres de gouvernance des données portent généralement sur les aspects suivants :

  • Objectifs, rôles et tâches du programme
  • Normes, politiques et processus en matière de données
  • Procédures d’audit
  • Outils de gouvernance des données

Objectifs, rôles et tâches du programme

Les programmes de gouvernance des données définissent généralement un objectif ou un ensemble d’objectifs. Il peut s’agir d’améliorer la qualité des données, de renforcer la conformité ou d’axer la prise de décision sur les données. Ils établissent également des indicateurs pour mesurer les progrès vers ces objectifs. Les principaux indicateurs de gouvernance sont les suivants :

  • Réduire le risque d’erreur et la redondance des données.

  • Améliorer l’efficacité et accélérer la mise sur le marché pour réduire les coûts.

  • Cohérence et exhaustivité des données.

  • Niveau de littératie des données et respect des processus par les salariés.

Les programmes de gouvernance définissent également les rôles et les responsabilités des acteurs impliqués : comité de pilotage, propriétaires de données, intendants des données et parties prenantes.

  • Les membres du comité de pilotage, ou conseil de gouvernance, supervisent la stratégie de gouvernance des données, ainsi que l’orientation générale du cadre. Ce comité comprend souvent des cadres supérieurs, comme les cadres de direction ou les vice-présidents, qui supervisent les différents services.

  • Les propriétaires de données supervisent les domaines correspondants au sein des unités commerciales. Chargées de garantir l’exactitude, la qualité et la cohérence des données, ils proposent des solutions en matière de gouvernance des données, de politiques relatives aux données et d’exigences réglementaires.

  • Les intendants des données gèrent au quotidien des domaines bien spécifiques. 

  • Les parties prenantes et les équipes commerciales sont les consommateurs de données de l’entreprise. 

Normes, politiques et processus en matière de données

Les cadres de gouvernance définissent les paramètres relatifs aux données à gérer, ainsi que les résultats escomptés. Il s’agit notamment de définir des lignes directrices pour les formats de données, les modèles de données, le master data management (MDM), les métadonnées, les conventions de dénomination, etc. 

Souvent, les cadres de gouvernance cartographient les flux de données et définissent la manière dont les données sont collectées, stockées, déplacées et archivées. Ils peuvent également définir le matériel, les logiciels et les services employés pour assurer la gouvernance et soutenir l’architecture de données de l’entreprise.

Certains cadres de gouvernance définissent les scopes de données, c’est-à-dire les paramètres d’accès aux différents actifs de données tels que les données de référence, les métadonnées et les données historiques. Cela permet de garantir que les utilisateurs et les applications ont accès uniquement aux données dont ils ont besoin, et que seules les personnes autorisées peuvent accéder aux données.

Procédures d’audit

Les cadres de gouvernance décrivent les procédures de test, d’audit et de tenue des registres afin de garantir la transparence et l’explicabilité du programme de gouvernance.

Les audits réguliers permettent de s’assurer que les utilisateurs respectent le cadre de gouvernance des données. Les audits permettent également d’identifier la manière dont le programme de gouvernance doit évoluer pour tenir compte des nouvelles données, des nouveaux processus ou encore des nouvelles technologies.

Enfin, les audits permettent aux entreprises d’assurer et de prouver leur conformité réglementaire.  

Outils de gouvernance des données

La technologie est essentielle pour assurer une gouvernance efficace des données. Les outils de gouvernance des données proposés aux entreprises vont des plateformes complètes aux solutions ponctuelles spécialisées. Le choix des outils dépend de l’architecture de données et du cadre de gouvernance de chaque entreprise.

Les fonctionnalités courantes des solutions de gouvernance des données sont les suivantes :

  • Découvrir et classer les données automatiquement.

  • Application des règles de protection des données et des contrôles d’accès basés sur les rôles.

  • Respect des exigences en matière de confidentialité et de conformité.

  • Automatisation de la gestion des métadonnées, du catalogage des données et du suivi de leur traçabilité.

  • Prise en charge d’un glossaire métier.

Les solutions de gouvernance des données gèrent différents formats de données. Certaines proposent des fonctionnalités de visualisation pour améliorer la compréhension des jeux de données et des relations complexes, et faciliter l’identification des tendances, des données aberrantes et des aspects qui nécessitent une attention particulière.

Avantages de la gouvernance des données

Avantages de la gouvernance des données

Un cadre de gouvernance des données efficace offre de nombreux avantages aux entreprises :

  • Tirer le meilleur parti des données
  • Favoriser l’innovation et l’efficacité
  • Disposer d’une source d’information unique
  • Garantir la confidentialité, la sécurité et la conformité des données
  • Sécuriser l’utilisation des données au sein des projets d’IA
  • Améliorer la précision de l’analyse de données

Tirer le meilleur parti des données

Les décisions axées sur des données erronées ne peuvent pas être efficaces. La gouvernance des données permet de garantir l’intégrité, l’exactitude, l’exhaustivité et la cohérence des données, et ce grâce à un cadre favorisant une intendance et une gestion des données de bout en bout efficaces.

Si leurs données sont fiables, les entreprises sont en mesure de découvrir de nouvelles opportunités, de mieux comprendre leurs clients, ainsi que leurs workflows, et d’optimiser leur performance globale.

Sans gouvernance des données, des erreurs peuvent se glisser dans les indicateurs de performance et orienter l’entreprise dans la mauvaise direction. Les outils de gouvernance des données permettent de corriger les inexactitudes avant qu’elles n’affectent la stratégie de l’entreprise.

Par exemple, les outils de traçabilité des données permettent aux propriétaires de ces dernières d’assurer leur suivi tout au long de leur cycle de vie, notamment les transformations subies lors des processus d’extraction, de transformation et de chargement (ETL) ou d’extraction, de chargement et de transformation (ELT). Cela permet aux entreprises d’identifier et d’éliminer les causes racines des erreurs présentes dans les données.

Favoriser l’innovation et l’efficacité

Lorsque l’accès aux données est restreint au sein de l’entreprise, cela peut limiter l’innovation, créer une dépendance à l’égard des experts métier (SME) et ralentir les processus de l’entreprise.

Les programmes de gouvernance des données autorisent l’accès aux données de manière appropriée, permettant à chaque service ou individu d’accéder uniquement aux données dont il a besoin. Cela permet aux équipes interfonctionnelles de collaborer plus étroitement et plus efficacement, tout en assurant la sécurité des données. 

Disposer d’une source d’information unique

Un système de données gouvernées efficacement fournit une source d’information unique au sein de l’entreprise. La prise de décision est améliorée lorsque toutes les parties utilisent les mêmes jeux de données.

Regrouper les données et les métadonnées dans un catalogue de données unique permet d’éviter la confusion et de réduire les inefficacités. Cette documentation sert alors de base aux solutions en libre-service qui garantissent la cohérence des données et leur accessibilité au sein de l’entreprise.

Garantir la confidentialité, la sécurité et la conformité des données

Les politiques de gouvernance des données comprennent généralement des mesures facilitant la mise en conformité avec les réglementations portant sur la protection des données sensibles, comme le Règlement général sur la protection des données(RGPD) de l’UE et la loi américaine HIPAA (Health Insurance Portability and Accountability Act), et avec les normes sectorielles telles que la norme de sécurité des données de l’industrie des cartes de paiement (PCI DSS). Le non-respect de ces exigences réglementaires peut faire l’objet d’une amende salée et susciter le mécontentement du grand public.

Les outils de gouvernance des données aident les entreprises à mettre en place des garde-fous pour prévenir les violations de données, les fuites et l’utilisation abusive. Les cadres de gouvernance permettent de créer des systèmes de données clairs, explicables, équitables et inclusifs, afin de préserver la confidentialité, de renforcer la sécurité, de favoriser la fidélisation et de gagner la confiance des clients.

Sécuriser l’utilisation des données au sein des projets d’IA

Dans une enquête d’IDC, seules 45,3 % des personnes interrogées ont déclaré disposer « de règles, de politiques et de processus pour appliquer leurs principes d’IA responsable » et se protéger ainsi contre les violations de sécurité, les problèmes de responsabilité, les données client exposées et les risques réglementaires.1

La gouvernance des données implique de bien connaître l’origine, le degré de sensibilité et le cycle de vie de chaque donnée utilisée par l’entreprise. C’est la base de toute pratique de gouvernance de l’IA, essentielle pour atténuer les divers risques pesant sur l’entreprise.

La gouvernance des données permet aux entreprises d’appuyer leurs projets d’IA et de ML sur des données de qualité, tout en assurant la protection de ses dernières et en se conformant aux règles et réglementations en vigueur. Par exemple, les outils de gouvernance permettent de garantir que les données personnelles sensibles n’alimentent que les systèmes d’IA autorisés à les exploiter.

Améliorer la précision de l’analyse de données

Pour réussir ses projets d’analytique et de science des données, il est indispensable de disposer de données de qualité. Une bonne gouvernance des données permet de mener à bien des projets tels que la production de rapports de Business Intelligence, ou des projets plus complexes comme ceux de machine learning (ML) prédictif.

Par exemple, le profilage des données, qui consiste à examiner et à nettoyer les données pour mieux appréhender leur structure, permet de mieux comprendre la relation entre les différents jeux de données et sources.

Les défis de la gouvernance des données

Les défis de la gouvernance des données

La mise en œuvre des stratégies de gouvernance des données peut poser de nombreux défis. En voici quelques-uns :

  • Absence d’un accompagnement approprié
  • Une architecture de données incohérente
  • Visibilité et contrôle des données
  • Hausse de la demande d’accès
  • Exigences en matière de données d’IA

Absence d’un accompagnement approprié

Pour être efficaces, les programmes de gouvernance des données nécessitent généralement un accompagnement à deux niveaux : les dirigeants et les contributeurs individuels. Le directeur des données (CDO) et les intendants des données jouent un rôle essentiel dans la communication et la priorisation de la gouvernance des données au sein de l’entreprise.

Le CDO supervise et responsabilise les équipes chargées des données pour garantir l’adoption des politiques de gouvernance des données. Les intendants des données contribuent à faire connaître ces politiques auprès des producteurs et des consommateurs de données, afin de renforcer la conformité au sein de l’entreprise. 

En l’absence d’un accompagnement approprié, les utilisateurs de données risquent d’ignorer les politiques de gouvernance ou de ne pas s’en soucier, avec pour conséquences la non-conformité, un défaut d’intégrité des données et la compromission de leur sécurité.

Une architecture de données incohérente

Sans les outils et l’architecture de données adaptés, les entreprises peuvent peiner à déployer un programme de gouvernance des données efficace. 

Par exemple, les équipes peuvent découvrir des données redondantes au sein des différents services. Pour garantir une gouvernance efficace, les data architects doivent développer des modèles et des architectures de données appropriés pour fusionner et intégrer les données dans les systèmes de stockage.

Les équipes peuvent également adopter un catalogue de données pour dresser l’inventaire des actifs de données de l’entreprise. S’il existe déjà, elles devront élaborer un processus de gestion des métadonnées pour garantir que les données sous-jacentes sont pertinentes et à jour.

Visibilité et contrôle des données

La gouvernance des données, en particulier dans les environnements hybrides et multicloud, implique souvent des données stockées dans différents formats et emplacement, auprès de plusieurs fournisseurs. En outre, les données peuvent être regroupées dans différents types de magasins de données comme les data lakes, les data lakehouses et les entrepôts de données

Le Shadow IT peut compliquer davantage le processus. Selon une étude de TechTarget, le deuxième problème de sécurité des données le plus fréquemment signalé concerne les salariés qui utilisent des applications et des services cloud sans l’approbation du service informatique.2

Cette distribution des données peut rendre difficiles le suivi et la surveillance des flux de données et de leur utilisation. La gouvernance des données implique une bonne compréhension des sources de données, des destinations, des transformations, des dépendances, de la propriété, des droits d’accès et des responsabilités.

L’application de politiques de gouvernance des données dans plusieurs environnements nécessite une coordination entre les différentes parties prenantes : propriétaires des données, intendants des données, consommateurs de données et régulateurs des données.

Hausse de la demande d’accès

L’essor de l’analytique en libre-service et de la Business Intelligence pose de nouveaux défis en matière de gouvernance des données.

Les demandes d’accès provenant d’un plus grand nombre d’utilisateurs arrivent plus rapidement qu’auparavant, mais les équipes de gouvernance doivent trouver un équilibre entre la rapidité et l’accessibilité et les préoccupations en matière de confidentialité et de sécurité. En outre, les systèmes et les procédures de transmission de données en continu doivent être réglés avec précision pour éviter les fuites de données.

Exigences en matière de données d’IA

Lorsqu’il s’agit de fournir les données qui alimentent l’entraînement et l’exploitation de l’IA, peu d’outils de stockage et de gouvernance sont à la hauteur.

Après tout, l’IA est intrinsèquement plus complexe que les processus et les capacités standard pilotés par l’informatique, ce qui souligne l’importance d’une gouvernance des données active et éclairée. Selon un rapport publié par KPMG, le déficit de gouvernance de l’IA est l’un des principaux risques qui menacent actuellement les entreprises.3 Par exemple, sans garde-fous adaptés, l’IA peut exposer par inadvertance des données personnelles sensibles ou le secret d’affaires des entreprises.

Pour réduire les risques et la complexité de l’IA, les entreprises peuvent associer fonctionnalités de stockage des données optimisées par l’IA et programmes de gouvernance des données conçus pour répondre aux défis de l’IA.

Bonnes pratiques de gouvernance des données

Bonnes pratiques de gouvernance des données

Planifier et élaborer un cadre de gouvernance des données demande du temps et des efforts aux différentes parties prenantes et équipes. Voici quelques exemples de pratiques que les entreprises suivent pour bien mettre en œuvre leur programme de gouvernance :

  • Automatiser pour gagner en efficacité
  • Concilier praticité et sécurité des données
  • Créer un catalogue de données
  • Utiliser les modèles de maturité
  • Surveiller et améliorer en permanence

Automatiser pour gagner en efficacité

L’automatisation de certaines parties du processus de gouvernance des données peut contribuer à améliorer l’efficacité et à réduire les erreurs. Les outils de gouvernance et de gestion des données peuvent aider à automatiser les tâches de routine telles que :

  • Assurer la traçabilité des données pour faciliter la visualisation du flux de données à travers les systèmes sans avoir recours à des solutions complexes codées manuellement.

  • Définir des politiques pour attribuer des balises de métadonnées aux différents éléments de données tels que les colonnes ou les tables, afin de les identifier comme étant des informations sensibles.

  • La génération de journaux d’audit pour enregistrer les interactions de données (le but étant de comprendre comment les employés utilisent les données).

  • La classification des données se fait selon des categories prédéfinies telles que les données personnelles, les données financières, la propriété intellectuelle ou encore les informations confidentielles.

Concilier praticité et sécurité des données

Tout cadre de gouvernance des données repose sur une sécurité des données et des contrôles d’accès efficaces. En même temps, les entreprises tiennent à ce que les personnes autorisées à consulter et à utiliser les différents jeux de données puissent y accéder de la manière la plus fluide qui soit. Si les informations en libre-service ne sont pas facilement accessibles, la collaboration et la compréhension sont entravées.

Créer un catalogue de données

Nombreuses sont les entreprises qui peinent à gérer leurs données faute de visibilité. Un catalogue de données central comme source d’information unique permet de mener à bien les projets d’intégration et de gouvernance des données.

Un rapport publié par Gartner révèle une hausse de la demande de catalogues de données en raison de la difficulté qu’ont les entreprises à trouver, à répertorier et à analyser les actifs de données répartis et diversifiés. Un catalogue de données efficaces facilite la localisation et la classification des informations à l’échelle, permettant une meilleure application des politiques de gouvernance des données.

Utiliser les modèles de maturité

Bon nombre d’entreprises trouvent utile d’élaborer une feuille de route de gouvernance claire. Les modèles de maturité s’avèrent très efficaces à cet effet.

Le modèle de maturité de la gouvernance des données est un outil qui permet aux entreprises d’évaluer l’état actuel de leur programme de gouvernance, de définir leurs objectifs et de suivre les progrès au fil du temps.

Surveiller et améliorer en permanence

Les entreprises peuvent mettre en place des mécanismes d’évaluation et de reporting réguliers pour surveiller les données et les indicateurs de gouvernance au fil du temps. Ces évaluations permettent d’identifier les problèmes et d’améliorer les processus de gouvernance.

Pour garantir la pertinence et l’efficacité du cadre, il convient de le réviser régulièrement en fonction du feedback reçu, des nouvelles réglementations ou encore des changements de stratégie de l’entreprise.

Qui plus est, ces évaluations favorisent une culture qui valorise les données comme étant des actifs stratégiques. Cette approche permet de mener à bien les projets de Business Intelligence et garantit une utilisation efficace des données au sein de l’entreprise.

Solutions IBM

Solutions IBM

IBM Cloud Pak for Data

Accélérez les prédictions à l’aide d’une plateforme construite sur une architecture data fabric. Collectez, organisez et analysez les données, où qu’elles soient.

IBM Cloud Pak for Data
IBM Knowledge Catalog

Générez des données prêtes à l’emploi pour l’IA et les analyses grâce à un catalogage intelligent soutenu par une gestion active des politiques et des métadonnées.

IBM Knowledge Catalog
IBM Storage Scale

Stockage défini par logiciel pour la création d’une plateforme de données alliant IA, HPC et analytique.

IBM Storage Scale
IBM watsonx.data

Le data lakehouse ouvert et hybride qui alimente l'IA et l'analytique avec toutes vos données, où qu'elles se trouvent.

IBM watsonx.data
Ressources

Ressources

Gartner Predicts 2024: How AI will impact analytics users

Obtenez des informations uniques sur l’évolution des solutions ABI, mettant en évidence les principales conclusions, hypothèses et recommandations pour les responsables des données et de l’analytique.

Cas d’utilisation de la gouvernance des données

Cloud Pak for Data fournit les méthodes dont votre entreprise a besoin pour automatiser la gouvernance des données. Alliez accessibilité, confiance, protection, sécurité et conformité des données.

Magic Quadrant 2024 for Augmented Data Quality Solutions Report (rapport sur les solutions de qualité des données renforcée) de Gartner

Grâce à son approche holistique de la gestion de la qualité des données, l’entreprise IBM est nommée leader des solutions de qualité des données augmentée.

Passer à l’étape suivante

Accélérez les prédictions à l’aide d’une plateforme construite sur une architecture data fabric. Collectez, organisez et analysez les données, où qu’elles soient. Découvrez comment IBM Cloud Pak for Data peut améliorer les pratiques de gouvernance des données de votre entreprise dans les environnements multicloud.

Explorer IBM Cloud Pak for Data Commencez votre essai dès aujourd’hui
Notes de bas de page

1 IDC MarketScape : Worldwide AI Governance Platforms 2023 Vendor Assessment, IDC, 2023. 

2 The Need for Data Compliance in Today’s Cloud Era, Enterprise Strategy Group by TechTarget, avril 2023. (PDF, 867 Ko).

3 Top risk forecast, KPMG, 2024.