Qu’est-ce que la gouvernance des données ?

Qu’est-ce que la gouvernance des données ?

La gouvernance des données est une discipline de gestion des données qui met l’accent sur la qualité, la sécurité et la disponibilité des données de l’entreprise. Afin de garantir l’intégrité et la sécurité des données, la gouvernance définit et met en œuvre des politiques, des normes et des procédures pour la collecte, la possession, le stockage, le traitement et l’utilisation des données.

L’objectif de la gouvernance des données est de garantir des données sûres, de qualité et facilement accessibles, à des fins de découverte de données, de business intelligence et d’IA. À l’instar d’un centre de contrôle aérien, la gouvernance des données permet de garantir que les données sont vérifiées et qu’elles circulent dans des pipelines sécurisés vers des points de terminaison et des utilisateurs de confiance.

L’intelligence artificielle (IA), le big data et la transformation numérique sont les principaux catalyseurs des programmes de gouvernance des données. Face au volume croissant de données provenant de nouvelles sources comme l’Internet des objets (IdO), les organisations reconsidèrent leurs pratiques de gestion des données et leurs principes de gouvernance des données. L’adoption des bonnes pratiques et des bons principes peut aider les entreprises à intensifier leurs efforts en matière de business intelligence (BI) et à prendre des décisions plus avisées.

Les développements rapides de l’IA d’entreprise ont également exigé de nouvelles stratégies de gouvernance des données. Les programmes de gouvernance doivent de plus en plus prendre en compte les données structurées et non structurées qui servent d’entrées ou de sorties aux systèmes RAG, aux bases de données vectorielles et aux agents d’IA.

Les programmes robustes de gouvernance des données permettent aux entreprises de protéger et de gérer de grandes quantités de données. En effet, elles sont en mesure d’améliorer la qualité des données, de réduire les silos de données, de mettre en place des politiques de conformité et de sécurité, et de contrôler l’accès aux données de manière appropriée.

Gouvernance des données et gestion des données

La gouvernance des données est une branche de la gestion des données qui consiste à collecter, à traiter et à utiliser les données de manière sûre et efficace, afin de favoriser une prise de décision stratégique et améliorer les résultats de l’entreprise.

Outre la gouvernance des données, la gestion des données englobe d’autres aspects du cycle de vie des données tels que le traitement, le stockage et la sécurité. Ces différents aspects du processus de gestion des données sont intimement liés.

Parce que ces autres aspects de la gestion des données ont un impact sur leur gouvernance, les différentes équipes doivent collaborer pour élaborer et suivre une stratégie de gouvernance des données.

Supposons que l’équipe chargée de la gouvernance des données identifie les points communs de plusieurs jeux de données disparates. Pour intégrer ces données, elle doit normalement collaborer avec une équipe de gestion des données afin de définir le modèle de données, ainsi que leur architecture. Différentes stratégies peuvent être appropriées pour les données cloud par rapport aux données hébergées sur site.

Un autre exemple est celui de l’accès aux données. Ici, une équipe de gouvernance des données définit des politiques pour encadrer l’accès à certains types de données, comme les données personnelles. Ensuite, l’équipe de gestion des données se charge de fournir cet accès directement, ou de créer un mécanisme à cet effet, souvent le contrôle d’accès basé sur les rôles (RBAC). Il est d’autant plus important d’obtenir des autorisations d’accès correctes à une époque où, de plus en plus, c’est un agent IA plutôt qu’un employé humain qui accède aux données.

Cadres de gouvernance des données

Le cadre de gouvernance des données détaille les structures et les processus mis en place par l’entreprise pour gérer les actifs de données critiques. Il définit la propriété des données, ainsi que les responsabilités associées, et précise la manière dont les données doivent être traitées pour garantir leur qualité, leur sécurité et leur conformité.

Il n’existe pas de cadre des exigences unique, car les cadres des exigences sont généralement des feuilles de route qui reflètent les besoins de chaque organisation (systèmes de données, sources de données, protocoles des secteurs et réglementations du gouvernement). Et les anciens cadres des exigences peuvent rapidement devenir obsolètes. Les cadres des exigences doivent de plus en plus tenir compte de l’IA, des systèmes multicloud et des environnements de données qui évoluent plus rapidement.

Les cadres de gouvernance des données portent généralement sur les aspects suivants :

  • Objectifs, rôles et tâches du programme
  • Normes, politiques et processus en matière de données
  • Procédures d’audit
  • Outils de gouvernance des données

Objectifs, rôles et tâches du programme

Les programmes de gouvernance des données définissent généralement un objectif ou un ensemble d’objectifs. Il peut s’agir d’améliorer la qualité des données, de renforcer la conformité ou d’axer la prise de décision sur les données. Ils établissent également des indicateurs pour mesurer les progrès vers ces objectifs. Les principaux indicateurs de gouvernance sont les suivants :

  • Réduire le risque d’erreur et la redondance des données.

  • Améliorer l’efficacité et accélérer la mise sur le marché pour réduire les coûts.

  • Cohérence et exhaustivité des données.

  • Niveau de littératie des données et respect des processus par les salariés.

Les programmes de gouvernance définissent également les rôles et les responsabilités des acteurs impliqués : comité de pilotage, propriétaires de données, intendants des données et parties prenantes.

  • Les membres du comité de pilotage, ou conseil de gouvernance, supervisent la stratégie de gouvernance des données, ainsi que l’orientation générale du cadre. Ce comité comprend souvent des cadres supérieurs, comme les cadres de direction ou les vice-présidents, qui supervisent les différents services.

  • Les propriétaires de données supervisent les domaines correspondants au sein des unités commerciales. Chargées de garantir l’exactitude, la qualité et la cohérence des données, ils proposent des solutions en matière de gouvernance des données, de politiques relatives aux données et d’exigences réglementaires.

  • Les intendants des données gèrent au quotidien des domaines bien spécifiques.

  • Les parties prenantes et les équipes commerciales sont les consommateurs de données de l’entreprise.

Normes, politiques et processus en matière de données

Les cadres de gouvernance définissent les paramètres relatifs aux données à gérer, ainsi que les résultats escomptés. Il s’agit notamment de définir des lignes directrices pour les formats de données, les modèles de données, le master data management (MDM), les métadonnées, les conventions de dénomination, etc. 

Souvent, les cadres de gouvernance cartographient les flux de données et définissent la manière dont les données sont collectées, stockées, dupliquées, déplacées et archivées. Ils peuvent également définir le matériel, les logiciels et les services employés pour assurer la gouvernance et soutenir l’architecture de données de l’entreprise.

Certains cadres de gouvernance définissent les scopes de données, c’est-à-dire les paramètres d’accès aux différents actifs de données tels que les données de référence, les métadonnées et les données historiques. Cela permet de garantir que les utilisateurs et les applications ont accès uniquement aux données dont ils ont besoin, et que seules les personnes autorisées peuvent accéder aux données.

Procédures d’audit

Les cadres de gouvernance décrivent les procédures de test, d’audit et de tenue des registres afin de garantir la transparence et l’explicabilité du programme de gouvernance.

Les audits réguliers ou continus permettent de vérifier en temps réel que les utilisateurs respectent le cadre de gouvernance des données. Les audits permettent également d’identifier la manière dont le programme de gouvernance doit évoluer pour tenir compte des nouvelles données, des nouveaux processus ou encore des nouvelles technologies.

Enfin, les audits permettent aux entreprises d’assurer et de prouver leur conformité réglementaire.

Outils de gouvernance des données

La technologie est essentielle pour assurer une gouvernance efficace des données. Les outils de gouvernance des données proposés aux entreprises vont des plateformes complètes aux solutions ponctuelles spécialisées. Le choix des outils dépend de l’architecture de données et du cadre de gouvernance de chaque entreprise.

Les fonctionnalités courantes des solutions de gouvernance des données sont les suivantes :

  • Découverte et classification automatiques des données.

  • Règles de protection des données et contrôles d’accès basés sur les rôles.

  • Respect des exigences en matière de confidentialité et de conformité.

  • Automatisation de la gestion des métadonnées, du catalogage des données et de leur traçabilité.

  • Prise en charge d’un glossaire métier.

Les solutions de gouvernance des données gèrent différents formats de données. Certaines proposent des fonctionnalités de visualisation pour améliorer la compréhension des jeux de données et des relations complexes, et faciliter l’identification des tendances, des données aberrantes et des aspects qui nécessitent une attention particulière. De plus en plus, les solutions de gouvernance des données peuvent aider à gouverner les données utilisées dans les pipelines d’IA.

AI Academy

La gestion des données est-elle le secret de l’IA générative ?

Découvrez pourquoi des données de haute qualité sont essentielles pour une utilisation réussie de l’IA générative.

Avantages de la gouvernance des données

Un cadre de gouvernance des données efficace offre de nombreux avantages aux entreprises :

  • Tirer le meilleur parti des données
  • Favoriser l’innovation et l’efficacité
  • Disposer d’une source d’information unique
  • Garantir la confidentialité, la sécurité et la conformité des données
  • Sécuriser l’utilisation des données au sein des projets d’IA
  • Améliorer la précision de l’analyse de données

Tirer le meilleur parti des données

Les décisions axées sur des données erronées ne peuvent pas être efficaces. La gouvernance des données permet de garantir l’intégrité, l’exactitude, l’exhaustivité et la cohérence des données, et ce grâce à un cadre favorisant une intendance et une gestion des données de bout en bout efficaces.

Si leurs données sont fiables, les entreprises sont en mesure de découvrir de nouvelles opportunités, de mieux comprendre leurs clients, ainsi que leurs workflows, et d’optimiser leur performance globale.

L’absence de gouvernance des données peut entraîner des erreurs dans les indicateurs de performance, ce qui oriente l’entreprise dans la mauvaise direction. Par ailleurs, les outils de gouvernance des données peuvent aider à corriger les inexactitudes avant qu’elles n’influencent la stratégie de l’entreprise.

Par exemple, les outils de traçabilité des données permettent aux propriétaires de ces dernières d’assurer leur suivi tout au long de leur cycle de vie, notamment les transformations subies lors des processus d’extraction, de transformation et de chargement (ETL) ou d’extraction, de chargement et de transformation (ELT). Cette fonctionnalité permet aux organisations d’identifier et de remédier aux causes racines des erreurs de données.

Favoriser l’innovation et l’efficacité

Lorsque l’accès aux données est restreint au sein de l’entreprise, cela peut limiter l’innovation, créer une dépendance à l’égard des experts métier (SME) et ralentir les processus de l’entreprise.

Les programmes de gouvernance des données autorisent l’accès aux données de manière appropriée, permettant à chaque service ou individu d’accéder uniquement aux données dont il a besoin. Cela permet aux équipes interfonctionnelles de collaborer plus étroitement et plus efficacement, tout en assurant la sécurité des données. 

Disposer d’une source d’information unique

Un système de données gouvernées efficacement fournit une source d’information unique au sein de l’entreprise. La prise de décision est améliorée lorsque toutes les parties utilisent les mêmes jeux de données.

Regrouper les données et les métadonnées dans un catalogue de données unique permet d’éviter la confusion et de réduire les inefficacités. Cette documentation sert alors de base aux solutions en libre-service qui garantissent la cohérence des données et leur accessibilité au sein de l’entreprise.

Garantir la confidentialité, la sécurité et la conformité des données

Les politiques de gouvernance des données comprennent généralement des mesures facilitant la mise en conformité avec les réglementations portant sur la protection des données sensibles, comme le Règlement général sur la protection des données(RGPD) de l’UE et la loi américaine HIPAA (Health Insurance Portability and Accountability Act), et avec les normes sectorielles telles que la norme de sécurité des données de l’industrie des cartes de paiement (PCI DSS). Ces dernières années ont également vu l’avènement d’une réglementation axée sur l’IA, avec des composants de données. Citons comme exemples la loi sur l’IA de l’UE, la loi sur les données de l’UE et le règlement DORA. Le non-respect de ces exigences réglementaires peut faire l’objet d’une amende salée et susciter le mécontentement du grand public.

Les outils de gouvernance des données aident les entreprises à mettre en place des garde-fous pour prévenir les violations de données, les fuites et l’utilisation abusive. Les cadres de gouvernance permettent de créer des systèmes de données clairs, explicables, équitables et inclusifs, afin de préserver la confidentialité, de renforcer la sécurité, de favoriser la fidélisation et de gagner la confiance des clients.

Sécuriser l’utilisation des données au sein des projets d’IA

Dans une enquête d’IDC, seules 45,3 % des personnes interrogées ont déclaré avoir des règles et des processus pour appliquer les principes d’IA responsable afin de se protéger contre les violations de sécurité, les problèmes de responsabilité et les risques réglementaires.1

La gouvernance des données implique de bien connaître l’origine, le degré de sensibilité et le cycle de vie de chaque donnée utilisée par l’entreprise. C’est la base de toute pratique de gouvernance de l’IA, essentielle pour atténuer les divers risques pesant sur l’entreprise.

La gouvernance des données permet aux entreprises d’appuyer leurs projets d’IA et de ML sur des données de qualité, tout en assurant la protection de ses dernières et en se conformant aux règles et réglementations en vigueur. Par exemple, les outils de gouvernance permettent de garantir que les données personnelles sensibles n’alimentent que les systèmes d’IA autorisés à les exploiter.

Améliorer la précision de l’analyse de données

Pour réussir ses projets d’analytique et de science des données, il est indispensable de disposer de données de qualité. Une bonne gouvernance des données permet de mener à bien des projets tels que la production de rapports de Business Intelligence, ou des projets plus complexes comme ceux de machine learning (ML) prédictif.

Par exemple, le profilage des données, qui consiste à examiner et à nettoyer les données pour mieux appréhender leur structure, permet de mieux comprendre la relation entre les différents jeux de données et sources.

Les défis de la gouvernance des données

La mise en œuvre des stratégies de gouvernance des données peut poser de nombreux défis. En voici quelques-uns :

  • Absence d’un accompagnement approprié
  • Une architecture de données incohérente
  • Visibilité et contrôle des données
  • Hausse de la demande d’accès
  • Exigences en matière de données d’IA

Absence d’un accompagnement approprié

Pour être efficaces, les programmes de gouvernance des données nécessitent généralement un accompagnement à deux niveaux : les dirigeants et les contributeurs individuels. Le directeur des données (CDO) et les intendants des données jouent un rôle essentiel dans la communication et la priorisation de la gouvernance des données au sein de l’entreprise.

Le CDO supervise et responsabilise les équipes chargées des données pour garantir l’adoption des politiques de gouvernance des données. Les intendants des données contribuent à faire connaître ces politiques auprès des producteurs et des consommateurs de données, afin de renforcer la conformité au sein de l’entreprise. 

En l’absence d’un accompagnement approprié, les utilisateurs de données risquent d’ignorer les politiques de gouvernance ou de ne pas s’en soucier, Cette situation peut entraîner une non-conformité, une mauvaise intégrité des données et une compromission de la sécurité des données.

Une architecture de données incohérente

Sans les outils et l’architecture de données adaptés, les entreprises peuvent peiner à déployer un programme de gouvernance des données efficace.

Par exemple, les équipes peuvent découvrir des données redondantes au sein des différents services. Pour garantir une gouvernance efficace, les data architects doivent développer des modèles et des architectures de données appropriés pour fusionner et intégrer les données dans les systèmes de stockage.

Les équipes peuvent également adopter un catalogue de données pour dresser l’inventaire des actifs de données de l’entreprise. S’il existe déjà, elles devront élaborer un processus de gestion des métadonnées pour garantir que les données sous-jacentes sont pertinentes et à jour.

Visibilité et contrôle des données

La gouvernance des données, en particulier dans les environnements hybrides et multicloud, implique souvent des données stockées dans différents formats et emplacement, auprès de plusieurs fournisseurs. En outre, les données peuvent être regroupées dans différents types de magasins de données comme les data lakes, les data lakehouses et les entrepôts de données.

Le Shadow IT peut compliquer davantage le processus. Selon une étude de TechTarget, le deuxième problème de sécurité des données le plus fréquemment signalé concerne les salariés qui utilisent des applications et des services cloud sans l’approbation du service informatique.2

Cette distribution des données peut rendre difficiles le suivi et la surveillance des flux de données et de leur utilisation. La gouvernance des données implique une bonne compréhension des sources de données, des destinations, des transformations, des dépendances, de la propriété, des droits d’accès et des responsabilités.

L’application de politiques de gouvernance des données dans plusieurs environnements nécessite une coordination entre les différentes parties prenantes : propriétaires des données, intendants des données, consommateurs de données et régulateurs des données.

Hausse de la demande d’accès

L’essor de l’analytique en libre-service et de la Business Intelligence pose de nouveaux défis en matière de gouvernance des données.

Les demandes d’accès provenant d’un plus grand nombre d’utilisateurs arrivent plus rapidement qu’auparavant, mais les équipes de gouvernance doivent trouver un équilibre entre la rapidité et l’accessibilité et les préoccupations en matière de confidentialité et de sécurité. En outre, les systèmes et les procédures de transmission de données en continu doivent être réglés avec précision pour éviter les fuites de données.

Exigences en matière de données d’IA

Lorsqu’il s’agit de fournir les données qui alimentent l’entraînement et l’exploitation de l’IA, peu d’outils de stockage et de gouvernance sont à la hauteur.

Après tout, l’IA est intrinsèquement plus complexe que les processus et les capacités standard pilotés par l’informatique, ce qui souligne l’importance d’une gouvernance des données active et éclairée. Selon un rapport publié par KPMG, le déficit de gouvernance de l’IA est l’un des principaux risques qui menacent actuellement les entreprises.3 Par exemple, sans garde-fous adaptés, l’IA peut exposer par inadvertance des données personnelles sensibles ou le secret d’affaires des entreprises. De telles expositions peuvent être d’autant plus coûteuses à une époque de réglementation croissante liée à l’IA (comme la loi européenne sur l’IA, adoptée en juin 2024).

Pour réduire les risques et la complexité de l’IA, les entreprises peuvent associer fonctionnalités de stockage des données optimisées par l’IA et programmes de gouvernance des données conçus pour répondre aux défis de l’IA.

Bonnes pratiques de gouvernance des données

Planifier et élaborer un cadre de gouvernance des données demande du temps et des efforts aux différentes parties prenantes et équipes. Voici quelques exemples de pratiques que les entreprises suivent pour bien mettre en œuvre leur programme de gouvernance :

  • Automatiser pour gagner en efficacité
  • Concilier praticité et sécurité des données
  • Créer un catalogue de données
  • Utiliser les modèles de maturité
  • Surveiller et améliorer en permanence

Automatiser pour gagner en efficacité

L’automatisation de certaines parties du processus de gouvernance des données peut contribuer à améliorer l’efficacité et à réduire les erreurs. Les outils de gouvernance et de gestion des données peuvent aider à automatiser les tâches de routine telles que :

  • Assurer la traçabilité des données pour faciliter la visualisation du flux de données à travers les systèmes sans avoir recours à des solutions complexes codées manuellement.

  • Définir des politiques pour attribuer des balises de métadonnées aux différents éléments de données tels que les colonnes ou les tables, afin de les identifier comme étant des informations sensibles.

  • La génération de journaux d’audit pour enregistrer les interactions de données (le but étant de comprendre comment les employés utilisent les données).

La classification des données se fait selon des categories prédéfinies telles que les données personnelles, les données financières, la propriété intellectuelle ou encore les informations confidentielles.

Concilier praticité et sécurité des données

Tout cadre de gouvernance des données repose sur une sécurité des données et des contrôles d’accès efficaces. En même temps, les entreprises tiennent à ce que les personnes autorisées à consulter et à utiliser les différents jeux de données puissent y accéder de la manière la plus fluide qui soit. Si les informations en libre-service ne sont pas facilement accessibles, la collaboration et la compréhension sont entravées.

Créer un catalogue de données

Nombreuses sont les entreprises qui peinent à gérer leurs données faute de visibilité. Un catalogue de données central comme source d’information unique permet de mener à bien les projets d’intégration et de gouvernance des données.

Un rapport publié par Gartner révèle une hausse de la demande de catalogues de données en raison de la difficulté qu’ont les entreprises à trouver, à répertorier et à analyser les actifs de données répartis et diversifiés. Un catalogue de données efficaces facilite la localisation et la classification des informations à l’échelle, permettant une meilleure application des politiques de gouvernance des données.

Utiliser les modèles de maturité

Bon nombre d’entreprises trouvent utile d’élaborer une feuille de route de gouvernance claire. Les modèles de maturité s’avèrent très efficaces à cet effet.

Le modèle de maturité de la gouvernance des données est un outil qui permet aux entreprises d’évaluer l’état actuel de leur programme de gouvernance, de définir leurs objectifs et de suivre les progrès au fil du temps.

Surveiller et améliorer en permanence

Les entreprises peuvent mettre en place des mécanismes d’évaluation et de reporting réguliers pour surveiller les données et les indicateurs de gouvernance au fil du temps. Ces évaluations permettent d’identifier les problèmes et d’améliorer les processus de gouvernance.

Pour garantir la pertinence et l’efficacité du cadre, il convient de le réviser régulièrement en fonction du feedback reçu, des nouvelles réglementations ou encore des changements de stratégie de l’entreprise.

De plus, les évaluations favorisent une culture qui valorise les données comme étant des ressources stratégiques, soutenant une intelligence d’affaires efficace et l’utilisation quotidienne des données au sein de l’organisation.

Auteurs

Jim Holdsworth

Staff Writer

IBM Think

Matthew Kosinski

Staff Editor

IBM Think

David Zax

Staff Writer

IBM Think

Rendu 3D d'une spirale de plusieurs icônes alignées comme un appareil photo, un bouton de volume et un clipboard
Solutions connexes
IBM watsonx.governance

Déployez une IA de confiance grâce à une surveillance continue des modèles, une gestion proactive des risques et une gouvernance rigoureuse tout au long du cycle de vie de l’IA.

Découvrir watsonx.governance
Solutions de gouvernance des données

Reprenez le contrôle de vos données grâce à des outils de gouvernance qui améliorent la qualité, garantissent la conformité et favorisent des analyses et des initiatives d’IA fiables.

Découvrir les solutions de gouvernance des données
Conseil en gouvernance de l’IA

Mettez en place des pratiques d’IA responsable avec l’appui d’experts pour maîtriser les risques, répondre aux exigences réglementaires et déployer une IA de confiance à grande échelle.

Découvrir le conseil en gouvernance de l’IA
Passez à l’étape suivante

Dirigez, gérez et surveillez votre IA à l’aide d’un portefeuille unifié afin de parvenir plus rapidement à des résultats responsables, transparents et explicables.

  1. Découvrir watsonx.governance
  2. Découvrir les solutions de gouvernance de l’IA
Notes de bas de page

1 IDC MarketScape: Worldwide AI Governance Platforms 2023 Vendor Assessment. IDC.  2023. 

2 The Need for Data Compliance in Today’s Cloud Era, Enterprise Strategy Group de TechTarget, abril 2023. (PDF).

3 Top risk forecast, KPMG, 2024.