Webinaire : Pourquoi une Data Fabric est importante. Réponse aux trois questions les plus fréquemment posées.

Définition

Qu'est-ce que la gouvernance des données ?

La gouvernance des données est formée de politiques, de processus et d'une structure organisationnelle conçus pour soutenir la gestion des données de l'entreprise. La structure d'un programme de gouvernance des données permet d'assurer la compréhension, la sécurité et la confiance des parties prenantes à l'égard des données d'une organisation, en particulier à mesure que l'entreprise augmente de taille et accumule davantage de sources de données et d'actifs. Face à l'accumulation exponentielle de nouvelles données, les entreprises doivent définir des environnements de big data adaptés au stockage et à l'accès aux données, tels que les lacs de données, et concevoir une architecture de données pour gérer ces sources, les intégrer et les rendre disponibles dans toute l'entreprise. Cette intégration des données devient de plus en plus importante car elle a un impact sur les flux de travail et la prise de décision des différentes équipes.

La gouvernance des données est essentielle à la stratégie globale d'une organisation en matière de gestion des données et constitue un élément important d'une pratique DataOps complète. Elle permet de connaître les données dont vous disposez, où elles se trouvent et comment elles peuvent être utilisées. La gouvernance des données permet de jeter les bases d'un système de données prêt à l'emploi grâce à l'adhésion à des règles et à des processus définis pour accélérer les analyses et les stratégies de croissance.

Gouvernance des données et IBM

Une plateforme de gouvernance des données avec un catalogue de données intégré peut aider votre organisation à trouver, organiser, analyser, préparer et partager des données pour soutenir vos initiatives d'IA. Les solutions IBM de gouvernance des données permettent de s'assurer que le pipeline de données est prêt à aider à cataloguer, protéger et régir les données sensibles, ainsi qu'à retracer le lignage des données.

Pourquoi IBM

IBM® Watson Knowledge Catalog

Activez des données prêtes à l'emploi pour l'IA et l'analyse grâce à un catalogue de données reposant sur une gestion active des métadonnées et des politiques. Aidez vos collègues à trouver des données à organiser, classer, gérer, analyser et utiliser.

Plongez-vous dans la gouvernance des données

Avantages de la gouvernance des données

Découvrez comment les parties prenantes peuvent réussir au sein d'une organisation grâce à de solides pratiques de gouvernance des données qui permettent d'approfondir les connaissances tout en protégeant les données.

Sécurité des données et conformité améliorées

Les différents types de données peuvent être soumis à des autorisations ou des règles différentes, en particulier si ces données contiennent des informations personnelles identifiables (PII). La gouvernance des données peut contribuer à promouvoir la sécurité et la conformité en aidant les entreprises à réduire les risques d'infractions et de sanctions et en préservant la confiance des clients. Les pratiques de gouvernance des données permettent de savoir quelles informations personnelles existent et où, et elles peuvent automatiser la conformité grâce à la gestion des politiques et des métadonnées.

Les réglementations relatives à la protection de la vie privée ne font qu'augmenter avec la mise en place de réglementations globales, comme le RGPD européen (Règlement général sur la protection des données) qui assure la confidentialité des données des citoyens européens, en particulier sur Internet. Il existe en outre des réglementations plus spécifiques à certaines industries et régions, comme la loi sur la portabilité et la responsabilité des assurances maladie (HIPAA, Health Insurance Portability and Accountability Act), qui vise à protéger les patients et leurs informations de santé personnelles aux États-Unis. Avec l'augmentation du marketing basé sur les données et du travail à distance, les réglementations en matière de conformité ne cessent de se multiplier à mesure que les clients prennent conscience de leurs droits en matière de données et que les entreprises font face à des risques croissants pour leur réputation.

Amélioration de la qualité des données

La qualité des outils de veille économique dépend des données qui les alimentent. Si les données sous-jacentes n'ont pas été assainies et gérées correctement, la capacité des utilisateurs à prendre des décisions métier éclairées peut s'en trouver limitée. En outre, les données étant souvent tirées de diverses sources de données, le manque de cohérence peut entraver les analyses et d'autres projets essentiels. La gouvernance des données aide à relier les informations entre les systèmes afin d'identifier des relations pertinentes pour tirer le meilleur parti des données d'une organisation, et permet de s'assurer que des données cruciales ne sont pas oubliées.

Automatisation accélérée

Grâce à des pratiques et des outils permettant de maintenir l'organisation et la qualité des données, les équipes d'analyse peuvent commencer à innover et à automatiser des tâches et des processus spécifiques à l'aide d'algorithmes d'apprentissage automatique. Par exemple, les données sur les clients peuvent être introduites dans des modèles afin de déterminer la priorité à accorder aux clients potentiels dans le pipeline des ventes. En s'assurant que les données des clients sont exactes et protégées, la gouvernance des données permet aux équipes d'atteindre une croissance plus importante et de mieux cibler leurs ventes.

Rôles autour de la gouvernance des données

Plusieurs rôles sont essentiels à la pratique de la gouvernance des données. Trois rôles garantissent que les normes sont créées et maintenues dans le temps, afin de contribuer à la conformité des données, à la sécurité, à la qualité des données et aux objectifs d'automatisation.

Responsable des données

Les promoteurs de projet (directeurs des données, par exemple) signalent l'importance d'un programme de gouvernance des données pour l'organisation en établissant des priorités. Ces personnes sont indispensables à la mise en place d'un conseil interfonctionnel, dont les membres proviennent généralement de diverses unités commerciales pour représenter les besoins et les préoccupations de différentes disciplines ou différents portefeuilles de produits. Ce comité sert de forum pour communiquer les nouvelles initiatives de gouvernance des données et attribuer les responsabilités afin d'atteindre les délais et les résultats convenus.

Propriétaires des données

Ces personnes sont responsables de l'état des données. Elles sont généralement désignées par le type de données qu'elles gèrent, telles que les données financières ou relatives aux clients, et leur rôle consiste à maintenir l'exactitude et la facilité d'utilisation des données. Les tâches courantes comprennent l'identification et la résolution des problèmes liés aux données, l'approbation des définitions de données et la formulation de recommandations sur les données, notamment en rapport avec les exigences réglementaires.

Gestionnaires de données

Ces personnes, experts dans leurs domaines de données, influencent les politiques de données et soutiennent la gouvernance des données dans toute l'organisation. Comme ils peuvent communiquer l'importance de points de données spécifiques pour les processus opérationnels ou les décisions, ils peuvent également avoir un impact sur les structures des tables de bases de données afin de garantir que les données les plus appropriées sont présentées à des fins de rapport. Dans l'ensemble, cependant, le gestionnaire de données aide les parties prenantes à assurer leurs rôles dans le maintien de la qualité des données.

Structure de la gouvernance des données

Les pratiques de gouvernance des données se sont multipliées au fil des ans, notamment en raison de la multiplication des projets de transformation numérique. Pour que les initiatives de gouvernance des données obtiennent de bons résultats, plusieurs composantes sont nécessaires :

Normes en matière de données

Des dictionnaires de données, des taxonomies et des glossaires d'entreprises doivent être élaborés pour apporter des éclaircissements sur les définitions des activités et des données. Ces documents permettent de réduire les confusions dans les conversations, en particulier celles qui touchent les métriques et les rapports. Ils donnent également aux parties prenantes une visibilité sur l'architecture des données, ce qui permet aux équipes d'innover par elles-mêmes pour automatiser les processus de leur discipline.

Processus de traitement des données et structure organisationnelle

Les processus de gouvernance des données offrent une transparence aux utilisateurs finaux quant à la manière dont les données sont traitées au sein d'une organisation. Il peut s'agir de cadences de rafraîchissement des données, de restrictions sur les PII, de politiques réglementaires en matière de données ou même de quelque chose d'aussi simple que l'accès aux données. Ce type de documentation soutient également la structure organisationnelle en clarifiant les responsabilités des différents rôles en ce qui concerne la gestion et la maintenance des données.

Technologie

Différents outils de gouvernance des données, tels que les plateformes de gestion des métadonnées, soutiennent les processus et les normes qui entourent les données. Ces outils permettent de stocker et de sécuriser les informations relatives aux données gérées par une organisation. Il peut s'agir de documentation sur les définitions des activités, les journaux de données, les propriétaires de données, les informations relatives aux bases de données (telles que les noms des bases de données et des tables, l'emplacement des serveurs, les types de données, etc.). Ils peuvent également alimenter des outils d'analyse de données en libre-service, grâce auxquels les analystes peuvent interroger et visualiser différents ensembles de données pour des rapports ou des projets d'innovation.

Informations sur les ressources en matière de gouvernance des données

Témoignage

Vous pourriez également être intéressé par

IBM Cloud Pak for Data

Une plateforme de données multicloud flexible qui intègre vos données, qu'elles soient sur site ou dans le cloud, et contribue à les sécuriser à la source

IBM® DataStage®

Un outil d'intégration de données hautement évolutif, déployable sur site et dans n'importe quel cloud, utilisé pour concevoir, développer et exécuter des tâches qui déplacent et transforment les données

IBM InfoSphere Data Management

Gestion des données de référence pour des domaines uniques ou multiples, y compris les clients, les fournisseurs, les produits, les comptes, etc.

Automatiser intelligemment les données et l'IA

Découvrez la nouvelle génération d'IBM Cloud Pak® for Data.

Étapes suivantes