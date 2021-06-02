Lorsqu’il s’agit d’utiliser des données à l’échelle de l’entreprise, l’un des pièges les plus courants consiste à ne pas fournir de contexte significatif à tous les utilisateurs de données. La gestion de la taxonomie au sein d’une entreprise est essentielle afin de soutenir les opérations quotidiennes, car elle garantit des données précises et organisées qui seront comprises par toutes les personnes qui en ont besoin.
Une fois mise en œuvre, la taxonomie sert de base à la catégorisation du contenu et aux relations entre les données. Elle sert également de ligne directrice pour accélérer la localisation des données tout en établissant des politiques sur la manière dont elles peuvent être consultées ou réutilisées. La rapidité des mises à jour est essentielle pour permettre à l’entreprise de répondre immédiatement aux demandes de conformité ou aux nouvelles exigences critiques liées à ses activités.
Grâce à nos mises à jour améliorées des artefacts de gouvernance, les entreprises disposent de plus de moyens pour établir une taxonomie à l’échelle de l’entreprise via IBM Watson Knowledge Catalog pour IBM Cloud Pak for Data. La solution est également disponible sous forme de service entièrement géré via IBM Cloud Pak for Data as a Service.
Il peut sembler difficile de savoir par où commencer. Cependant, il suffit de se concentrer sur quatre activités essentielles et des pratiques éprouvées pour réussir la mise en œuvre.
Concentrez-vous sur un segment particulier de l’entreprise qui aura l’impact le plus significatif. Par exemple, si la conformité au RGPD et au CCPA est une priorité pour votre entreprise, commencez par établir des termes et classer les actifs liés aux données personnelles.
Pour faire face à ce scénario, les fonctionnalités de gestion des politiques d’IBM Watson Knowledge Catalog permettent de garantir la confidentialité des données et de définir des politiques décrivant la manière dont l’entreprise doit traiter les données sensibles. Après avoir créé les politiques, il est possible de créer des règles de protection des données qui seront automatiquement appliquées et empêcheront les utilisateurs non autorisés d’accéder aux données sensibles d’un catalogue. Il est également possible de créer des règles de gouvernance afin de fournir des descriptions des comportements ou actions requis pour mettre en œuvre une politique de gouvernance donnée. Les parties prenantes peuvent élaborer des politiques et des règles de gouvernance basées sur des domaines de gouvernance importants pour l’entreprise, tels que la sécurité de l’information, la confidentialité des données personnelles ou la conformité réglementaire.
Les classifications telles que les balises permettent de classer et de regrouper les actifs en fonction du niveau de sensibilité ou de confidentialité de votre entreprise. Il peut s’agir, par exemple, de données personnelles, d’informations personnelles sensibles ou d’actifs considérés comme confidentiels. Les entreprises peuvent également créer une règle de protection des données dans IBM Watson Knowledge Catalog afin d’empêcher les utilisateurs d’accéder à des actifs de données en fonction de leur classification.
En outre, les parties prenantes peuvent utiliser des catégories pour organiser les artefacts de gouvernance et les utilisateurs qui peuvent les consulter et les gérer. Les utilisateurs peuvent regrouper les artefacts de gouvernance en catégories afin de les rendre faciles à trouver, de contrôler leur visibilité et de les gérer. Les catégories peuvent également comporter des sous-catégories et être organisées de manière hiérarchique en fonction de leur signification et de leurs relations :
Incluez les classifications dans les conditions des règles de protection des données. Par exemple, vous pouvez créer une règle visant à refuser l’accès à certains utilisateurs si l’actif est classé comme confidentiel ou données personnelles.
Utilisez le langage de votre secteur sous la forme de modèles logiques ou de business intelligence pour renforcer les termes et les normes déjà en place.
La définition des termes facilite la compréhension dans l’ensemble de l’entreprise, ce qui permet aux utilisateurs de trouver rapidement ce dont ils ont besoin et de comprendre le contexte des tableaux et des colonnes. Par exemple, les entreprises peuvent également utiliser des termes pour simplifier la rédaction des règles de politique de données, en utilisant un seul terme au lieu de plusieurs noms de colonnes.
Les entreprises peuvent également utiliser des termes pour relier des colonnes, des actifs, des politiques et des règles avec le même type de données. Par exemple, les données de référence permettent aux clients de définir un ensemble standard de valeurs valides pour une recherche générale ou de définir des classes de données. Les entreprises peuvent également gérer les hiérarchies et les relations dans les données de référence, puis relier un jeu de données de référence à une ontologie métier.
Communiquez avec votre entreprise pour l’aider à comprendre les avantages d’avoir une source unique où toutes les informations sont stockées.
IBM Watson Knowledge Catalog comprend un catalogue de connaissances central qui sert de source d’information unique pour les ingénieurs de données, les intendants des données, les data scientists et les analystes, leur permettant d’accéder librement aux données de l’entreprise, auxquelles ils peuvent se fier et qu’ils peuvent utiliser en toute confiance. Les entreprises peuvent favoriser la découverte en libre-service et automatiser la prise de décision afin de faire évoluer l’activité en fournissant et en permettant l’accès à une vue de toutes les informations aux personnes qui en ont besoin.
La recherche globale dans IBM Watson Knowledge Catalog permet aux parties prenantes d’effectuer des recherches dans de nombreux catalogues, projets, actifs et autres artefacts de gouvernance créés au sein de l’entreprise auxquels elles sont autorisées à accéder. Les capacités de collaboration permettent aux unités commerciales, aux utilisateurs et aux propriétaires de données de laisser des commentaires, d’attribuer une note à un actif ou d’assigner une tâche à d’autres utilisateurs.
De plus, les capacités de profilage des données génèrent des métadonnées et des statistiques sur leur contenu et calculent des scores de qualité pour les actifs et les colonnes de données, permettant ainsi aux parties prenantes d’identifier et de comprendre les mesures à prendre en vue d’améliorer la qualité des données.
Définissez des étapes clés officielles que votre entreprise s’engagera à respecter pour la mise en œuvre des catégories, des conditions et de l’attribution correcte des rôles des utilisateurs, ainsi que du processus de catalogage des données.
Chaque entreprise a des besoins uniques où les parties prenantes internes et externes au service informatique doivent apporter une valeur ajoutée pour favoriser la réussite. Voici ce à quoi peuvent ressembler les flux de processus d’une entreprise :
