Conception de classes de données

Lorsque vous concevez une classe de données, vous devez déterminer s'il convient d'activer la mise en correspondance des données pour cette classe, à quels termes métier ou classifications elle doit être associée, et s'il faut définir des relations hiérarchiques entre les classes de données.

Autorisations requises
Pour créer une classe de données, vous devez disposer de l'autorisation suivante :
- Accéder aux documents relatifs à la gouvernance
Vous devez aussi avoir l'un des rôles de collaborateur de catégorie suivants dans la catégorie primaire de la classe de données :
  • Administrateur
  • Propriétaire
  • Éditeur
  • Rôle personnalisé avec le droit de créer des classes de données.

Pour plus d'informations, consultez la section « Autorisations requises ».

Propriétés des classes de données

Les classes de données ont ces propriétés standard qui sont similaires à d'autres artefacts de gouvernance.

Propriété ou comportement Prend en charge ? Explication
Doit avoir des noms uniques ? Oui Les noms de classe de données doivent être uniques dans une catégorie.
Description? Oui Facultatif. Inclure une description pour aider les utilisateurs à trouver cette classe de données.
Ajouter des relations à d'autres classes de données ? Oui Voir « Relations entre les classes de données ».
Ajouter des relations à d'autres types d'artefacts de gouvernance ? Oui Voir les relations avec d'autres types d'artefacts de gouvernance.
Ajouter une relation à un élément d'actif? Oui Voir les relations entre les ressources dans les catalogues.
Ajouter des propriétés personnalisées? Oui Voir « Propriétés personnalisées et relations » pour les artefacts de gouvernance et les ressources du catalogue.
Ajouter des relations personnalisées ? Oui Voir « Propriétés personnalisées et relations » pour les artefacts de gouvernance et les ressources du catalogue.
Organiser en catégories ? Oui La catégorie principale de l'artefact détermine qui peut afficher ou modifier l'artefact. Voir Catégories.
Importer à partir d'un fichier ? Oui Voir Importation d'artefacts de gouvernance.
Importer à partir d'un Knowledge Accelerator ? Non
Exporter dans un fichier ? Oui Voir « Exportation des artefacts de gouvernance ».
Géré par flux de travaux ? Oui Voir Flux de travaux.
Indiquez les dates de début et de fin effectives ? Oui Voir Dates d'effet.
Affecter un intendant ? Oui Voir « Stewards ».
Ajouter des balises en tant que propriétés ? Oui Voir Balises.
Affecter à un actif ? Non
Affecter à une colonne d'un actif de données ? Oui Une classe de données peut être ajoutée à une colonne d'un ensemble de données aussi bien manuellement qu'automatiquement.
Affectation automatisée à des actifs lors du profilage ou de l'enrichissement ? Oui Voir « Gestion de l'enrichissement des métadonnées »
Artefacts prédéfinis ? Oui Voir « Classes de données prédéfinies ».
Ajouter des modèles d'expressions régulières (regex)? Limité Certaines classes de données personnalisées utilisant des modèles d'expressions régulières peuvent ne pas parvenir à exécuter les flux de masquage ou ne pas permettre de prévisualiser des exemples de données masquées. Par exemple, vous ne pouvez pas utiliser de groupes de capture tels que ([abc]), mais vous pouvez utiliser des groupes sans capture (?:[abc]).

Relations entre les classes de données

Vous pouvez utiliser des hiérarchies pour établir des relations entre les classes de données.

Pour la classe de données actuellement traitée, vous pouvez définir les relations suivantes avec d'autres classes de données appartenant à la même catégorie :

  • Classe de données parent
  • Classes de données dépendantes

La classe de données parent est utilisée pour organiser la classe de données dans les relations parent/enfants. Il agit également comme une sorte de " préfiltre " si une méthode de couplage automatique de données est utilisée : si une classe de données parent possède une méthode de données correspondante, les méthodes de correspondance des données pour les classes de données enfant ne seront évaluées que si la méthode correspondante pour la classe de données parent a renvoyé une correspondance positive. Cela signifie que si vous définissez une classe de données parent, celle-ci a un impact sur les critères utilisés par le processus de classification des données pour déterminer si la classe de données doit être affectée ou non à une zone de données analysée.

Exemple :

  • Licence américaine - classe de données parent
  • Permis de conduire de l'État de Géorgie - catégorie de données « personne à charge »

Relations avec d'autres types d'artefacts de gouvernance

Vous pouvez ajouter les artefacts associés suivants :

  • Classifications
  • Termes métier

Les classifications et les termes métier que vous ajoutez constituent des suggestions de colonnes auxquelles la classe de données est affectée.

Lorsque vous établissez des liens entre des classes de données et des termes métier, ces termes métier sont automatiquement attribués aux actifs lorsque les classes de données associées leur sont attribuées lors de l'enrichissement des métadonnées. Par exemple, une classe de données « Adresse e-mail » peut être associée à un terme métier « Méthode de contact ». Lorsque le processus d'enrichissement des métadonnées détecte une colonne correspondant à la classe de données « Adresse e-mail », la classe de données « Adresse e-mail » et le terme métier « Méthode de contact » sont tous deux attribués. Voir « Attribution automatique des termes ».

Cependant, une classe de données n'est pas automatiquement attribuée lorsqu'un des termes métier qui lui est associé est attribué à une colonne.

Vous pouvez inclure des classes de données dans les règles de protection des données afin d'identifier le type de données à contrôler.

Utilisation des classes de données

Pour créer une classe de données :

  1. Cliquez sur « Nouvelle classe de données » pour créer une nouvelle classe de données et renseignez les informations requises. Plusieurs classes de données peuvent avoir le même nom, à condition de se trouver dans des catégories différentes.
  2. Cliquez sur Enregistrer comme brouillon. La classe de données, qui était jusqu'à présent à l'état de projet, est désormais prête à être peaufinée, comme indiqué dans la section suivante.
  3. Lorsque vous êtes prêt, cliquez sur « Publier » ou « Envoyer pour validation », selon la configuration de votre flux de travail.

Pour modifier une classe de données existante :

  1. Ouvrez une classe de données et cliquez sur icône « a + » ou sur l'icône d'édition à côté du champ que vous souhaitez changer.
  2. Cliquez sur Enregistrer comme brouillon. La classe de données, qui était encore à l'état de brouillon, est désormais prête à être peaufinée.
  3. Cliquez sur « Publier » ou « Envoyer pour validation », selon la configuration de votre flux de travail.

Vous pouvez fournir les informations suivantes pour définir votre classe de données :

  • Ajoutez un exemple pour la classe de données dans la propriété Exemple. Si vous spécifiez une classe de données nommée City-New, l'exemple peut être London.

  • Affectez cette classe de données à une catégorie principale et éventuellement à des catégories secondaires.

  • Modifiez les propriétés personnalisées qui fournissent des informations supplémentaires dans la section « Détails ».
    Les propriétés personnalisées peuvent être créées comme décrit dans la section « Propriétés personnalisées et relations pour les artefacts de gouvernance et les ressources du catalogue ». Si des types de relation personnalisés sont définis, ils sont également affichés ici. Les relations inverses apparaissent dans l'autre artefact après la publication de celui où vous avez créé la relation.

  • Utilisez la correspondance de données pour organiser les colonnes de base de données et les zones de fichier de données à des fins de révision et d'analyse de colonne ultérieure. Par exemple, des colonnes de base de données avec des données numériques comprennent en principe des nombres avec une plage de valeurs valides.

  • Activer ou désactiver l'attribution automatique d'une classe de données. Pour activer une classe de données, vous devez activer la mise en correspondance des données. Une classe de données pour laquelle la méthode de mise en correspondance des données est activée est considérée comme une classe de données active, tandis qu'une classe de données pour laquelle cette méthode est désactivée est considérée comme une classe de données inactive.

  • Choisissez la priorité de correspondance d'une classe de données afin de déterminer quelle classe de données candidate doit devenir la classe de données déduite d'un champ. Seules les classes de données dont le niveau de confiance est supérieur au seuil sont prises en compte. Voir « Priorité ».

  • Spécifiez des artefacts associés. Vous ne pouvez sélectionner que les termes commerciaux et les classifications qui ont été publiés. Les classifications et termes métier que vous ajoutez ici sont des suggestions pour les colonnes auxquelles la classe de données est affectée. Vous pouvez attribuer une ou plusieurs classifications au niveau d'une colonne.

  • Ajoutez d'autres contenus associés.

Selon les dates d'entrée en vigueur définies pour la classe de données, celle-ci est active ou inactive. Les classes de données actives peuvent être utilisées pour définir des actions, par exemple pour classer automatiquement des données. Les classes de données inactives ne jouent aucun rôle tant qu'elles ne sont pas activées.

Vous ne pouvez pas utiliser des brouillons de classes de données pour spécifier une mise en correspondance de données ou pour toute autre action. Par défaut, la classe de données est publiée si vous l'envoyez pour approbation.

Vous pouvez également créer des classes de données supplémentaires à partir de l'un des ensembles de données de référence disponibles sur Knowledge Accelerators en utilisant la méthode de mise en correspondance des données. Voir les ensembles de données de référence sur Knowledge Accelerators.

En savoir plus