Conception d'ensembles de données de référence
Lorsque vous concevez un ensemble de données de référence, vous devez déterminer le format des valeurs à utiliser, les paires code-valeur qui composent l'ensemble, ainsi que s'il doit être lié à d'autres ensembles existants. Vous pouvez importer les ensembles de données de référence existants et les modifier selon vos besoins, ou créer manuellement un nouvel ensemble de données de référence.
Les données de référence servent à classer les autres données au sein des applications d'entreprise et des bases de données. Les données de référence peuvent être normalisées par des organismes tels que l'ISO. Les données de référence peuvent être hiérarchisées. Il peut exister plusieurs ensembles de données de référence pour un même domaine; dans ce cas, il est possible de définir des correspondances entre les valeurs de ces données de référence.
Un ensemble de données de référence se compose d'un certain nombre de valeurs de données de référence, chacune d'entre elles devant au moins comporter un code et une valeur définis.
Vous pouvez soit créer un nouvel ensemble de données de référence via l'interface utilisateur, soit importer ses propriétés à partir d'un fichier « CSV ». Il en va de même pour les valeurs des données de référence : elles peuvent être saisies manuellement ou importées à partir du fichier « CSV ». Veuillez noter que les fichiers « CSV » destinés aux ensembles de données de référence et à celles-ci diffèrent.
Vous pouvez utiliser l'une des méthodes suivantes pour importer des ensembles de données de référence :
- Importez un ou plusieurs ensembles de données de référence à partir d'un fichier ZIP précédemment exporté à l'aide d'une requête API. Le fichier ZIP contient un fichier « CSV » contenant les propriétés définissant un ou plusieurs ensembles de données de référence, ainsi qu'un fichier « CSV » pour chaque ensemble de données de référence, répertoriant les valeurs des données de référence.
- Importer les informations relatives à un ensemble de données de référence à partir d'un fichier « CSV » via l'interface utilisateur ou une requête API. Il est possible d'importer plusieurs ensembles de données de référence dans un seul fichier. Cette méthode ne comprend pas les valeurs de référence; celles-ci doivent être importées séparément.
- Importez les valeurs des données de référence à partir d'un fichier « CSV » pour un ensemble spécifique, via l'interface utilisateur ou une requête API.
Pour en savoir plus sur ces méthodes d'importation et sur leurs différences, consultez la section Méthodes d'importation des artefacts de gouvernance.
Vous pouvez également utiliser l'un des ensembles de données de référence prédéfinis. De plus, chaque Knowledge Accelerator met à votre disposition des centaines d'ensembles de données de référence spécifiques à un secteur d'activité donné. Voir les ensembles de données de référence sur Knowledge Accelerators.
Un ensemble de données de référence peut contenir jusqu'à 5 000 valeurs.
- Propriétés des ensembles de données de référence
- Propriétés des valeurs des données de référence
- Relations avec d'autres types d'artefacts de gouvernance
- Liens avec d'autres ensembles de données de référence
- Utilisation d'ensembles de données de référence
Propriétés des ensembles de données de référence
Les ensembles de données de référence présentent ces propriétés standard, qui sont similaires à celles d'autres artefacts de gouvernance.
| Propriété ou comportement | Prend en charge ? | Explication |
|---|---|---|
| Doit avoir des noms uniques ? | Oui | Les noms des ensembles de données de référence doivent être uniques au sein d'une même catégorie. |
| Description? | Oui | Facultatif. Ajoutez une description pour aider les utilisateurs à trouver cet ensemble de données de référence. |
| Ajouter des relations avec d'autres ensembles de données de référence? | Oui | Voir « Relations avec d'autres ensembles de données de référence ». |
| Ajouter des relations à d'autres types d'artefacts de gouvernance ? | Oui | Voir les relations avec d'autres types d'artefacts de gouvernance. |
| Ajouter une relation à un élément d'actif? | Oui | Voir les relations entre les ressources dans les catalogues. |
| Ajouter des attributs personnalisés ? | Oui | Voir Attributs personnalisés et relations |
| Ajouter des relations personnalisées ? | Oui | Voir Attributs personnalisés et relations |
| Organiser en catégories ? | Oui | La catégorie principale de l'artefact détermine qui peut afficher ou modifier l'artefact. Voir Catégories. |
| Importer à partir d'un fichier ? | Oui | Voir Importation d'artefacts de gouvernance. |
| Importer à partir d'un Knowledge Accelerator ? | Oui | |
| Exporter dans un fichier ? | Oui | Voir « Exportation des artefacts de gouvernance ». |
| Géré par flux de travaux ? | Oui | Voir Flux de travaux. |
| Indiquez les dates de début et de fin effectives ? | Oui | Voir Dates d'effet. |
| Affecter un intendant ? | Oui | Voir « Stewards ». |
| Ajouter des balises en tant que propriétés ? | Oui | Voir Balises. |
| Artefacts prédéfinis ? | Oui | Emplacements physiques, emplacements souverains. Voir les ensembles de données de référence prédéfinis |
Lorsque vous créez un nouvel ensemble de données de référence, vous devez choisir le type à utiliser. Le type que vous choisissez détermine le format de la colonne de valeurs pour les données de référence :
- Texte
- Il peut s'agir d'une chaîne de caractères ou d'une chaîne multiligne.
- Nombre
- Ne prend pas en charge les valeurs booléennes, binaires ou hexadécimales.
- Date
- Format ISO de la date et de l'heure.
Propriétés des valeurs des données de référence
Un ensemble de données de référence comprend un certain nombre de valeurs de données de référence. Ces valeurs comprennent au moins les colonnes suivantes :
- code
- Une chaîne de caractères pouvant comporter jusqu'à 255 caractères. La colonne « code » est toujours de type Texte.
- Valeur
- Le format de la valeur est déterminé par le type de l'ensemble de données de référence : Texte, Nombre, Date.
- Description
- Ces valeurs sont facultatives.
- Parent
- Ces valeurs sont facultatives. La relation parent pointe vers une autre valeur de données de référence dans le même ensemble. En indiquant l'élément parent, vous pouvez créer une arborescence hiérarchique des valeurs des données de référence.
Code sensible à la casse
Le code sensible à la casse a été introduit dans la version 4.8.3. Pour tous les ensembles de données de référence créés après la mise à niveau vers l' 4.8.3, la colonne « code » est sensible à la casse. Lorsque vous ajoutez des valeurs à un nouvel ensemble de données de référence, le code est enregistré exactement tel que vous le saisissez. Les codes suivants sont considérés comme trois entrées distinctes :
- États-Unis
- US
- FR
Auparavant, tous les codes étaient automatiquement convertis en majuscules lors de l'enregistrement, par exemple :
- « us » a été enregistré sous le nom « US »
- 1pl a été enregistré sous le nom « 1PL »
Veuillez noter que tous les ensembles de données de référence créés avant l'introduction de cette modification restent insensibles à la casse, et que toute nouvelle valeur qui y sera ajoutée sera enregistrée en majuscules. Ces ensembles de données de référence sont signalés par une balise « Insensible à la casse » dans l'interface utilisateur.
Colonnes personnalisées
Vous devrez peut-être recueillir des informations supplémentaires relatives au code, telles que les traductions de la valeur dans différentes langues ou d'autres informations sur les attributs utiles pour répondre à vos besoins. Par exemple, il se peut que vous disposiez d'un jeu de données de référence de codes pays et que vous souhaitiez capturer d'autres attributs tels que le premier ministre du pays, la langue ou des variantes du nom. À cette fin, vous pouvez ajouter des colonnes personnalisées de différentes manières via l'interface utilisateur :
- Vous pouvez définir manuellement des colonnes personnalisées lors de la création d'un nouvel ensemble de données de référence. Veuillez noter qu'une fois l'ensemble de données de référence créé, il n'est plus possible de modifier ou d'ajouter manuellement des colonnes personnalisées.
- Vous pouvez utiliser la fonction d'importation de fichiers d' CSV s pour créer un nouvel ensemble de données de référence et mapper les colonnes du fichier à de nouvelles colonnes personnalisées.
- Vous pouvez importer ou réimporter des valeurs depuis un fichier « CSV » vers un ensemble de données de référence existant et utiliser le mappage des colonnes pour créer de nouvelles colonnes personnalisées.
Pour plus d'informations, consultez la section « Importation de colonnes personnalisées ».
Clés composites
Les valeurs des données de référence d'un ensemble sont identifiées par un code unique. Il se peut toutefois que vous deviez identifier les données en utilisant plusieurs colonnes. Une clé composite est une combinaison de la colonne « code » et de cinq colonnes personnalisées au maximum dans un ensemble de données de référence. Une clé composite sert à identifier de manière unique chaque valeur de données de référence. Avec une clé composite, les valeurs de la colonne « code » n'ont plus besoin d'être uniques. L'unicité n'est garantie que lorsque les valeurs de toutes les colonnes spécifiées sont combinées; les valeurs des colonnes prises individuellement ne sont pas nécessairement uniques.
Lorsque vous définissez une clé composite pour un ensemble, chaque valeur de données de référence de cet ensemble est identifiée dans le système par une représentation physique de la clé composite, qui correspond à la concaténation de la colonne de code et des colonnes personnalisées de la clé composite, dans l'ordre spécifié lors de la création initiale de l'ensemble. Les valeurs sont séparées par |, par exemple : CODE|CC1|CC2|CC3. Cette représentation physique sert à identifier les valeurs des données de référence dans le système (par exemple, pour suivre les relations) et ne peut pas être modifiée.
Pour savoir comment créer des ensembles de données de référence avec des clés composées, consultez la section Création d'ensembles de données de référence avec des clés composées.
Relations avec d'autres types d'artefacts de gouvernance
Relations entre les classes de données et les ensembles de données de référence : les classes de données peuvent inclure des ensembles de données de référence dans les méthodes de mise en correspondance des données. L'ensemble de données de référence est ensuite utilisé pour évaluer si les colonnes des actifs de données répondent aux critères d'attribution de la classe de données. Voir Ajout de données correspondant à des classes de données.
Liens avec les termes commerciaux : vous pouvez associer des termes commerciaux à l'ensemble de données de référence ou à une valeur spécifique de ces données afin de préciser davantage la signification du code.
Liens avec d'autres ensembles de données de référence
Vous pouvez créer des relations hiérarchiques pour vos ensembles de données de référence afin d'établir des liens logiques entre eux. Vous pouvez également établir des liens entre les valeurs des ensembles de données de référence. Voir « Relations entre les ensembles de données de référence ».
Utilisation d'ensembles de données de référence
Vous pouvez utiliser un ensemble de données de référence de différentes manières :
- Cliquez sur (
) pour télécharger les valeurs des données de référence dans un fichier au format « CSV ». Vous pouvez ensuite modifier le fichier « CSV » localement, ce qui vous offre souvent plus de rapidité et de souplesse dans votre travail.
- Pour importer des valeurs à partir d'un fichier « CSV », sélectionnez « Importer un fichier » dans le menu d'actions situé à côté du nom des données de référence, puis suivez les instructions.
- Définissez vos propres valeurs en cliquant sur (
).
- Pour modifier une valeur de données de référence (sa valeur, sa description ou sa valeur parente), cliquez sur (
).
- Pour modifier l'ordre d'affichage des colonnes dans la vue des valeurs des données de référence, cliquez sur « Gérer les colonnes ».
- Supprimez les valeurs des données de référence en cliquant sur « Supprimer la valeur ». Sélectionnez plusieurs éléments à supprimer à l'aide de la touche Ctrl.
- Attribuez les artefacts associés à l'ensemble de données de référence, tels que les termes métier ou les classifications.
- Ajouter des termes métier associés à une valeur sélectionnée.
- Ajouter les valeurs associées à une valeur choisie. Vous pouvez établir des correspondances entre des valeurs d'un même ensemble ou entre des ensembles différents. Vous pouvez les importer à partir d'un fichier « CSV » en sélectionnant « Importer les valeurs associées » dans le menu d'actions situé à côté du nom des données de référence, puis en suivant les instructions.
Pour en savoir plus sur les tâches communes à tous les artefacts de gouvernance, consultez la section « Gestion des artefacts de gouvernance »