{

Méthodes d'importation pour les artefacts de gouvernance

Vous pouvez importer des artefacts de gouvernance à l'aide d'un fichier. Vous pouvez importer un type d'artefact de gouvernance à la fois, ou importer tous les artefacts de gouvernance d'une autre IBM Knowledge Catalog instance.

Compatibilité entre les environnements de déploiement

Vous pouvez exporter puis importer des artefacts de gouvernance entre IBM Knowledge Catalog instances sur les environnements de déploiement suivants :

  • Cloud Pak for Data 3.5
  • Cloud Pak for Data 4.x
  • Cloud Pak for Data 5.x
  • IBM watsonx

Les valeurs de Stewards ne sont pas compatibles entre IBM Knowledge Catalog les instances IBMwatsonx et Cloud Pak for Data3.5 ou 4.x.

Vous pouvez importer des artefacts de gouvernance depuis IBMInfoSphere Information Governance Catalog vers IBM Knowledge Catalog instances sur Cloud Pak for Data3.5 et 4.x. Pour importer des artefacts de gouvernance depuis IBM InfoSphere Information Governance Catalog vers des instances IBM Knowledge Catalog sur IBM watsonx, vous devez modifier chaque fichier CSV afin qu'il soit conforme au format des fichiers IBM Knowledge Catalog artefact CSV. Par exemple, vous devrez peut-être effectuer les types de modifications suivants :

  • Supprimer les colonnes non prises en charge
  • Séparer les différents types d'artefacts dans plusieurs fichiers d' CSV
  • Modifier les colonnes prises en charge
  • Ajouter les colonnes requises

Comparaison des méthodes d'importation

Choisissez la méthode d'importation adaptée à vos objectifs et à votre situation.

Importer un seul type d'artefact

Vous pouvez importer un seul type d'artefact de gouvernance à la fois à l'aide d'un fichier CSV.

Cette méthode est utile dans les cas suivants :

  • Vous souhaitez que les artefacts importés soient soumis au workflow.
  • Vous souhaitez ajouter des valeurs pour une propriété à un type d'artefact de gouvernance. Exportez ce type d'artefact sous forme de fichier CSV, modifiez le fichier CSV, puis importez-le. Par exemple, vous pouvez utiliser cette méthode pour ajouter un attribut personnalisé à vos conditions commerciales.
  • Vous souhaitez définir des artefacts dans un autre programme. Créer des fichiers d' CSV s pour chaque type d'artefact. Par exemple, vous pouvez utiliser cette méthode pour définir des artefacts dans un tableur, puis les importer.

Pour importer des artefacts de gouvernance, consultez les sections Importation d'artefacts de gouvernance par type à l'aide de fichiers CSV et Format de fichier CSV.

Importer plusieurs types d'artefacts

Vous pouvez importer plusieurs types d'artefacts de gouvernance à l'aide d'un fichier ZIP que vous avez créé en exportant plusieurs types d'artefacts de gouvernance existants à partir d'une IBM Knowledge Catalog instance. Le fichier ZIP contient des fichiers d' CSV s pour les catégories et chaque type d'artefact exporté. Les fichiers CSV correspondent au format du fichier d'importation CSV, à l'exception des éléments suivants :

  • La colonne supplémentaire « ID d'artefact », qui contient les identifiants des artefacts au lieu de les identifier par leur nom et leur chemin de catégorie.
  • Les artefacts associés sont définis à l'aide d'identifiants d'artefacts plutôt que d'un contexte et d'un nom.

Cette méthode est utile dans les cas suivants :

  • Vous souhaitez déplacer tous les artefacts de gouvernance d'une IBM Knowledge Catalog instance à une autre.

Voir Importation de plusieurs types d'artefacts de gouvernance à partir d'une instance avec un fichier ZIP. Vous pouvez également utiliser la cpd-cli commande pour exporter et importer des artefacts de gouvernance à l'aide d'un fichier ZIP au sein d'un Cloud Pak for Data cluster ou entre différents clusters. Pour plus d'informations, consultez la section Migration des artefacts de gouvernance dans la IBMSoftware Hub documentation.

Le tableau suivant résume les différences entre l'importation d'artefacts à l'aide de fichiers CSV s ou d'un fichier ZIP.

Caractéristiques fichier CSV Fichier ZIP
Création de fichiers • Exporter un type d'artefacts
existants• Créer un fichier dans un
tableur• Exporter des artefacts à IBMInfoSphere Information Governance Catalog partir de et ajuster le format
Exporter plusieurs types d'artefacts à partir d'une instance
Nombre de types d'artefacts Catégories ou un type d'artefact par fichier. Plusieurs types d'artefacts, avec des catégories et chaque type d'artefact dans un fichier CSV distinct.
méthodes d'importation • Via l'interface utilisateur
• Demande API
• CLI•
Requête API
Flux de travaux Tous les artefacts sont importés en tant que brouillons et sont soumis au flux de travail. Les catégories sont publiées immédiatement car elles ne sont pas soumises à un workflow. Tous les artefacts et toutes les catégories sont publiés immédiatement.
Droits requis Autorisations pour créer ou modifier des catégories. Vous devez être au moins éditeur dans la catégorie dans laquelle vous effectuez l'importation. Pour plus de détails, consultez la section Autorisations requises. Autorisation de gestion du glossaire

Artefacts de gouvernance que vous pouvez importer

Avec ces deux méthodes d'importation, vous pouvez importer des catégories et les types d'artefacts de gouvernance suivants :

Restrictions :

  • Les artefacts réimportés (artefacts liés à des versions publiées) peuvent être publiés uniquement en tant que nouvelle révision, et non en tant que version.
  • Vous pouvez importer des valeurs pour toutes les propriétés de ces types d'artefacts de gouvernance, y compris les relations avec d'autres artefacts. Cependant, les relations ne sont importées que lorsque l'artefact associé existe ou est défini dans le même processus d'importation. Pour ajouter les relations ignorées par le processus d'importation, publiez d'abord tous les artefacts importés, puis relancez le processus d'importation.
  • Vous ne pouvez pas utiliser CSV pour déplacer des artefacts de gouvernance et leurs relations entre des instances d' Cloud Pak for Data. Par exemple, si vous essayez d'exporter des classes de données avec la méthode Match pour référencer des données vers CSV, puis de les importer dans une autre instance d' Cloud Pak for Data, l'importation échoue, car l'ID d'artefact n'est pas inclus dans les importations et exportations d' CSV. Utilisez plutôt l'importation ZIP.
  • Lors de l'importation d'un ensemble de données de référence à partir d'un fichier CSV, les valeurs de données de référence de cet ensemble ne sont pas importées. Vous devez utiliser un fichier séparé CSV pour importer les valeurs dans l'ensemble de données. Vous pouvez également utiliser une importation ZIP pour importer à la fois l'ensemble de données de référence et ses valeurs de données de référence. Pour plus d'informations, consultez la section Importation de fichiers pour les ensembles de données de référence.
  • Vous ne pouvez pas importer de règles relatives à la protection des données ni de règles de SLA concernant la qualité des données.

Méthodes pour fusionner des artefacts importés et existants

Que vous importiez des artefacts à l'aide de fichiers CSV s ou d'un fichier ZIP, vous devez choisir ce qui se passe lorsque vous importez des artefacts de gouvernance qui existent déjà et dont les valeurs des propriétés sont différentes. Le tableau suivant résume les trois méthodes de fusion.

Méthode de fusion API Effet sur les valeurs initiales Effet sur les valeurs importées
Remplacer toutes les valeurs merge_option=all Supprimer toutes les valeurs d'origine. Accepter toutes les valeurs importées, même les valeurs vides.
Remplacer par des valeurs définies merge_option=specified Conserver les valeurs d'origine si les valeurs importées sont vides. Accepter toutes les valeurs importées, sauf les valeurs vides.
Remplacer les valeurs vides merge_option=empty Conserver les valeurs d'origine, sauf les valeurs vides. Accepter uniquement les valeurs importées qui remplacent les valeurs vides.

Pour les nouveaux artefacts, chacune de ces méthodes produit les mêmes résultats.

Remplacer toutes les valeurs

Toutes les valeurs d'origine de l'artefact sont supprimées et remplacées par les valeurs de l'artefact importé. Si la valeur d'une propriété pour l'artefact importé est vide, toutes les valeurs d'origine pour cette propriété sont supprimées.

Par exemple, supposons que vous disposiez d'un terme commercial publié nommé « release » et que vous importiez un fichier CSV pour le modifier. Le tableau suivant montre l'effet de l'option Remplacer toutes les valeurs :

Propriété Valeurs originelles Valeurs dans le fichier CSV Valeurs obtenues
Nom release release release
Type d'artefact glossary_term glossary_term glossary_term
Catégorie marketing marketing marketing
Description Exemple de terme Exemple de terme édité Exemple de terme édité
Balises bêta bêta
Termes associés marketing>>version marketing>>date marketing>>date
Classifications

Données d'identification

Le projet d'artefact qui en résulte comporte les modifications suivantes par rapport aux valeurs d'origine :

  • La description originale est remplacée par une nouvelle description.
  • La valeur vide d'origine des balises est remplacée par une valeur.
  • Le terme apparenté d'origine est remplacé par un nouveau terme apparenté.
  • La valeur de classification d'origine est remplacée par une valeur vide.
Remarque :

Lorsque vous utilisez l'option all de fusion, vous devez vous assurer que tout le contenu de l' CSV est cohérent en ce qui concerne les relations entre les artefacts. Par exemple, si le fichier d'importation ZIP contient à la fois un terme et une classe de données reliés entre eux par une relation, cette relation doit être présente à la fois dans les classes de données CSV et les termes CSV. Sinon, le comportement d'importation des relations est imprévisible : la relation peut être importée ou non.

Lorsque vous importez des fichiers ZIP contenant des valeurs de données de référence, vous devez toujours utiliser merge_option=all dans l'appel API.

Remplacer par des valeurs définies

Les valeurs d'origine et vides de l'artefact sont remplacées par les valeurs fournies de l'artefact importé. Si la valeur d'une propriété pour l'artefact importé est vide, les valeurs d'origine de la propriété sont conservées.

Par exemple, supposons que vous disposiez d'un terme commercial publié nommé « release » et que vous importiez un fichier CSV pour le modifier. Le tableau suivant montre l'effet de l'option Remplacer par des valeurs définies :

Propriété Valeurs originelles Valeurs dans le fichier CSV Valeurs obtenues
Nom release release release
Type d'artefact glossary_term glossary_term glossary_term
Catégorie marketing marketing marketing
Description Exemple de terme Exemple de terme édité Exemple de terme édité
Balises bêta bêta
Termes associés marketing>>version marketing>>date marketing>>date
Classifications

Données d'identification

Données d'identification

Le projet d'artefact qui en résulte comporte les modifications suivantes par rapport aux valeurs d'origine :

  • La description originale est remplacée par une nouvelle description.
  • La valeur vide d'origine des balises est remplacée par une valeur.
  • Le terme apparenté d'origine est remplacé par un nouveau terme apparenté.

Remplacer les valeurs vides

Les valeurs vides de l'artefact d'origine sont remplacées par les valeurs fournies par l'artefact importé.

Par exemple, supposons que vous disposiez d'un terme commercial publié nommé « release » et que vous importiez un fichier CSV pour le modifier. Le tableau suivant montre l'effet de l'option Remplacer les valeurs vides :

Propriété Valeurs originelles Valeurs dans le fichier CSV Valeurs obtenues
Nom release release release
Type d'artefact glossary_term glossary_term glossary_term
Catégorie marketing marketing marketing
Description Exemple de terme Exemple de terme édité Exemple de terme
Balises bêta bêta
Termes associés marketing>>version marketing>>date marketing>>version
Classifications

Données d'identification

Données d'identification

Le projet d'artefact qui en résulte présente cette modification par rapport aux valeurs d'origine :

  • La valeur vide d'origine des balises est remplacée par une valeur.

Gestion des versions et des dates d'entrée en vigueur lors de l'importation d'artefacts

Les brouillons importés des artefacts existants ne peuvent être publiés que sous forme de nouvelle révision, et non sous forme de version.

Les dates d'entrée en vigueur sont ignorées lors du processus d'importation.

Si les brouillons importés sont des artefacts entièrement nouveaux (c'est-à-dire qu'ils ne sont attribués à aucune version publiée), la date de début est automatiquement définie comme la date de publication.

Si les artefacts sont réimportés (c'est-à-dire que les brouillons importés sont liés aux versions publiées), la date de début effective est déjà définie dans la version active existante et restera la même après la publication du brouillon importé.

Une version obtient la date de fin effective au moment où elle devient inactive en étant remplacée par une nouvelle version.

Remarques relatives à la sécurité

Les données de gouvernance exportées vers des fichiers CSV sont nettoyées contre les attaques par injection d' CSV s connues, afin d'être sécurisées pour les tableurs qui interprètent automatiquement les données d' CSV. Par conséquent, toute valeur textuelle commençant par l'un des caractères suivants :

  • égal à (=)
  • plus (+)
  • moins (-)
  • à (@)

sont précédées d'un apostrophe ('). Afin d'assurer la cohérence de la fonctionnalité, les fichiers importés CSV sont également analysés afin de supprimer automatiquement l'apostrophe ('). La purification s'applique également lors de l'importation et de l'exportation d'artefacts de gouvernance vers des fichiers ZIP, car ceux-ci contiennent des fichiers CSV.

Pour désactiver cette fonctionnalité :

  1. Modifier IBM Knowledge Catalog Glossaire Déploiement du service :

    oc edit deployment wkc-glossary-service
    
  2. Définissez la variable d'environnement ESCAPE_FORMULAS_IN_CSV_FILES sur la valeur false.

Pour plus d'informations, consultez la section Injection d' CSV.

En savoir plus