Foire aux questions

Qu'est-ce que IBM Watson® Knowledge Catalog ?

IBM Watson Knowledge Catalog est un répertoire de métadonnées d'entreprise dans le cloud qui catalogue vos connaissances et vos actifs analytiques, ainsi que vos modèles de machine learning, vos données structurées et non structurées, où qu'ils soient. Il permet d'accéder plus aisément à vos actifs et de les utiliser pour servir la science des données et toutes formes d'IA.

Après sélection des sources, IBM Watson Knowledge Catalog peut découvrir et enregistrer automatiquement les données à l'emplacement défini. Lorsque des actifs sont ajoutés au catalogue, ils sont automatiquement indexés et classés, pour que les ingénieurs en traitement de données, les data scientists, les intendants de données et les analystes métier puissent trouver, comprendre, partager et utiliser facilement les actifs. La recherche et les recommandations régies par IA guident les utilisateurs vers les actifs les plus pertinents du catalogue en se basant sur la compréhension des relations entre les actifs, la façon dont ces actifs sont utilisés et les connexions sociales entre les utilisateurs.

IBM Watson Knowledge Catalog apporte également un cadre de gouvernance intelligent et robuste qui vous permet de définir et d'appliquer des politiques de données et d'accès afin de vous assurer que les bonnes données sont utilisées par les bonnes personnes.

Grâce au glossaire métier d'IBM Watson Knowledge Catalog, les utilisateurs créent un vocabulaire d'entreprise commun et l'associent aux actifs, aux politiques et aux règles, ce qui crée une liaison entre le domaine commercial et vos actifs techniques.

Dans quelles régions pouvez-vous déployer IBM Watson Knowledge Catalog ?

Si vous avez des restrictions concernant les données dans votre région, vous pouvez déployer dans l'une des villes suivantes : Dallas, Londres, Francfort ou Tokyo.

Dois-je transférer mes données dans IBM Watson Knowledge Catalog ?

Non. Vous pouvez laisser vos données dans leurs répertoires actuels. IBM Watson Knowledge Catalog stocke les métadonnées de vos actifs.

Quels sont les types d'actifs et les sources de données pris en charge ?

IBM fournit plus de 30 connecteurs vers des sources de données dans le cloud ou sur site pour que vous puissiez vous connecter à vos ressources de données distantes. Par exemple, IBM fournit des connecteurs vers IBM® Db2® dans le cloud ou sur site, IBM Cloudant®, IBM Cloud® Object Storage, Oracle, Microsoft SQL Server, Microsoft Azure, Amazon S3, Salesforce.com, Hortonworks HDFS, Sybase et bien d'autres encore.

En plus des actifs en provenance de sources de données distantes, IBM Watson Knowledge Catalog peut prendre en charge d'autres types d'actifs, tels que les données structurées (par lignes/colonnes), semi-structurées ou non structurées. Par exemple, vous pouvez importer dans le catalogue des fichiers CSV, Microsoft Excel, PDF, texte, Microsoft Word, Jupyter Notebook (IPYNB), image et HTML, entre autres, pour les profiler et les partager avec d'autres utilisateurs.

Quel est le nombre maximum d'actifs utilisables dans IBM Watson Knowledge Catalog ?

Avec le plan Professionnel, le nombre d'actifs utilisables dans IBM Watson Knowledge Catalog est illimité. Avec les plans Standard et Lite, les limites sont respectivement de 1 000 et 50 actifs.

IBM Watson Knowledge Catalog intègre-t-il des services de gouvernance ?

IBM Watson Knowledge Catalog intègre un moteur d'application automatique des politiques qui génère des résultats en fonction des politiques et de l'action effectuée. IBM Watson Knowledge Catalog permet d'appliquer vos politiques de gouvernance au sein du système, pour que vous puissiez restreindre l'accès aux données ou transformer les données en masquant le contenu sensible.

L'application d'une politique de masquage des données va-t-elle supprimer ou modifier la source originale des données ?

Non. Si la politique de protection des données anonymise les données sensibles dans le catalogue, seules les données de prévisualisation gérées par l'application sont transformées. Les données originales ne sont pas modifiées sur la source.

Y a-t-il des bonnes pratiques pour gérer les artefacts de gouvernance dans IBM Watson Knowledge Catalog ?

Depuis la version 3.5 d'IBM Watson Knowledge Catalog pour IBM Cloud Pak for Data, vous pouvez affecter des utilisateurs et des gestionnaires de données à des catégories afin de décider qui peut consulter ou gérer les artefacts de gouvernance de la catégorie visée. Des rôles de collaborateurs de catégorie peuvent également être définis dans les flux de travail pour diriger automatiquement les étapes du flux de travail vers les personnes adéquates chargées des révisions et des validations. Grâce à cette nouvelle fonction, les collaborateurs de l'entreprise peuvent eux-mêmes assurer la gouvernance de leurs actifs métier.

Découvrez les principales étapes pour la planification et la mise en place de vos artefacts de gouvernance.

 

IBM Watson Knowledge Catalog fournit-il des services de classification ?

IBM Watson Knowledge Catalog peut classer automatiquement dans les colonnes de vos actifs les données ajoutées au catalogue. Les composants intégrés contiennent plus de 160 classificateurs d'attributs, comme le nom, l'e-mail, l'adresse postale, le numéro de carte bancaire, le numéro de permis de conduire, les identifiants administratifs, la date de naissance, les informations démographiques, les numéros DUNS (Data Universal Numbering System) et plus encore. Les catalogues permettent également de profiler les ressources de données non structurées et d'extraire des métadonnées telles que des catégories, des concepts, des sentiments et des émotions.

IBM Watson Knowledge Catalog possède-t-il des fonctions de préparation des données ?

Oui. IBM Data Refinery, qui fait partie d'IBM Watson Knowledge Catalog, assure cette fonctionnalité de préparation des données. Data Refinery possède de nombreuses fonctionnalités permettant de découvrir, de nettoyer et de transformer vos données grâce à des opérations intégrées. Il offre également de puissants outils pour le profilage et la visualisation par diagrammes, graphiques et statistiques pour que vous puissiez mieux interagir avec vos données et les comprendre. Les politiques d'accès et de transformation des données définies dans IBM Watson Knowledge Catalog sont également appliquées dans Data Refinery afin de garantir que les données sensibles provenant de catalogues connectés restent protégées.

Comment accéder aux fonctionnalités de gestion des données de référence ?

Pour accéder aux fonctionnalités de gestion des données de référence, connectez-vous à votre instance IBM Cloud Pak for Data. Dans la colonne de navigation à gauche, ouvrez « Données de référence » dans la section « Gouvernance ».

Une fois sur la page « Données de référence », vous pouvez voir la liste de tous les ensembles de données de référence publiés et la liste des projets définis dans le système. Au début, la liste sera vide, mais vous pouvez créer un nouvel ensemble de données de référence en cliquant sur le bouton « Ajouter un ensemble de données de référence » > « Nouvel ensemble de données de référence ».

 

Peut-on créer des groupes d'accès pour des personnes de différents services ?

Oui. Des groupes d'accès sont configurables avec IBM Cloud® Identity and Asset Management. Dans le module de contrôle d'accès d'IBM Watson Knowledge Catalog, vous pouvez ajouter un collaborateur ou un groupe d'utilisateurs.

Que sont les unités de capacité-heure (CUH) ?

Les flux de Data Refinery, Data Refinery interactive UI et les tâches de profilage sont facturés en fonction du nombre d'unités entières ou de capacités requises par heure pour chaque type de capacité :

  • Les flux de Data Refinery nécessitent 1,5 unité de capacité par heure dans un environnement Spark par défaut. Pour les autres environnements personnalisés, le calcul dépend du nombre d'exécuteurs et des ressources utilisées pour le pilote et l'exécuteur Spark.
  • Data Refinery interactive UI nécessite 1,5 unité de capacité par heure. Elle commence lorsque l'interface de Data Refinery interactive UI s'ouvre et s'arrête lorsqu'elle est refermée.
  • Les travaux de profilage nécessitent 6 unités de capacité par heure. Une charge minimale de 0,96 (équivalent à 10 minutes) s'appliquera pour chaque exécution de tâche.

Un nombre déterminé d'heures d'unités de capacité gratuites mensuelles est inclus dans chaque plan. Pour les plans Standard et Professionnel, la facturation débute lorsque la limite mensuelle du plan est atteinte. Avec un plan Lite, une fois que la limite mensuelle du plan est atteinte, aucun flux de Data Refinery ou de profilage ne peut plus être exécuté avant le mois suivant, sauf à passer au plan Standard ou Professionnel.
Exemples de flux de Data Refinery utilisant le type de capacité par défaut 3 :

  1. Un flux de Data Refinery fonctionne pendant 1 heure : 1,5 CUH
  2. Deux flux de raffinage de données sont exécutés pendant une heure chacun : 2 heures x 1,5 CUH= 3 CUH
  3. Un flux Data Refinery fonctionne pendant 30 minutes : 0,5 heure x 1,5 CUH = 0,75 CUH
  4. Data Refinery interactive UI est utilisée pendant 1 heure : 1,5 CUH

Exemples de profilage (les tâches de profilage peuvent être déclenchées automatiquement ou manuellement) :

  1. Une tâche de profilage s'exécute pendant 30 minutes : 0,5 heure x 6 CUH = 3 CUH
  2. Une tâche de profilage dure 9 minutes. Le tarif minimum s'applique : 0,16 heure x 6 CUH = 0,96 CUH

 

Après l'achat d'un plan Standard ou Professionnel, quel est le délai de configuration nécessaire pour tirer pleinement parti du produit ?

IBM Watson Knowledge Catalog est intégralement en libre-service. Un administrateur peut immédiatement créer un catalogue, puis ajouter et enrichir des actifs. Des tâches additionnelles sont possibles :

  • Créer un glossaire d'entreprise
  • Définir des politiques de protection des données pour organiser l'accès aux données
  • Inviter les utilisateurs à accéder au catalogue

IBM Watson Knowledge Catalog est-il disponible sur IBM Cloud Pak® for Data ?

Oui. Découvrez en détail cette plateforme intégrée de données et d'intelligence artificielle d'IBM.

Essayez IBM Watson Knowledge Catalog

Activez les données prêtes à l'emploi pour l'IA et l'analyse grâce au catalogage intelligent.