Häufig gestellte Fragen

Was ist IBM Watson® Knowledge Catalog?

IBM Watson Knowledge Catalog ist ein cloudbasiertes Metadaten-Repository für Unternehmen, mit dem Sie Ihre Wissens- und Analysewerte katalogisieren können, einschließlich der Modelle für maschinelles Lernen sowie strukturierter und unstrukturierter Daten, unabhängig davon, wo sie sich befinden. So können Sie leichter auf diese Ressourcen zugreifen und sie als Grundlage für Datenwissenschaft und alle Formen der KI nutzen.

Für ausgewählte Quellentypen kann IBM Watson Knowledge Catalog automatisch Datenbestände an der bereitgestellten Verbindungsschnittstelle ermitteln und registrieren. Wenn Assets zum Katalog hinzugefügt werden, werden sie automatisch indiziert und klassifiziert, sodass Benutzer wie Dateningenieure, Datenwissenschaftler, Datenverantwortliche und Geschäftsanalysten die Assets leicht finden, verstehen, gemeinsam nutzen und verwenden können. Eine KI-gestützte Suche samt Empfehlungen führtdie Nutzer zu den relevantesten Assets im Katalog, basierend auf der Kenntnis der Beziehungen zwischen den Assets, der Art und Weise, wie sie genutzt werden, und den sozialen Verbindungen zwischen den Nutzern.

Außerdem bietet IBM Watson Knowledge Catalog ein intelligentes und robustes Governance-Framework, mit dem Sie Daten- und Zugriffsrichtlinien definieren und durchsetzen können, damit die richtigen Daten an die richtigen Personen gelangen.

Mit dem IBM Watson Knowledge Catalog Geschäftsglossar kann ein gemeinsames Geschäftsvokabular erstellt und mit Ihren Assets, Richtlinien und Regeln verknüpft werden, um eine Brücke zwischen dem geschäftlichen und dem technischen Bereich zu schlagen.

In welchen Regionen kann IBM Watson Knowledge Catalog bereitgestellt werden?

Bei regionalen Datenbeschränkungen können Sie das Produkt in einer der folgenden Städte bereitstellen: Dallas, London, Frankfurt oder Tokio.

Muss ich meine Daten in den IBM Watson Knowledge Catalog verschieben?

Nein. Sie können Ihre Daten in den vorhandenen Repositorys behalten. Watson Knowledge Catalog speichert die Metadaten Ihrer Assets.

Welche Datenquellen und Asset-Typen werden unterstützt?

IBM bietet über 30 Konnektoren zu Datenquellen in der Cloud oder vor Ort, mit denen Sie eine Verbindung zu externen Datenbeständen herstellen können. Zum Beispiel sind Konnektoren zu IBM® Db2® in der Cloud oder vor Ort, IBM Cloudant®, IBM Cloud® Object Storage, Oracle, Microsoft SQL Server, Microsoft Azure, Amazon S3, Salesforce.com, Hortonworks HDFS, Sybase und vielen anderen bei IBM erhältlich.

Neben Assets aus externen Datenquellen unterstützt IBM Watson Knowledge Catalog auch andere Asset-Typen, wie strukturierte (Zeilen/Spalten), halbstrukturierte und unstrukturierte Daten. So können Sie beispielsweise CSV-, Microsoft Excel-, PDF-, Text-, Microsoft Word-, Jupyter Notebook (IPYNB), Bild- und HTML-Dateien, um nur einige zu nennen, in den Katalog aufnehmen, um Profile zu erstellen und mit anderen Benutzern zu teilen.

Wie viele Assets kann ich maximal im IBM Watson Knowledge Catalog haben?

Beim Tarif Professional gibt es keine Obergrenze für die Anzahl der Assets in Ihrem IBM Watson Knowledge Catalog. Bei den Tarifen Standard und Lite liegen die Grenzen bei 1.000 bzw. 50 Assets.

Bietet IBM Watson Knowledge Catalog Governance-Services an?

IBM Watson Knowledge Catalog enthält eine automatische Engine zur Richtliniendurchsetzung, die die Ergebnisse auf Grundlage der Richtlinien und der durchgeführten Aktionen bestimmt. IBM Watson Knowledge Catalog bietet die Möglichkeit, Ihre Governance-Richtlinien innerhalb des Systems einzurichten, so dass Sie den Zugriff auf Daten einschränken oder die Daten durch Maskierung sensibler Inhalte umwandeln können.

Kann die ursprüngliche Datenquelle mit einer Datenrichtlinie, die Daten maskiert, gelöscht oder ändert werden?

Nein. Anonymisiert eine Datenschutzrichtlinie sensible Daten im Katalog, werden nur die von der Anwendung verwalteten Vorschaudaten umgewandelt. Die ursprünglichen Quelldaten bleiben unverändert.

Gibt es Best Practices zur Verwaltung von Governance-Artefakten in IBM Watson Knowledge Catalog?

In IBM Watson Knowledge Catalog in IBM Cloud Pak for Data v3.5 können Sie jetzt Benutzern und Datenverwaltern Kategorien zuweisen und festlegen, wer Governance-Artefakte der Kategorie anzeigen oder verwalten kann. Die Rollen der Kategorie „Mitarbeiter“ können auch in Workflows genutzt werden, um Workflow-Schritte zur Überprüfung und Genehmigung automatisch an die richtigen Personen weiterzuleiten. Mit dieser neuen Funktionalität könnwen Unternehmen die eigenen Assets selbst verwalten.

Informieren Sie sich über einige wichtige Schritte bei der Planung und Umsetzung der Verwaltung Ihrer Governance-Artefakte.

 

Bietet IBM Watson Knowledge Catalog Klassifikationsdienste an?

IBM Watson Knowledge Catalog kann Spalten in Ihren Datenbeständen automatisch klassifizieren, wenn sie dem Katalog hinzugefügt werden. Integrierte Komponenten bieten über 160 Attributklassifikatoren, darunter Namen, E-Mails, Postanschriften, Kreditkartennummern, Führerscheinnummern, staatliche Identifikationsnummern, Geburtsdaten, demografische Angaben usw. Kataloge erstellen auch Profile von unstrukturierten Datenbeständen und extrahieren Metadaten aus Inhalten wie z. B. Kategorien, Konzepte, Stimmungen und Emotionen.

Gibt es in IBM Watson Knowledge Catalog Datenaufbereitungsfunktionalität?

Ja. Datenaufbereitungsfunktionalität ist über IBM Data Refinery verfügbar, die zum IBM Watson Knowledge Catalog gehört. Data Refinery bietet eine Vielzahl von Funktionen, mit denen Sie Ihre Daten mit integrierten Operationen entdecken, bereinigen und transformieren können. Außerdem verfügt es über leistungsstarke Tools zur Profilerstellung und Visualisierung, wie z. B. Diagramme, Grafiken und Statistiken, um mit Ihren Daten zu interagieren und sie zu verstehen. Die in IBM Watson Knowledge Catalog definierten Richtlinien zu Datenzugriff und -umwandlung werden auch in Data Refinery durchgesetzt, damit sensible Daten aus kontrollierten Katalogen geschützt bleiben.

Wie kann auf die Verwaltungsfunktionalität von Referenzdaten zugegriffen werden?

Um auf die Funktion zur Verwaltung von Referenzdaten zuzugreifen, melden Sie sich bei Ihrer IBM Cloud Pak for Data-Instanz an. Öffnen Sie in der linken Navigationsleiste unter dem Abschnitt „Governance“ den Bereich „Referenzdaten“.

Auf der Seite „Referenzdaten“ sehen Sie die Liste aller im System definierten Datensätze im Status „Veröffentlicht“ und „Entwurf“. Zu Beginn ist die Liste leer und Sie können über die Schaltfläche „Referenzdatensatz hinzufügen > „Neuer Referenzdatensatz“ einen neuen Referenzdatensatz erstellen.

 

Können Zugriffsgruppen für Personen in verschiedenen Geschäftsbereichen eingerichtet werden?

Ja. Zugriffsgruppen können über IBM Cloud® Identity and Asset Management eingerichtet werden. Im Modul Zugriffskontrolle von IBM Watson Knowledge Catalog können Sie einen Mitarbeiter oder eine Benutzergruppe hinzufügen.

Was sind Kapazitätseinheitenstunden (CUH)?

Data-Refinery-Flows, interaktive Data-Refinery-Benutzeroberflächen und Profilerstellungsaufträge werden für die Anzahl ganzer Stunden oder je Stunde benötigter Kapazitätseinheiten berechnet:

  • Data-Refinery-Flows benötigen 1,5 Kapazitäteneinheiten pro Stunde in einer Spark-Standardumgebung. Bei anderen benutzerdefinierten Umgebungen hängt die Berechnung von der Anzahl der Ausführenden und der für den Spark-Treiber und das Steuerprogramm verwendeten Ressourcen ab.
  • Die interaktive Benutzeroberfläche der Data Refinery benötigt 1,5 Kapazitäteneinheiten pro Stunde. Die Berechnung beginnt beim Start der Benutzeroberfläche der Refinery und endet, wenn sie geschlossen wird.
  • Profilerstellungsaufträge erfordern 6 Kapazitäteneinheiten pro Stunde. Für jede Ausführung eines Auftrags wird eine Mindestgebühr von 0,96 (entspricht 10 Minuten) erhoben.

Jeder Tarif enthält eine bestimmte Anzahl von freien Kapazitätseinheiten für den Monat. Bei den Tarifen Standard und Professional fallen bei Erreichen der Tarifobergrenze für den Monat Gebühren an. Beim Tarif Lite können nach Erreichen der Obergrenze für den Monat erst im nächsten Monat oder nach einem Upgrade auf den Tarif Standard oder Professional weitere Data-Refinery-Flows oder Profilerstellungsaufträge ausgeführt werden.
Beispiele für den Data-Refinery-Flow unter Verwendung des Standardkapazitätstyps 3:

  1. Ein Data-Refinery-Flow läuft 1 Stunde lang: 1,5 CUHs
  2. Zwei Data-Refinery-Flows laufen jeweils 1 Stunde lang: 2 Stunden * 1,5 CUHs = 3 CUHs
  3. Ein Data-Refinery-Flow läuft 30 Minuten lang: 0,5 Stunden * 1,5 CUHs = 0,75 CUHs
  4. Die interaktive Data-Refinery-Benutzeroberfläche wird 1 Stunde lang verwendet: 1,5 CUHs

Beispiel zu Profilerstellung (Profilerstellungsaufträge können automatisch oder manuell gestartet werden):

  1. Ein Profilerstellungsauftrag läuft 30 Minuten lang: 0,5 Stunden * 6 CUHs = 3 CUHs
  2. Ein Profilerstellungsauftrag läuft 9 Minuten lang. In diesem Szenario gilt die Mindestgebühr: 0,16 Stunden * 6 CUHs = 0,96 CUHs

 

Wie viel Einrichtungsaufwand ist nach Abschluss eines Standard- oder Professionaltarifs erforderlich, um das Produkt voll nutzen zu können?

IBM Watson Knowledge Catalog ist komplett selbstverwaltend, d. h. ein Administrator kann mit der Erstellung eines Katalogs beginnen und dann sofort Assets hinzufügen und kuratieren. Zusätzliche Aufgaben können sein:

  • Geschäftsglossar erstellen
  • Datenschutzrichtlinien zur Regelung des Zugriffs auf Daten festlegen
  • Benutzer zum Katalog einladen

Ist dies auf IBM Cloud Pak® for Data verfügbar?

Ja. Erfahren Sie mehr über diese integrierte Daten- und KI-Plattform von IBM.

IBM Watson Knowledge Catalog testen

Aktivieren Sie mit intelligenter Katalogisierung einsatzbereite Daten für KI und Analysen.