Häufig gestellte Fragen
Muss ich meine Daten in den IBM Watson Knowledge Catalog verschieben?
Nein. Sie können Ihre Daten in den vorhandenen Repositorys behalten. Watson Knowledge Catalog speichert die Metadaten Ihrer Assets.
Welche Datenquellen und Asset-Typen werden unterstützt?
IBM bietet über 30 Konnektoren zu Datenquellen in der Cloud oder vor Ort, mit denen Sie eine Verbindung zu externen Datenbeständen herstellen können. Zum Beispiel sind Konnektoren zu IBM® Db2® in der Cloud oder vor Ort, IBM Cloudant®, IBM Cloud® Object Storage, Oracle, Microsoft SQL Server, Microsoft Azure, Amazon S3, Salesforce.com, Hortonworks HDFS, Sybase und vielen anderen bei IBM erhältlich.
Neben Assets aus externen Datenquellen unterstützt IBM Watson Knowledge Catalog auch andere Asset-Typen, wie strukturierte (Zeilen/Spalten), halbstrukturierte und unstrukturierte Daten. So können Sie beispielsweise CSV-, Microsoft Excel-, PDF-, Text-, Microsoft Word-, Jupyter Notebook (IPYNB), Bild- und HTML-Dateien, um nur einige zu nennen, in den Katalog aufnehmen, um Profile zu erstellen und mit anderen Benutzern zu teilen.
Wie viele Assets kann ich maximal im IBM Watson Knowledge Catalog haben?
Beim Tarif Professional gibt es keine Obergrenze für die Anzahl der Assets in Ihrem IBM Watson Knowledge Catalog. Bei den Tarifen Standard und Lite liegen die Grenzen bei 1.000 bzw. 50 Assets.
Bietet IBM Watson Knowledge Catalog Governance-Services an?
IBM Watson Knowledge Catalog enthält eine automatische Engine zur Richtliniendurchsetzung, die die Ergebnisse auf Grundlage der Richtlinien und der durchgeführten Aktionen bestimmt. IBM Watson Knowledge Catalog bietet die Möglichkeit, Ihre Governance-Richtlinien innerhalb des Systems einzurichten, so dass Sie den Zugriff auf Daten einschränken oder die Daten durch Maskierung sensibler Inhalte umwandeln können.
Kann die ursprüngliche Datenquelle mit einer Datenrichtlinie, die Daten maskiert, gelöscht oder ändert werden?
Nein. Anonymisiert eine Datenschutzrichtlinie sensible Daten im Katalog, werden nur die von der Anwendung verwalteten Vorschaudaten umgewandelt. Die ursprünglichen Quelldaten bleiben unverändert.
Gibt es Best Practices zur Verwaltung von Governance-Artefakten in IBM Watson Knowledge Catalog?
In IBM Watson Knowledge Catalog in IBM Cloud Pak for Data v3.5 können Sie jetzt Benutzern und Datenverwaltern Kategorien zuweisen und festlegen, wer Governance-Artefakte der Kategorie anzeigen oder verwalten kann. Die Rollen der Kategorie „Mitarbeiter“ können auch in Workflows genutzt werden, um Workflow-Schritte zur Überprüfung und Genehmigung automatisch an die richtigen Personen weiterzuleiten. Mit dieser neuen Funktionalität könnwen Unternehmen die eigenen Assets selbst verwalten.
Informieren Sie sich über einige wichtige Schritte bei der Planung und Umsetzung der Verwaltung Ihrer Governance-Artefakte.
Bietet IBM Watson Knowledge Catalog Klassifikationsdienste an?
IBM Watson Knowledge Catalog kann Spalten in Ihren Datenbeständen automatisch klassifizieren, wenn sie dem Katalog hinzugefügt werden. Integrierte Komponenten bieten über 160 Attributklassifikatoren, darunter Namen, E-Mails, Postanschriften, Kreditkartennummern, Führerscheinnummern, staatliche Identifikationsnummern, Geburtsdaten, demografische Angaben usw. Kataloge erstellen auch Profile von unstrukturierten Datenbeständen und extrahieren Metadaten aus Inhalten wie z. B. Kategorien, Konzepte, Stimmungen und Emotionen.
Gibt es in IBM Watson Knowledge Catalog Datenaufbereitungsfunktionalität?
Ja. Datenaufbereitungsfunktionalität ist über IBM Data Refinery verfügbar, die zum IBM Watson Knowledge Catalog gehört. Data Refinery bietet eine Vielzahl von Funktionen, mit denen Sie Ihre Daten mit integrierten Operationen entdecken, bereinigen und transformieren können. Außerdem verfügt es über leistungsstarke Tools zur Profilerstellung und Visualisierung, wie z. B. Diagramme, Grafiken und Statistiken, um mit Ihren Daten zu interagieren und sie zu verstehen. Die in IBM Watson Knowledge Catalog definierten Richtlinien zu Datenzugriff und -umwandlung werden auch in Data Refinery durchgesetzt, damit sensible Daten aus kontrollierten Katalogen geschützt bleiben.
Wie kann auf die Verwaltungsfunktionalität von Referenzdaten zugegriffen werden?
Um auf die Funktion zur Verwaltung von Referenzdaten zuzugreifen, melden Sie sich bei Ihrer IBM Cloud Pak for Data-Instanz an. Öffnen Sie in der linken Navigationsleiste unter dem Abschnitt „Governance“ den Bereich „Referenzdaten“.
Auf der Seite „Referenzdaten“ sehen Sie die Liste aller im System definierten Datensätze im Status „Veröffentlicht“ und „Entwurf“. Zu Beginn ist die Liste leer und Sie können über die Schaltfläche „Referenzdatensatz hinzufügen > „Neuer Referenzdatensatz“ einen neuen Referenzdatensatz erstellen.
Können Zugriffsgruppen für Personen in verschiedenen Geschäftsbereichen eingerichtet werden?
Ja. Zugriffsgruppen können über IBM Cloud® Identity and Asset Management eingerichtet werden. Im Modul Zugriffskontrolle von IBM Watson Knowledge Catalog können Sie einen Mitarbeiter oder eine Benutzergruppe hinzufügen.
Was sind Kapazitätseinheitenstunden (CUH)?
Data-Refinery-Flows, interaktive Data-Refinery-Benutzeroberflächen und Profilerstellungsaufträge werden für die Anzahl ganzer Stunden oder je Stunde benötigter Kapazitätseinheiten berechnet:
- Data-Refinery-Flows benötigen 1,5 Kapazitäteneinheiten pro Stunde in einer Spark-Standardumgebung. Bei anderen benutzerdefinierten Umgebungen hängt die Berechnung von der Anzahl der Ausführenden und der für den Spark-Treiber und das Steuerprogramm verwendeten Ressourcen ab.
- Die interaktive Benutzeroberfläche der Data Refinery benötigt 1,5 Kapazitäteneinheiten pro Stunde. Die Berechnung beginnt beim Start der Benutzeroberfläche der Refinery und endet, wenn sie geschlossen wird.
- Profilerstellungsaufträge erfordern 6 Kapazitäteneinheiten pro Stunde. Für jede Ausführung eines Auftrags wird eine Mindestgebühr von 0,96 (entspricht 10 Minuten) erhoben.
Jeder Tarif enthält eine bestimmte Anzahl von freien Kapazitätseinheiten für den Monat. Bei den Tarifen Standard und Professional fallen bei Erreichen der Tarifobergrenze für den Monat Gebühren an. Beim Tarif Lite können nach Erreichen der Obergrenze für den Monat erst im nächsten Monat oder nach einem Upgrade auf den Tarif Standard oder Professional weitere Data-Refinery-Flows oder Profilerstellungsaufträge ausgeführt werden.
Beispiele für den Data-Refinery-Flow unter Verwendung des Standardkapazitätstyps 3:
- Ein Data-Refinery-Flow läuft 1 Stunde lang: 1,5 CUHs
- Zwei Data-Refinery-Flows laufen jeweils 1 Stunde lang: 2 Stunden * 1,5 CUHs = 3 CUHs
- Ein Data-Refinery-Flow läuft 30 Minuten lang: 0,5 Stunden * 1,5 CUHs = 0,75 CUHs
- Die interaktive Data-Refinery-Benutzeroberfläche wird 1 Stunde lang verwendet: 1,5 CUHs
Beispiel zu Profilerstellung (Profilerstellungsaufträge können automatisch oder manuell gestartet werden):
- Ein Profilerstellungsauftrag läuft 30 Minuten lang: 0,5 Stunden * 6 CUHs = 3 CUHs
- Ein Profilerstellungsauftrag läuft 9 Minuten lang. In diesem Szenario gilt die Mindestgebühr: 0,16 Stunden * 6 CUHs = 0,96 CUHs
Wie viel Einrichtungsaufwand ist nach Abschluss eines Standard- oder Professionaltarifs erforderlich, um das Produkt voll nutzen zu können?
IBM Watson Knowledge Catalog ist komplett selbstverwaltend, d. h. ein Administrator kann mit der Erstellung eines Katalogs beginnen und dann sofort Assets hinzufügen und kuratieren. Zusätzliche Aufgaben können sein:
- Geschäftsglossar erstellen
- Datenschutzrichtlinien zur Regelung des Zugriffs auf Daten festlegen
- Benutzer zum Katalog einladen
Ist dies auf IBM Cloud Pak® for Data verfügbar?
Ja. Erfahren Sie mehr über diese integrierte Daten- und KI-Plattform von IBM.
IBM Watson Knowledge Catalog testen
Aktivieren Sie mit intelligenter Katalogisierung einsatzbereite Daten für KI und Analysen.