Konfigurieren von „ Data Virtualization “-Verbindungen für den Import von Stammbaumdaten ( MANTA Automated Data Lineage )

Um die Herkunftsdaten für Assets aus Verbindungen zu „ Data Virtualization “ zu importieren, müssen Sie mehrere Konfigurationsschritte durchführen.

Voraussetzungen

Um die Abstammungslinie zu importieren, stellen Sie sicher, dass:

  • Sie verfügen über eine Instanz v Data Virtualization unter Cloud Pak for Data5.2.0 oder höher, bei der die Federal Information Processing Standards (FIPS) deaktiviert sind.

  • Data Virtualization Der Administrator weist Ihnen DV_METADATA_READER die Rolle mithilfe einer SQL-Anweisung GRANT ROLE DV_METADATA_READER TO USER/ROLE/GROUP <auth_id> zu. Die folgenden <auth_id>-Werte sind gültig für ROLE:

    • DV_ADMIN
    • DV_STEWARD
    • DV_ENGINEER
    • DV_USER
  • Sie verfügen über die Rolle „Admin“ oder „Steward“ in Data Virtualization oder über die Berechtigung „SELECT“ für alle Objekte oder Schemata unter Data Virtualization sowie deren Abhängigkeiten, die am Lineage-Import beteiligt sind.

    Alternativ können Sie die Option „Sichtbarkeit einschränken“ deaktivieren, indem Sie den Abschnitt „Verwalten der Sichtbarkeit virtueller Objekte in Data Virtualization “ in der Dokumentation zu „ Cloud Pak for Data “ befolgen.

  • Sie verwenden entweder den Benutzernamen und das Passwort oder den API-Schlüssel als Anmeldedaten, um die Herkunftsdaten von Data Virtualization abzurufen. Use my platform credentials Diese Option funktioniert bei der Stammbaum-Extraktion nicht.

  • Sie verfügen über die Berechtigung „INSPECT“ oder „REF“ für alle Datenquellen in „ Data Virtualization “, aus denen Ihre gescannten virtuellen Tabellen stammen. Beide Berechtigungen können in „ Data Virtualization “ für jede Datenquelle der DV_METADATA_READER Rolle erteilt werden.

Einschränkungen

  • Sie können die Abstammungsstruktur nur aus virtualisierten Tabellen in relationalen Datenquellen extrahieren. Objektspeicher und virtualisierte Dateien sind nicht verfügbar.
  • Die Verknüpfung zur Quelle ist nicht vorhanden, wenn das Quellobjekt ein Alias ist.
  • Die Verknüpfung zur Datenquelle ist nicht hergestellt, wenn innerhalb desselben Schemas in der Datenquelle mehrere Objekte mit demselben Namen vorhanden sind, beispielsweise eine Tabelle und eine Funktion.
  • „Lineage“ ist keine gemeinsam genutzte Asset-Eigenschaft, daher teilen sich Duplikate von Assets im Katalog und im Projekt diese Eigenschaft nicht.
  • Assets, die über den Import von Abstammungsmetadaten importiert wurden, werden nicht mit den unter Data Virtualization veröffentlichten Assets abgleichen. Im Zielkatalog werden neue Datenbestände angelegt.
  • Assets mit Verknüpfungen werden nur importiert, wenn ein anderes verbundenes Asset ebenfalls in demselben Auftrag enthalten ist. Beispielsweise wird eine virtuelle Tabelle nicht separat importiert, es sei denn, ihre Datenquelle oder eine abgeleitete Ansicht wird ebenfalls in den Import einbezogen.

Vorgehensweise

  1. Erstellen Sie in dem Projekt, in dem der Importauftrag für die Metadaten-Herkunft ausgeführt werden soll, eine neue, eigenständige Verbindung zu „ Data Virtualization “.

  2. Laden Sie das Zertifikat „ Data Virtualization “ unter SSL von CP4D herunter: Menü > Daten > Data virtualization > Menü > Verbindung konfigurieren > Zertifikat „ SSL “ herunterladen.

  3. Erstellen Sie in dem Projekt, in dem Sie den MDI-Lineage-Job ausführen, eine neue Verbindung, die nicht zur „Platform“ gehört ( Data Virtualization ), mit genau denselben Angaben wie bei der „ Data Virtualization “-Plattformverbindung unter „ CP4D “ > „Menü“ > „Daten“ > „Verbindungen“, und geben Sie den Inhalt des Zertifikats „ SSL “ in das Feld „ SSL “-Zertifikat ein.

  4. Verwenden Sie diese Verbindung, um den Importauftrag für die Metadaten-Herkunftsverfolgung auszuführen.