Sie können Tabellen aus mehreren Datenquellen zu einer einzelnen virtuellen Tabelle kombinieren. Dadurch wird eine einheitliche Definition erstellt, die die Spalten und Daten aus allen beteiligten Datenquellen enthält. Diese Tabellen werden als gruppierte Tabellen bezeichnet.
Die Segmentierung erfolgt vertikal (entweder eine Teilmenge oder ein Obermenge von Spalten entsprechend der Auswahl gewünschter Spalten). Sie können Abfragen für die resultierende virtuelle Tabelle auf die gleiche Weise ausführen wie Abfragen für eine der Basistabellen.
Tabellen können in einer einzelnen virtualisierten Tabelle gruppiert werden, wenn die vom Treiber aufgelösten Namen der Tabellen identisch sind (exakte Übereinstimmung inklusive Groß-/Kleinschreibung). Von der Semantik für die Tabellengruppierung werden Spalten mit demselben Namen (ohne Beachtung der Groß-/Kleinschreibung) als Übereinstimmung gewertet. Die Datentypumstufung ist an den Vorrangregeln ausgerichtet.
Sie müssen sicherstellen, dass die Gruppierung von Tabellen logisch ist, insbesondere in Bezug auf die Verarbeitung von Datentypen der als Ergebnis der Gruppierung erstellten gruppierten Tabelle. In einigen Fällen weisen entsprechende Spalten möglicherweise unterschiedliche Datentypen auf. Die resultierenden Datentypen der gruppierten Tabelle werden anhand von Regeln bestimmt. Weitere Informationen finden Sie unter Regeln für Ergebnisdatentypen.
Um unerwartete Ergebnisse zu vermeiden, ist beim Gruppieren von Tabellen zu einer einzelnen virtualisierten Tabelle mit größter Umsicht vorzugehen. Sie können sich beim Erstellen einer gruppierten Tabelle an den folgenden Empfehlungen orientieren, sind jedoch an keine Einschränkungen gebunden:
- Stellen Sie sicher, dass die gleichnamigen Spalten aus allen Tabellen kompatible Datentypen und eine kompatible Geschäftsverwendung aufweisen. Die Domäne der Daten in allen Tabellen muss kompatibel sein.
- Gruppieren Sie Tabellen aus Datenquellen desselben Typs, um eine konsistente Datensemantik zu gewährleisten.
- Wenn Sie Tabellen aus Datenquellen unterschiedlichen Typs gruppieren, stellen Sie sicher, dass die Datensemantik konsistent ist.
- Stellen Sie sicher, dass die Tabellen in der Gruppe vorwiegend gleichnamige Spalten enthalten. Stellen Sie sicher, dass übereinstimmende Spalten kompatible Datentypen aufweisen.
- Es dürfen keine Spalten enthalten sein, die mit komplexen Typen definiert sind.
Hinweis: Einige Datenquellen, wie z. B. Hive, verwenden standardmäßig Kleinbuchstaben für Tabellennamen. Diese Tabellen können nicht mit Tabellen aus anderen Datenquellen gruppiert werden, die standardmäßig Großbuchstaben verwenden, sofern nicht Kennungen mit Begrenzer verwendet werden, um eine exakte Übereinstimmung der Tabellennamen sicherzustellen.
Beachten Sie Folgendes:Die Funktion „Datenanfragen“ ( ) wurde in
Cloud Pak for Data Version entfernt
5.3.0. Ziehen Sie stattdessen
Workflows in Betracht.
Informationen zu dieser Task
Die Schrittfolge beschreibt, wie Daten ohne Geschäftsbegriffe virtualisiert werden. Wenn Sie Ihre virtuellen Daten verwalten möchten, lesen Sie den Abschnitt „Verwalten virtueller Daten“ in Data Virtualization.
Vorgehensweise
- Klicken Sie im Navigationsmenü auf, um das Servicemenü anzuzeigen.
- Klicken Sie im Servicemenü auf und dann auf die Registerkarte „Tabellen “.
Die Liste der Verbindungen wird in der Standardansicht „Explore“ angezeigt. Klicken Sie auf eine Verbindung, ein Schema oder eine Tabelle, um diese auszuwählen und eine Vorschau des Inhalts anzuzeigen.
Die Liste der verfügbaren Tabellen in Ihren Verbindungen wird in der Listen ansicht angezeigt. Sie können die aufgelisteten Tabellen filtern, indem Sie auf der Seite „Datenquellen“ Filter hinzufügen. Darüber hinaus können Sie Tabellen nach Name, Schema, Spalte oder Geschäftsbegriff suchen.
Data Virtualization kann automatisch passende Tabellen vorschlagen, die zu einer einzigen virtuellen Tabelle zusammengefasst werden können.
- Um Tabellen zu einem einzigen virtuellen Objekt zusammenzufassen, klicken Sie auf „Einstellungen“
und wählen Sie im Einstellungsmenü die Option „Tabellen mit identischen Namen gruppieren“ aus.
In der Anzeige wird die vorgeschlagene Gruppierung von Tabellen angezeigt. Im Schritt Überprüfen können Sie noch eine Feinabstimmung für die beteiligten Quellentabellen durchführen.
Die
Liste der verfügbaren Tabellen enthält auch Tabellen, für die keine Leseberechtigung besteht.
- Wenn Sie eine virtuelle Tabelle erstellen, die eine nicht lesbare Tabelle enthält, wählen Sie eine der folgenden Optionen aus, um Ihre virtuelle Tabelle abfragbar zu machen.
- Option 1 Klicken Sie im Aktionsmenü für die Tabelle auf Gruppierte Tabellen bearbeiten und entfernen Sie die nicht lesbare Tabelle aus der Gruppe, die Sie virtualisieren.
- Option 2 Stellen Sie sicher, dass der Benutzer, der der Datenquellenverbindung zugeordnet ist, auf die nicht lesbare Tabelle zugreifen kann. Dieser Schritt kann vor oder nach der Virtualisierung der Tabelle erfolgen.
- Option 3 Erstellen Sie eine Datenquellenverbindung in, Data Virtualization um auf dieselbe Datenquelle mit den Anmeldedaten eines separaten Benutzers zuzugreifen, der Lesezugriff auf die Tabelle hat. Daraufhin wird die Liste
mit zusätzlichen Tabelleninstanzen angezeigt, wenn Sie die Option Tabellen mit identischen
Namen gruppieren auswählen. Vor dem Virtualisieren von Tabellen müssen Sie Tabellen
ohne Lesezugriff, die über die Verbindung des eingeschränkten Benutzers erkannt werden, weiterhin manuell
entfernen (wie in Option 1 beschrieben).
- Wählen Sie die Tabelle aus, die Sie virtualisieren möchten, und klicken Sie auf „Zum Warenkorb hinzufügen “.
- Klicken Sie auf „Warenkorb anzeigen“, um Ihre Auswahl anzuzeigen. In diesem Fenster können Sie auch die Namen der Tabellen und Schemata bearbeiten oder eine Auswahl aus Ihrem Warenkorb entfernen.
- Wählen Sie die geeigneten Freigabeoptionen für die virtualisierte Tabelle aus.
- Wählen Sie „Im Katalog veröffentlichen“, wenn Sie auch in einem ausgewählten Katalog veröffentlichen möchten.
Eine Liste der verfügbaren Kataloge wird im Dropdown-Menü angezeigt. Jeder Katalog wird als
„Governed“ (verwaltet) oder
„Not governed“ (nicht verwaltet) gekennzeichnet.
Hinweis: Sie müssen mindestens einen Katalog in
IBM® Knowledge
Catalog.
Sie müssen über die Berechtigung zum Veröffentlichen in einem Katalog verfügen. Ein Administrator kann aktivieren, ob alle virtuellen Objekte in einem ausgewählten regulierten Katalog veröffentlicht werden, wodurch verhindert wird, dass ein Benutzer in einen angegebenen Katalog veröffentlicht.
- Geben Sie ein Schema im Feld „Schema“ an.
Sie können auch ein Schema erstellen, indem Sie die folgenden Schritte ausführen.
- Wenn Sie die Rolle Data Virtualization „Engineer“ oder „User“ haben, belassen Sie das Feld „Schema“ auf der Standardeinstellung, um ein Schema mit Ihrer Benutzer-ID zu erstellen.
- Wenn Sie über die Data Virtualization Admin -Rolle verfügen, belassen Sie das Feld „Schema“ auf der Standardeinstellung, um ein Schema mit Ihrer Benutzer-ID zu erstellen, oder geben Sie den neuen Schemanamen in das Feld „Schema“ ein.
- Klicken Sie auf „Virtualisieren“, um den Vorgang abzuschließen.
Wenn das Statusfenster angezeigt wird, können Sie auswählen, ob die virtualisierten
Daten angezeigt oder weitere Daten virtualisiert werden sollen. Sie müssen jedoch warten, bis die Virtualisierung abgeschlossen ist, bevor Sie von der Seite weg navigieren.
- Klicken Sie auf „Virtualisierte Daten anzeigen“, um Ihre neu erstellten Tabellen anzuzeigen.
Ergebnisse
Wenn Data Virtualization und im selben OpenShift® Projekt ( IBM Knowledge
Catalog Namespace) installiert sind, wird Ihr virtuelles Objekt im primären Katalog veröffentlicht.