Optim High Performance Unload konfiguration für Big Data, Db2, Object Storage oder PostgreSQL
In diesem Kapitel werden die erforderliche Konfigurationsdatei und die erforderlichen Parameter für Big Data-, Db2®-, Object Storage -oder PostgreSQL -Ziele beschrieben.
Beschreibung der Konfigurationsdatei
Optim™ High Performance Unload kann mit Big Data, Db2, Object Storage oder PostgreSQL interagieren, die über die LOADDEST-Klausel angegeben werden, um die Daten, die mit Optim High Performance Unload extrahierten Daten an diese Ziele. Diese Interaktionen können darin bestehen, Daten automatisch zu migrieren oder einen Datenübertragungsbefehl zu generieren, der zu einem späteren Zeitpunkt ausgeführt werden soll. Als Big-Data-Ziele werden unter anderem NoSQL- oder Hadoop-Ziele unterstützt. Die unterstützten Db2 -Ziele sind die Db2 -Standardziele, die lokal katalogisierten fernen Datenbanken und die Db2 Warehouse -Ziele. Zu den unterstützten Object Storage -Zielen gehören IBM Cloud Object Storage oder Amazon EC2 oder Amazon S3 oder S3, die mit Swift oder Microsoft Azure oder Dateisystemen kompatibel sind.
Eine andere Art der Interaktion besteht darin, Optim High Performance Unload zur Vorbereitung der Erstellung einer externen Db2 -Tabelle auf der Grundlage einer Datendatei, die sich an einem entfernten Standort befindet: entweder in einer S3 -kompatiblen Umgebung oder in einer Microsoft Azure -Umgebung oder auf einem entfernten Server. Optim High Performance Unload ermöglicht die Erstellung eines Befehls, der für die anschließende Erstellung einer solchen Tabelle bereit ist: Der für die Datendatei zu berücksichtigende Remote-Speicherort kann über die FORMAT EXTERNAL-Klausel angegeben werden. Optim High Performance Unload ermöglicht auch die Erstellung eines Befehls, der zum Hochladen der Datendatei an den erwarteten Speicherort bereit ist: Dieser Speicherort kann über die LOADDEST-Klausel angegeben werden, wobei die unterstützten zugehörigen Ziele Amazon S3, Microsoft Azure und Dateisystemziele sind.
- eine Big-Data-Umgebung,
- Db2 Warehouse -Datenbank
- eine Db2 -Standarddatenbank und die entsprechende Klausel LOADDEST enthält die Spezifikation eines Aliasnamens,
- Eine ferne Db2 -Datenbank und die entsprechende Klausel LOADDEST enthält die Angabe eines Knotennamens oder der zugehörigen Option WITH STANDARD AUTH.
- Object Storage -Umgebung
- Eine PostgreSQL -Umgebung.
- Ein Abschnittsname, zwischen eckigen Klammern angegeben, der das zugehörige Ziel angibt. Beachten Sie, dass beim Wert für den Abschnittsnamen Groß-/Kleinschreibung beachtet werden muss. Folgende Werte sind für den Abschnittsnamen möglich:
- Db2: Dies ist der Wert, der für einen Abschnitt in Bezug auf eine Db2 -Standarddatenbank verwendet werden soll.
- RemoteDB2: Dies ist der Wert, der für einen Abschnitt relativ zu einer lokal katalogisierten fernen Db2 -Datenbank verwendet werden soll.
- Warehouse: Dies ist der Wert, der für einen Abschnitt relativ zu einer Db2 Warehouse -Umgebung verwendet werden soll.
- Cloudant: dieser Wert soll für einen Abschnitt verwendet werden, der sich auf eine NoSQL-Umgebung bezieht, die zu einer Cloudant-Datenbank gehört
- CouchDB: dieser Wert soll für einen Abschnitt verwendet werden, der sich auf eine NoSQL-Umgebung bezieht, die zu einer CouchDB-Datenbank gehört
- MongoDB: dieser Wert soll für einen Abschnitt verwendet werden, der sich auf eine NoSQL-Umgebung bezieht, die zu einer MongoDB-Datenbank gehört
- HDFS: dieser Wert soll für einen Abschnitt verwendet werden, der sich auf eine Hadoop-Umgebung bezieht, die zu einem HDFS-Dateisystem gehört
- Hive: dieser Wert soll für einen Abschnitt verwendet werden, der sich auf eine Hadoop-Umgebung bezieht, die zu einer Hive-Datenbank gehört
- HBase: dieser Wert soll für einen Abschnitt verwendet werden, der sich auf eine Hadoop-Umgebung bezieht, die zu einer HBase-Datenbank gehört
- MapReduce: dieser Wert soll für einen Abschnitt verwendet werden, der sich auf ein angepasstes MapReduce-Dienstprogramm für eine Hadoop-Umgebung bezieht
- IBM_COS: Dies ist der Wert, der für einen Abschnitt in Bezug auf eine IBM Cloud Object Storage -Umgebung verwendet werden soll
- AWS_EC2: : Dies ist der Wert, der für einen Abschnitt in Bezug auf eine Amazon EC2 -Umgebung verwendet werden soll
- AWS_S3: dies ist der Wert, der für einen Abschnitt in einer mit Amazon S3 oder S3 kompatiblen Umgebung verwendet werden soll
- Swift: dieser Wert soll für einen Abschnitt verwendet werden, der sich auf eine Swift-Umgebung bezieht
- Azure: Dies ist der Wert, der für einen Abschnitt relativ zu einer Microsoft Azure -Umgebung verwendet werden soll.
- FileSystem: dies ist der Wert, der für einen Abschnitt in Bezug auf eine Dateisystemumgebung verwendet werden soll
- PostgreSQL: dies ist der Wert, der für einen Abschnitt in einer PostgreSQL -Umgebung verwendet werden soll
- Eine Parameterliste, die unter anderem einige obligatorische Parameter enthält und in der jeder Parameter im Format Name=Wert angegeben wird.
Das Erstellen und Füllen einer solchen Datei ohne Angabe einer Klausel LOADDEST oder ohne Angabe einer Klausel FORMAT EXTERNAL mit der Option S3 oder AZURE ist nutzlos. Wenn jedoch ein bestimmtes Ziel über die Klausel LOADDEST angegeben wird und ein zugehöriger Datenübertragungsbefehl generiert werden muss, ist das Vorhandensein eines Abschnitts für das betreffende Ziel in der Datei db2hpu.dest zwingend erforderlich. Und wenn für ein bestimmtes Ziel, das über die Klausel FORMAT EXTERNAL mit der Option S3 oder AZURE angegeben wird, ein zugeordneter Befehl zur Erstellung einer externen Tabelle generiert werden muss, ist es obligatorisch, dass ein Abschnitt, der diesem Ziel entspricht, in der Datei db2hpu.dest vorhanden ist.
Parameter, die für ein Standard-Ziel von Db2 spezifisch sind
- Aliasname
- Obligatorischer Parameter. Für den Wert muss die Groß-/Kleinschreibung beachtet werden. Dieser Parameter ist das Kriterium, mit dem bestimmt werden kann, ob der zugehörige Abschnitt zu berücksichtigen ist, relativ zu einer Klausel LOADDEST in einer Steuerdatei, in der dieser Aliasname angegeben ist.
- Datenbankname
- Optionaler Parameter. Er ermöglicht die Angabe des Datenbanknamens, der für Db2 Load verwendet werden soll. Wenn dieser Parameter nicht angegeben wird, wird stattdessen der Datenbankname verwendet, der über die Option CONNECT im GLOBAL-Block angegeben wurde.
- Instanz
- In einem Migrationsszenario ist dies obligatorisch, stattdessen ist es optional. Verwenden Sie diesen Parameter, um den Namen einer Db2 -Instanz anzugeben. In einem Migrationsszenario ist dies der Name der Db2 -Zielinstanz. Wenn sie in einem Entladeszenario festgelegt ist, ermöglicht sie die erneute Partitionierung von Daten. Wenn im selben Abschnitt db2hpu.dest kein Parameter ‘host’ oder ‘file’ definiert ist, wird die Datei db2nodes.cfg berücksichtigt, die diesem Db2 -Instanznamen auf der aktuellen Maschine zugeordnet ist. Wenn der Parameter ‘host’ oder ‘file’ festgelegt ist, wird die Db2 -Knotenkonfigurationsdatei, die berücksichtigt werden soll, anders bestimmt.
- Organisator
- Optionaler Parameter. Wenn der Parameter ‘instance’ festgelegt ist, geben Sie mit diesem Parameter den Namen einer Maschine an, auf der sich die Datei befindet, die die zu berücksichtigenden Db2 -Knoten definiert. Wenn der Parameter ‘file’ nicht festgelegt ist, wird die Datei db2nodes.cfg auf diesem System berücksichtigt, die der Db2 -Instanz zugeordnet ist, deren Name auf ‘instance’ gesetzt ist. Wenn der Parameter ‘file’ gesetzt ist, ist sein Wert die Datei, die auf diesem System berücksichtigt wird. Bei der Migration von Daten ist die Maschinengruppe die Maschine, auf der das Laden der Daten der Migration über einen Aufruf der Db2 -Lade-API ausgeführt wird. Wenn der Parameter ‘instance’ nicht festgelegt ist, geben Sie mit diesem Parameter die Maschine an, auf der die zu generierenden Dateien erstellt werden.
- host_ist_windows
- Optionaler Parameter. Es ist nutzlos, wenn Daten migriert werden. Gültige Werte sind 'yes' und 'no '. Wenn dieser Parameter nicht festgelegt ist, entspricht der Wert standardmäßig dem Typ der Quellenmaschine. Dieser Parameter ermöglicht die Angabe des Typs der Maschine, auf der der Db2 -Ladebefehl generiert wird. Wenn es sich um eine „ Unix “-Option handelt, muss der Parameterwert auf „no“ gesetzt werden. Wenn es sich um ein Windows-System handelt, muss der Parameterwert auf 'yes' gesetzt werden. Wenn die Klausel WORKING IN in der Steuerdatei angegeben wird und dieser Parameter ebenfalls angegeben wird, müssen ihre Werte entsprechend festgelegt werden. Wenn es sich bei dem Rechner, auf dem der Befehl „ Db2 Load“ generiert wird, um einen Rechner vom Typ „ Unix “ handelt, muss die Klausel „WORKING IN“ mit einem Pfad vom Typ „ Unix “ angegeben werden, und dieser Parameterwert muss auf „no“ gesetzt werden. Wenn es sich bei dem Rechner, auf dem der Befehl „ Db2 Load“ generiert wird, um einen Windows-Rechner handelt, muss die WORKING IN-Klausel mit einem Windows-Pfad angegeben werden, und dieser Parameterwert muss auf „yes“ gesetzt werden. Wenn der Parameter ‘host’ nicht oder auf die aktuelle Maschine gesetzt ist, ist die Einstellung dieses Parameters nutzlos.
- Datei
- Geben Sie mit diesem Parameter einen Dateinamen an, der die Definition von Db2 -Knoten enthält. Die Maschine, auf der sich diese Datei befindet, kann mit dem Parameter ‘host’ festgelegt werden. Sie können die Datei db2nodes.cfg der Db2 -Zielinstanz direkt angeben oder Sie können eine beliebige Datei angeben, sofern ihr Inhalt für eine Db2 -Knotendatei gültig ist. Wenn sich beispielsweise die Datei mynodes.cfg , die die Zieldatenbankpartitionen definiert, im Verzeichnis /tmp befindet, verwenden Sie Folgendes: file=/tmp/mynodes.cfg
- REPART
- Dieser Parameter ermöglicht das Verhalten beim Mechanismus zur erneuten Partitionierung von Daten. Wenn die Funktion zur erneuten Partitionierung verwendet wird, stützt sie sich auf den Aufruf einer entsprechenden Db2 -API, die unter dem Decknamen aufgerufen wird. Welche API genau aufgerufen wird, hängt von der Größe der betroffenen Partitionszuordnung ab. Es gibt zwei Möglichkeiten, die Ausführung einer erneuten Datenpartitionierung zu beeinflussen:
- Sie können die Verarbeitung der Daten im Schritt zur erneuten Datenpartitionierung inaktivieren. Diese Funktion kann bei einer Datenmigration nützlich sein, bei der der Schritt der Neupartitionierung, wie er von Optim High Performance Unload nicht geeignet wäre.
- Sie können die Verwendung der entsprechenden Db2 -API für die Größe der Partitionszuordnung erzwingen, die an der Zielumgebung beteiligt ist, die bei der erneuten Datenpartitionierung berücksichtigt wird. Diese Funktionalität kann bei einer Datenmigration nützlich sein, bei der die Größe der Partitionszuordnung sich zwischen Quellen -und Zielumgebung unterscheidet.
- NO: ermöglicht die Inaktivierung der erneuten Partitionierung in der betroffenen Task. Bei einer automatischen Migration für eine DPF-Umgebung werden die von der Quellenumgebung gelesenen Daten standardmäßig über mehrere Datenströme verteilt. Diese Datenströme werden entsprechend der Zielumgebungstopologie erstellt und vom Db2 -Ladedienstprogramm verarbeitet, das unter den Abdeckungen in der Zielumgebung gestartet wird. Wenn Sie den Parameter ‘repart’ auf 'no' setzen, wird der Schritt zur erneuten Partitionierung inaktiviert. Dies hat zur Folge, dass die Daten über einen eindeutigen Datenstrom migriert werden und die erneute Partitionierung auf der Ebene des Db2 -Dienstprogramms LOAD ausgeführt wird.
- PMAP_4K: ermöglicht die Angabe, dass die Partitionszuordnung für den Schritt zur erneuten Partitionierung eine Größe von 4 KB hat. Daher wird dieser Schritt unter Verwendung der Db2 -API für Datenhashing basierend auf der Verwendung von 4K -Partitionszuordnungen ausgeführt.
- PMAP_32K: ermöglicht die Angabe, dass die Partitionszuordnung für den Schritt zur erneuten Partitionierung eine Größe von 32 KB hat. Daher wird dieser Schritt unter Verwendung der Db2 -API für Datenhashing basierend auf der Verwendung von 32K -Partitionszuordnungen ausgeführt. Dieser Wert kann nur verwendet werden, wenn die betroffene Db2 -Version mindestens V9.7ist.
- Ausnahmebedingungsteile
- Mit diesem Parameter können Sie die Datenbankpartitionsnummern definieren, die Sie vom Layout der Zieldatenbankpartition ausschließen wollen. Wenn Sie die Zielausgabedateien generieren, können Sie einige Datenbankpartitionsnummern von den Datenbankpartitionsnummern ausschließen, die in der Datei db2nodes.cfg definiert sind.
- Nutzer
- Verwenden Sie diesen Parameter, um einen Zielmandanten auszuwählen, der berücksichtigt werden soll, wenn Optim High Performance Unload für eine Aufgabe, die eine Zielumgebung Db2 erfordert, entweder für eine Datenmigration oder für die Generierung eines Db2 -Ladebefehls Wenn dieser Parameter nicht angegeben wird, wird standardmäßig der Mandant mit dem Namen SYSTEM berücksichtigt.
Spezifische Parameter für ferne Db2 -Ziele
- Datenbankname
- Wenn eine Authentifizierungsmethode in einer Klausel LOADDEST in einer Steuerdatei angegeben wird, ist sie obligatorisch. Es ist stattdessen nutzlos. Er ermöglicht die Angabe des Datenbanknamens, der für Db2 Load verwendet werden soll.
- Organisator
- Optionaler Parameter. Beim Entladen von Daten können die zu generierenden Dateien auf der angegebenen Maschine erstellt werden. Bei der Migration von Daten kann der Name der Maschine, auf der das Laden der Daten der Migration ausgeführt werden soll, über einen Aufruf der Db2 -Lade-API angegeben werden.
- host_ist_windows
- Optionaler Parameter. Es ist nutzlos, wenn Daten migriert werden. Gültige Werte sind 'yes' und 'no '. Wenn dieser Parameter nicht festgelegt ist, entspricht der Wert standardmäßig dem Typ der Quellenmaschine. Dieser Parameter ermöglicht die Angabe des Typs der Maschine, auf der der Db2 -Ladebefehl generiert wird. Wenn es sich um eine „ Unix “-Option handelt, muss der Parameterwert auf „no“ gesetzt werden. Wenn es sich um ein Windows-System handelt, muss der Parameterwert auf 'yes' gesetzt werden. Wenn die Klausel WORKING IN in der Steuerdatei angegeben wird und dieser Parameter ebenfalls angegeben wird, müssen ihre Werte entsprechend festgelegt werden. Wenn es sich bei dem Rechner, auf dem der Befehl „ Db2 Load“ generiert wird, um einen Rechner vom Typ „ Unix “ handelt, muss die Klausel „WORKING IN“ mit einem Pfad vom Typ „ Unix “ angegeben werden, und dieser Parameterwert muss auf „no“ gesetzt werden. Wenn es sich bei dem Rechner, auf dem der Befehl „ Db2 Load“ generiert wird, um einen Windows-Rechner handelt, muss die WORKING IN-Klausel mit einem Windows-Pfad angegeben werden, und dieser Parameterwert muss auf „yes“ gesetzt werden. Wenn der Parameter ‘host’ nicht oder auf die aktuelle Maschine gesetzt ist, ist die Einstellung dieses Parameters nutzlos.
- Knoten
- Optionaler Parameter. Er muss in Verbindung mit einem fernen Db2-Knotennamen festgelegt werden. Für den Wert muss die Groß-/Kleinschreibung beachtet werden. Für eine Migrationstask muss der Parameter festgelegt werden; er wird zum Abrufen der zugehörigen Berechtigungsnachweise verwendet. In diesem Fall muss der zugehörige Wert mit dem Namen eines Abschnitts des Typs 'remote' übereinstimmen, der in der Berechtigungsnachweisdatei erstellt wurde. Wenn bei der Generierung eines Db2 -Ladebefehls ein Knotenname in einer Klausel LOADDEST in einer Steuerdatei angegeben wird, muss er ebenfalls festgelegt werden. In diesem Fall wird anhand dieses Parameters festgelegt, dass der zugehörige Abschnitt berücksichtigt werden muss.
Für Db2 Warehouse -Ziele spezifische Parameter
- Aliasname
- Optionaler Parameter. Für den Wert muss die Groß-/Kleinschreibung beachtet werden. Er muss gesetzt werden, wenn ein Aliasname in einer Klausel LOADDEST in einer Steuerdatei angegeben wird. In diesem Fall wird anhand dieses Parameters festgelegt, dass der zugehörige Abschnitt berücksichtigt werden muss. Wenn für eine Migrationstask eine Standardauthentifizierungsmethode in einer Klausel LOADDEST angegeben wird, muss sie ebenfalls festgelegt werden. In diesem Fall muss der Wert mit dem Namen eines Abschnitts übereinstimmen, der in der Berechtigungsnachweisdatei für den betreffenden Zieltyp erstellt wurde.
- binpath
- Optionaler Parameter. Es ist nutzlos, wenn Daten migriert werden, die die Db2 -Lade-API aufrufen. Er ermöglicht die Angabe eines Verzeichnisses, das beim Erstellen des Hochladebefehls verwendet wird, indem es dem Namen des Upload-Tools vorangestellt wird, um Probleme beim Auffinden zu vermeiden, wenn versucht wird, es für den endgültigen Hochladeprozess auszuführen. Es muss sich um einen gültigen absoluten Pfad handeln.
- curl
- Optionaler Parameter. Gültige Werte sind 'yes' und 'no '. Wenn dieser Parameter nicht festgelegt ist, lautet der Wert standardmäßig 'no'. Wenn der Parameter ‘curl’ auf "no" oder "unspecified" gesetzt ist, basiert das Laden von Daten auf dem CLPPlus-Tool für die Generierung eines Hochladebefehls oder auf der Db2 Load-API für eine automatische Migration. Andernfalls wird, wenn der Parameter ‘curl’ auf "Ja" gesetzt ist, das Tool cURL, sowohl für die Generierung von Upload-Befehlen als auch für die automatische Migration verwendet.
- url
- Obligatorischer Parameter. Ermöglicht die Angabe der URL des betroffenen Db2 Warehouse -Servers.
- Anschluss
- Er ist nur obligatorisch, wenn der Parameter ‘curl’ nicht angegeben oder auf 'no' gesetzt ist. Er ist stattdessen nutzlos. Ermöglicht die Angabe der Portnummer des betroffenen Db2 Warehouse -Servers.
- Datenbankname
- Er ist nur obligatorisch, wenn der Parameter ‘curl’ nicht angegeben oder auf 'no' gesetzt ist. Er ist stattdessen nutzlos. Er ermöglicht die Angabe des Datenbanknamens, der für das Hochladen verwendet werden soll.
- Organisator
- Optionaler Parameter. Beim Entladen von Daten können die zu generierenden Dateien auf der angegebenen Maschine erstellt werden. Bei einer Migration mit dem Tool cURL erfolgt das Laden der Daten der Migration durch Generieren und Ausführen eines Hochladebefehls. Bei einer Migration ohne Verwendung des Tools cURL erfolgt das Laden der Daten der Migration durch Aufrufen der Db2 -Lade-API. Dieser Parameter ermöglicht die Angabe des Namens der Maschine, auf der das Laden von Daten für die Migration ausgeführt werden soll.
- host_ist_windows
- Optionaler Parameter. Es ist nutzlos, wenn Daten migriert werden, die die Db2 -Lade-API aufrufen. Gültige Werte sind 'yes' und 'no '. Wenn dieser Parameter nicht festgelegt ist, entspricht der Wert standardmäßig dem Typ der Quellenmaschine. Mit diesem Parameter können Sie den Typ der Maschine angeben, auf der der Befehl zum Laden von Daten generiert oder ausgeführt wird. Wenn es sich um eine „ Unix “-Option handelt, muss der Parameterwert auf „no“ gesetzt werden. Wenn es sich um ein Windows-System handelt, muss der Parameterwert auf 'yes' gesetzt werden. Wenn die Klausel WORKING IN in der Steuerdatei angegeben wird und dieser Parameter ebenfalls angegeben wird, müssen ihre Werte entsprechend festgelegt werden. Wenn es sich bei der Datenlademaschine um eine „ Unix “-Maschine handelt, muss die WORKING IN-Klausel mit einem „ Unix “-Pfad angegeben werden, und dieser Parameterwert muss auf „no“ gesetzt werden. Wenn es sich bei der Datenlademaschine um eine Windows-Maschine handelt, muss die Klausel WORKING IN mit einem Windows-Pfad angegeben werden, und dieser Parameterwert muss auf yes gesetzt werden. Wenn der Parameter ‘host’ nicht oder auf die aktuelle Maschine gesetzt ist, ist die Einstellung dieses Parameters nutzlos. Wenn der Parameter ‘binpath’ festgelegt ist und auch dieser Parameter angegeben wird, müssen ihre Werte entsprechend festgelegt werden: Der Wert des Parameters ‘binpath’ muss mit einem absoluten Pfad festgelegt werden, der für den Typ der Datenlademaschine gültig ist.
- ssl
- Optionaler Parameter. Gültige Werte sind 'yes' und 'no '. Wenn dieser Parameter nicht festgelegt ist, hat er standardmäßig den Wert 'no'. Sie wird nur berücksichtigt, wenn die Verwendung der Db2 -Lade-API für eine automatische Migration berücksichtigt wird. Sie ist stattdessen nutzlos. Wenn Sie eine automatische Migration unter Verwendung der „ Db2 “-Load-API in Betracht ziehen, können Sie durch Setzen dieses Parameters auf „yes“ eine „ SSL “-Verbindung anstelle einer Standardverbindung herstellen. Die im Port-Parameter angegebene Portnummer muss sich auf eine Portnummer des „ SSL “ beziehen.
Wenn Sie das CLPPlus-Tool oder die Db2 -API Load verwenden, müssen Sie sich bei der betreffenden Db2 Warehouse -Webkonsole anmelden, um die zu konfigurierenden Werte für URL, Port und Datenbankname abzurufen. Bei der Webkonsole muss der Menüpunkt für Verbinden und dann der Menüpunkt für die Verbindungsinformationen ausgewählt werden. Die gesuchten Informationen finden Sie entweder auf der Registerkarte „Verbindung ohne SSL “ oder auf der Registerkarte „Verbindung mit SSL “, jeweils zugeordnet zu den Feldern „Hostname“, „Portnummer“ und „Datenbankname“.
Parameter für Big Data-und Object Storage -Ziele
- Aliasname
- Optionaler Parameter. Für den Wert muss die Groß-/Kleinschreibung beachtet werden. Sie muss festgelegt werden, wenn ein Alias in einer Klausel LOADDEST oder einer Klausel FORMAT EXTERNAL mit der Option S3 oder AZURE in einer Steuerdatei angegeben wird. In diesen Fällen ist dieser Parameter das Kriterium, mit dem bestimmt werden kann, ob der zugehörige Abschnitt berücksichtigt werden soll. Für eine Migrationstask in ein NoSQL -oder Swift-Ziel muss sie ebenfalls festgelegt werden, wenn eine Standardauthentifizierungsmethode in einer Klausel LOADDEST angegeben wird. Für eine Migrationsaufgabe zu einem IBM Cloud Object Storage - oder Amazon S3 - oder S3 -kompatiblen Ziel muss, wenn die Migration auf der Verwendung des cURL -Tools basiert, auch dieses eingestellt werden. Für eine Migrationsaufgabe zu einem Azure -Ziel muss, wenn die Migration nicht auf der Verwendung des cURL -Tools basiert, auch dieses eingestellt werden. In diesen Migrationsfällen muss der Wert mit dem Namen eines Abschnitts übereinstimmen, der in der Anmeldedatei für den betreffenden Zieltyp erstellt wurde.
- binpath
- Optionaler Parameter. Er ermöglicht die Angabe eines Verzeichnisses, das beim Erstellen des Hochladebefehls verwendet wird, indem es dem Namen des Upload-Tools vorangestellt wird, um Probleme beim Auffinden zu vermeiden, wenn versucht wird, es für den endgültigen Hochladeprozess auszuführen. Es muss sich um einen gültigen absoluten Pfad handeln.
- Organisator
- Optionaler Parameter. Beim Entladen von Daten können die zu generierenden Dateien auf der angegebenen Maschine erstellt werden. Bei der Migration von Daten kann der Name der Maschine angegeben werden, auf der der für die Datenmigration zu verwendende Hochladebefehl generiert und ausgeführt wird.
- host_ist_windows
- Optionaler Parameter. Gültige Werte sind 'yes' und 'no '. Wenn dieser Parameter nicht festgelegt ist, entspricht der Wert standardmäßig dem Typ der Quellenmaschine. Mit diesem Parameter können Sie den Typ der Maschine angeben, auf der der Hochladebefehl generiert oder ausgeführt wird. Wenn es sich um eine „ Unix “-Option handelt, muss der Parameterwert auf „no“ gesetzt werden. Wenn es sich um ein Windows-System handelt, muss der Parameterwert auf 'yes' gesetzt werden. Wenn die Klausel WORKING IN in der Steuerdatei angegeben wird und dieser Parameter ebenfalls angegeben wird, müssen ihre Werte entsprechend festgelegt werden. Wenn es sich bei dem Upload-Rechner um einen „ Unix “-Rechner handelt, muss die WORKING IN-Klausel mit einem „ Unix “-Pfad angegeben werden, und dieser Parameterwert muss auf „no“ gesetzt werden. Wenn es sich bei der Uploadmaschine um ein Windows-System handelt, muss die Klausel WORKING IN mit einem Windows-Pfad angegeben werden, und dieser Parameterwert muss auf yes gesetzt werden. Wenn der Parameter ‘host’ nicht oder auf die aktuelle Maschine gesetzt ist, ist die Einstellung dieses Parameters nutzlos. Wenn der Parameter ‘binpath’ festgelegt ist und auch dieser Parameter angegeben wird, müssen deren Werte entsprechend festgelegt werden: Der Parameterwert ‘binpath’ muss mit einem absoluten Pfad festgelegt werden, der für den Typ der Uploadmaschine gültig ist.
Für NoSQL-Ziele vorgesehene Parameter
- url
Obligatorischer Parameter. Er ermöglicht die Angabe der URL des betreffenden NoSQL-Ziels. Bei Bedarf kann nach der URL auch eine Portnummer mit dem folgenden Muster hinzugefügt werden: < url>: < port>.
- Datenbankname
- Für Cloudant- und MongoDB-Ziele ist der Parameter obligatorisch, für andere Ziele wird er nicht benötigt. Er ermöglicht die Angabe des Datenbanknamens, der für die hochgeladenen JSON-Dokumente verwendet werden soll.
- collectionname
- Kann nur für das MongoDB-Ziel verwendet werden, für das er angegeben werden muss. Er ermöglicht die Angabe des Objektgruppennamens, der für die hochgeladenen JSON-Dokumente verwendet werden soll.
Für Hadoop-Ziele vorgesehene Parameter
- hdfspath
- Kann in Verbindung mit jedem Zielschlüsselwort verwendet werden und ist obligatorisch. Mit diesem Parameter muss eine Speicherposition auf dem zugehörigen HDFS-Dateisystem angegeben werden. Im Falle des Schlüsselworts für das HDFS-Ziel entspricht diese Speicherposition der endgültigen Speicherposition, an die die Datei, die die extrahierten Daten enthält, kopiert werden muss. Im Falle der anderen Schlüsselwörter entspricht sie der temporären Speicherposition, an die die Datei mit den extrahierten Daten für einen nachfolgenden Hochladebefehl für diese Kopie kopiert wird. Die angegebene Speicherposition muss vorhanden sein, bevor der Kopierschritt ausgeführt wird, da andernfalls vom HDFS-Dateisystem ein Fehler zurückgegeben wird, wenn dieser Schritt ausgeführt wird. Diese Speicherposition muss außerdem einem absoluten HDFS-Pfad entsprechen, bei dem es sich zwingend um einen wie bei UNIX verwendeten HDFS-Pfad handeln muss.
- pig
- Kann nur in Verbindung mit dem Schlüsselwort für das HBASE-Ziel verwendet werden und ist optional. Der Wert kann yes oder nosein. Ist dieser Parameter nicht festgelegt, lautet der Wert standardmäßig no. Zum Hochladen von Daten an ein HBase-Ziel können zwei Tools verwendet werden (hadoop oder pig). Das verwendete Tool ist, wenn der pig -Parameter auf "no" gesetzt oder nicht angegeben ist, "hadoop ", zusammen mit der Verwendung eines MapReduce -Programms, das mit Optim High Performance Unload und “HBaseMapReduce.jar" genannt wird. Wenn der Parameter pig auf 'yes' gesetzt ist, wird das Tool pig verwendet.
- url
- Kann nur in Verbindung mit dem Schlüsselwort für das HIVE-Ziel verwendet werden und ist in diesem Fall obligatorisch. Mit ihm muss eine JDBC-URL angegeben werden, die einer Hive-Datenbank entspricht. Die hier angegebene URL muss unbedingt einer bereits funktionierenden URL entsprechen. Das für die Spezifikation dieser URL erwartete Muster variiert abhängig davon, ob eine zugehörige Authentifizierungsmethode angegeben wurde oder nicht:
- ohne Authentifizierung:
jdbc:hive2://<hivehost>:<port>/<db> - mit Kerberos-Authentifizierung:
jdbc:hive2://<hivehost>:<port>/<db>;principal=<Hive_Principal>
Wenn mit Kerberos-Authentifizierung gearbeitet wird, müssen zwei unterschiedliche Kerberos-Prinzipale berücksichtigt und angegeben werden:- einer muss für den vorausgehenden Authentifizierungsschritt vor dem Hochladebefehl über den zugehörigen Parameter user in der Konfigurationsdatei db2hpu.dest angegeben werden
- einer muss am Ende der JDBC-URL-Spezifikation angegeben werden und dem Hive-Administrator entsprechen.
- ohne Authentifizierung:
- Befehl
- Kann nur in Verbindung mit dem Schlüsselwort MAPREDUCE verwendet werden und ist in diesem Fall obligatorisch. Der Parameter ermöglicht die Angabe einer partiellen Befehlszeile auf Basis der Verwendung eines eigenen MapReduce-Programms und die gleichzeitige Angabe von optionalen Befehlszeilenargumenten, die an die Befehlszeile übergeben werden sollen. Diese Zeichenfolgespezifikation wird anschließend für die Generierung des effektiven Hochladebefehls verwendet.
Parameter, die für IBM Cloud Object Storage -Ziele spezifisch sind
- curl
- Optionaler Parameter. Gültige Werte sind 'yes' und 'no '. Wenn dieser Parameter nicht festgelegt ist, lautet der Wert standardmäßig 'no'. Wenn der Parameter 'curl' auf "nein" oder "unspezifiziert" gesetzt ist, kann das in Betracht gezogene Tool je nach Wert des Parameters 'ibmcloud' IBM Cloud CLI oder AWS CLI für die Generierung von Upload-Befehlen oder die automatische Migration sein. Andernfalls wird, wenn der Parameter 'curl' auf "Ja" gesetzt ist, das Tool cURL, sowohl für die Generierung von Upload-Befehlen als auch für die automatische Migration verwendet.
- ibmcloud
- Optionaler Parameter. Gültige Werte sind 'yes' und 'no '. Wenn dieser Parameter nicht festgelegt ist, lautet der Wert standardmäßig "Ja". Wenn der Parameter 'ibmcloud' auf "Ja" oder "Nicht angegeben" gesetzt ist, wird das Tool IBM Cloud CLI sowohl für die Generierung von Upload-Befehlen als auch für die automatische Migration berücksichtigt. Andernfalls, wenn der Parameter 'ibmcloud' auf "nein" gesetzt ist, wird das Tool AWS CLI verwendet, sowohl für die Generierung von Upload-Befehlen als auch für die automatische Migration.
- bucket
- Obligatorischer Parameter. Es ermöglicht die Angabe des Namens des betreffenden IBM Cloud Object Storage -Buckets.
- relativepath
- Optionaler Parameter. Es ermöglicht die Angabe des relativen Pfads, in den die von Optim High Performance Unload hochgeladen werden.
- filemaxsize
- Optionaler Parameter. Er ermöglicht die Angabe der Dateigrößenbegrenzung für die generierten Ausgabedateien. Dieser Parameter muss auf einen numerischen Wert gesetzt werden, der in Megabyte angegeben wird. Sein Wert muss zwischen 4 und 10485760 liegen ( 10TB ), wobei Letzteres die Obergrenze für die Objektgröße von IBM Cloud Object Storage ist. Wenn eine Dateigrößenbegrenzung über den Befehl ulimit festgelegt wurde, muss dieser Parameterwert kleiner als der festgelegte Grenzwert sein. Wenn eine Klausel FILEMAXSIZE in einer Steuerdatei angegeben wurde, muss der für sie angegebene Wert kleiner als dieser Parameterwert sein.
- accesskey
- Er ist nur obligatorisch, wenn der Parameter 'curl' auf 'yes' gesetzt ist. Er ist stattdessen nutzlos. Ermöglicht die Angabe des Zugriffsschlüssels des Benutzerkontos.
- Version
- Er ist optional, wenn der Parameter 'curl' auf 'yes' gesetzt ist. Er ist stattdessen nutzlos. Sie entspricht der Signaturversion, die für das Hochladen der Daten in den IBM Cloud Object Storage -Ordner verwendet wird. Der Wert kann 2 oder 4 sein. Wenn dieser Parameter nicht festgelegt ist, ist der Wert standardmäßig 4. Bei Angabe der Signaturversion 2 wird der zugrunde liegende Hash-Algorithmus SHA-1 verwendet. Mit der Signaturversion 4 wird der Algorithmus SHA-256 für das Hashing verwendet.
- encrypt
- Es ist optional, wenn der Parameter 'curl' auf "Ja" oder der Parameter 'ibmcloud' auf "Nein" gesetzt ist, ist es stattdessen nutzlos. Es entspricht der Server-Side-Encryption (SSE) von IBM Cloud Object Storage. Wenn der 'curl' -Parameter auf "Ja" gesetzt ist, ist dies nur mit der Signaturversion 4 (siehe 'version' -Parameter) konsistent. Der Wert kann nur AES256 lauten, wobei die Groß-/Kleinschreibung beachtet werden muss.
- Bereich
- Er ist nur obligatorisch, wenn der Parameter 'curl' auf 'yes' gesetzt ist und wenn der Parameter 'version' nicht angegeben oder auf 4 gesetzt ist, ist er stattdessen nutzlos. Ermöglicht die Angabe des betreffenden Bucketregionsnamens.
- profile
- Es ist optional, wenn der Parameter 'curl' nicht angegeben oder auf "no" gesetzt ist. Wenn der Parameter 'ibmcloud' auf "no" gesetzt ist, ist er stattdessen nutzlos. Ermöglicht die Angabe eines benannten Profils, das den AWS-CLI-Berechtigungsnachweisen entspricht.
- url
- Es ist obligatorisch, wenn der Parameter 'curl' auf "Ja" gesetzt ist. Es ist optional, wenn der Parameter 'ibmcloud' auf "nein" gesetzt ist. Es ist nutzlos, wenn der Parameter 'ibmcloud' nicht angegeben oder auf "Ja" gesetzt ist. Es ermöglicht die Angabe der öffentlichen Endpunkt-URL des betreffenden IBM Cloud Object Storage -Ziels.
- Wenn das verwendete Tool IBM Cloud CLI ist, das mit der IAM-Authentifizierung konfiguriert ist, muss das Tool vor der Ausführung entsprechend konfiguriert werden Optim High Performance Unload.
- Wenn das verwendete Tool cURL oder IBM Cloud CLI ist, das mit der HMAC-Authentifizierung oder AWS CLI konfiguriert ist, beruht die Authentifizierung auf zwei Parametern, dem Zugriffsschlüssel und dem geheimen Schlüssel, die dem betreffenden IBM Cloud Object Storage -Konto zugeordnet sind. In dem Fall, dass Optim High Performance Unload gestartet wird, um einen Upload-Befehl an ein IBM Cloud Object Storage -Ziel basierend auf dem cURL -Tool zu generieren, müssen diese Schlüssel konfiguriert werden. Der Zugriffsschlüssel muss in der Konfigurationsdatei db2hpu.dest mithilfe des Parameters 'accesskey' festgelegt werden. Der geheime Schlüssel muss in einem geeigneten Abschnitt der Anmeldedaten-Datei gespeichert werden. Wenn das zu berücksichtigende Tool nicht cURL, ist, müssen diese Schlüssel darin gespeichert werden, bevor ein Upload-Befehl ausgeführt wird, der mit Optim High Performance Unload, vom Benutzer, der den Upload-Befehl ausführen möchte, generiert wurde. Wenn das zu berücksichtigende Tool IBM Cloud CLI ist, kann dieser Schritt durch Ausführen des Befehls "ibmcloud auth config hmac" wie folgt ausgeführt werden:
Wenn das zu berücksichtigende Tool AWS CLI ist, kann dieser Schritt durch Ausführen des Befehls "aws configure" wie folgt ausgeführt werden:ibmcloud cos config hmac Access key ()> USER_ACCESS_KEY Secret key ()> USER_SECRET_KEY OK Successfully saved HMAC Credentials to file.aws configure AWS Access Key ID [None]: USER_ACCESS_KEY AWS Secret Access Key [None]: USER_SECRET_KEY Default region name [None]: BUCKET_REGION_NAME Default output format [None]:
- Die Generierung eines Hochladebefehls wird für die Windows-Plattform nicht unterstützt.
- Wenn die Signaturversion 4 ist, muss auf der Maschine, auf der der Hochladebefehl ausgeführt wird, der Befehl openssl installiert sein, auf den über die Umgebungsvariable PATH zugegriffen werden kann.
- Wenn die Signaturversion 2 ist, müssen auf der Maschine, auf der der Hochladebefehl ausgeführt wird, die Befehle openssl und base64 installiert sein, auf die über die Umgebungsvariable PATH zugegriffen werden kann.
Für Amazon EC2 -Ziele spezifische Parameter
- Benutzer
- Obligatorischer Parameter. Ermöglicht die Angabe des Benutzers der betreffenden Amazon EC2 -Instanz.
- url
- Obligatorischer Parameter. Sie ermöglicht die Angabe der öffentlichen URL der betroffenen Amazon EC2 -Instanz.
- Privatekey
- Obligatorischer Parameter. Ermöglicht die Angabe des Pfads des privaten Schlüssels, der dem Schlüsselpaar der betroffenen Amazon EC2 -Instanz zugeordnet ist. Das Dateiformat des privaten Schlüssels sollte pem lauten. Der öffentliche Schlüssel muss in der Amazon EC2 -Instanz entsprechend konfiguriert werden. Wenn es sich bei dem System, auf dem der Upload ausgeführt wird, um ein Windows-System handelt, muss der Wert für diesen Parameter ein gültiger Windows-Pfad sein.
- Pfad
- Optionaler Parameter. Hier kann der Pfad angegeben werden, in den die von Optim High Performance Unload hochgeladen werden.Hinweis : Wenn dieser Parameter ausgelassen wird, Optim High Performance Unload werden die generierten Dateien in das Home-Verzeichnis des Benutzers hochgeladen, der durch den Parameter 'user' angegeben wird
- IsWindows
- Optionaler Parameter. Gültige Werte sind 'yes' und 'no '. Wenn dieser Parameter nicht festgelegt ist, lautet der Wert standardmäßig 'no'. Sie ermöglicht die Angabe, ob es sich bei der Amazon EC2 -Instanz um eine Windows-Instanz handelt. Wenn dieser Parameter auf 'yes' gesetzt ist und der Parameter 'path' ebenfalls festgelegt ist, erfolgt eine Steuerung für die Spezifikation des Parameters 'path' , um zu prüfen, ob der festgelegte Wert einem gültigen Windows-Pfad entspricht.
Bei einem Amazon EC2 -Ziel gibt es aufgrund der Verwendung einer Datei mit privatem Schlüssel keine Überlegungen zur Authentifizierung.
Parameter, die für Amazon S3 oder S3 kompatible Ziele spezifisch sind
- curl
- Optionaler Parameter. Gültige Werte sind 'yes' und 'no '. Wenn dieser Parameter nicht festgelegt ist, lautet der Wert standardmäßig 'no'. Wenn der Parameter 'curl' auf 'no' oder 'unspecified' gesetzt ist, wird das Tool als AWS -CLI für die Generierung von Hochladebefehlen oder die automatische Migration betrachtet. Wenn der Parameter 'curl' auf 'yes' gesetzt ist, wird das Tool cURL sowohl für die Generierung des Hochladebefehls als auch für die automatische Migration verwendet.
- bucket
- Obligatorischer Parameter. Es ermöglicht die Angabe des Namens des betreffenden Eimers.
- relativepath
- Optionaler Parameter. Es ermöglicht die Angabe des relativen Pfads, in den die von Optim High Performance Unload hochgeladen werden.
- filemaxsize
- Optionaler Parameter. Er ermöglicht die Angabe der Dateigrößenbegrenzung für die generierten Ausgabedateien. Dieser Parameter muss auf einen numerischen Wert gesetzt werden, der in Megabyte angegeben wird. Der Wert muss zwischen 4 und 5242880 (5 TB) liegen, wobei letzteres die Obergrenze für die Größe des Amazon S3-Objekts ist. Wenn eine Dateigrößenbegrenzung über den Befehl ulimit festgelegt wurde, muss dieser Parameterwert kleiner als der festgelegte Grenzwert sein. Wenn eine Klausel FILEMAXSIZE in einer Steuerdatei angegeben wurde, muss der für sie angegebene Wert kleiner als dieser Parameterwert sein.
- accesskey
- Er ist nur obligatorisch, wenn der Parameter 'curl' auf 'yes' gesetzt ist. Er ist stattdessen nutzlos. Ermöglicht die Angabe des Zugriffsschlüssels des Benutzerkontos.
- Version
- Er ist optional, wenn der Parameter 'curl' auf 'yes' gesetzt ist. Er ist stattdessen nutzlos. Sie entspricht der Signaturversion, die für das Hochladen der Daten in den Bucket verwendet wird. Der Wert kann 2 oder 4 sein. Wenn dieser Parameter nicht festgelegt ist, ist der Wert standardmäßig 4. Bei Angabe der Signaturversion 2 wird der zugrunde liegende Hash-Algorithmus SHA-1 verwendet. Mit der Signaturversion 4 wird der Algorithmus SHA-256 für das Hashing verwendet.Hinweis Abhängig vom Erstellungsdatum des berücksichtigten Buckets wird die Signaturversion 2 nicht unbedingt unterstützt. Weitere Informationen zu Amazon S3 finden Sie in der offiziellen Dokumentation.
- encrypt
- Es handelt sich um eine optionale Funktion, die der Server Side Encryption (SSE) entspricht. Wenn der Parameter 'curl' auf 'yes' gesetzt ist, ist er nur mit der Signaturversion 4 konsistent (siehe Parameter 'version' ). Sein Wert kann 'AES256' oder 'aws:kms' sein und die Groß-/Kleinschreibung muss beachtet werden.
- Bereich
- Er ist nur obligatorisch, wenn der Parameter 'curl' auf 'yes' gesetzt ist und wenn der Parameter 'version' nicht angegeben oder auf 4 gesetzt ist, ist er stattdessen nutzlos. Ermöglicht die Angabe des betreffenden Bucketregionsnamens.
- profile
- Er ist optional, wenn der Parameter 'curl' nicht angegeben oder auf no gesetzt ist. Er ist stattdessen nutzlos. Ermöglicht die Angabe eines benannten Profils, das den AWS-CLI-Berechtigungsnachweisen entspricht.
- url
- Optionaler Parameter. Es muss angegeben werden, ob es sich bei dem in Betracht gezogenen Ziel um ein S3 -kompatibles Ziel handelt, das nicht von Amazon stammt. Es ermöglicht die Angabe der öffentlichen URL des betreffenden S3 -kompatiblen Ziels.
aws configure
AWS Access Key ID [None]: USER_ACCESS_KEY
AWS Secret Access Key [None]: USER_SECRET_KEY
Default region name [None]: BUCKET_REGION_NAME
Default output format [None]:
- Wenn man Daten mit dem Tool cURL an ein mit Amazon S3 oder S3 kompatibles Ziel hochladen möchte, gibt es mehrere Regeln oder Anforderungen:
- Die Generierung eines Hochladebefehls wird für die Windows-Plattform nicht unterstützt.
- Wenn die Signaturversion 4 ist, muss auf der Maschine, auf der der Hochladebefehl ausgeführt wird, der Befehl openssl installiert sein, auf den über die Umgebungsvariable PATH zugegriffen werden kann.
- Wenn die Signaturversion 2 ist, müssen auf der Maschine, auf der der Hochladebefehl ausgeführt wird, die Befehle openssl und base64 installiert sein, auf die über die Umgebungsvariable PATH zugegriffen werden kann.
- Wenn ein externer Befehl zur Tabellenerstellung auf der Grundlage einer Datei in einem S3 -kompatiblen Objektspeicher generiert werden soll, werden nur die folgenden Parameter berücksichtigt: 'bucket', 'accesskey' und 'region'.
Für Swift-Ziele vorgesehene Parameter
- auth_version
- Optionaler Parameter. Entspricht der Authentifizierungsversion, die verwendet werden soll. Gültige Werte sind 1, 2 und 3. Wenn dieser Parameter nicht gesetzt ist, Optim High Performance Unload wird versucht, den Wert der Umgebungsvariablen "ST_AUTH_VERSION" zu ermitteln. Wenn diese Umgebungsvariable ebenfalls nicht festgelegt wurde, wird standardmäßig die Authentifizierungsversion 3 verwendet.Hinweis: Die Authentifizierungsversion 1 entspricht dem Swift-Mechanismus TempAuth , die Authentifizierungsversionen 2 und 3 entsprechen dem Swift-Keystone-Authentifizierungsverfahren.
- url
- Optionaler Parameter. Ermöglicht die Angabe der URL des Swift-Servers. Diese URL muss entsprechend der ausgewählten Authentifizierungsversion angegeben werden. Abhängig von der Authentifizierungsversion werden die folgenden Muster verwendet:
- Version 1: http://<url>:<port>/auth/v1.0
- Version 2: http://<url>:<port>/v2.0
- Version 3: http://<url>:<port>/v3
- container
- Obligatorischer Parameter. Es entspricht dem Container, in den Optim High Performance Unload ausgabedateien hochgeladen werden.
- Projekt
- Optionaler Parameter. Kann nur für die Authentifizierungsversionen 2 und 3 angegeben werden; wird ansonsten nicht benötigt. Die Art dieses Parameterwerts hängt von der Einstellung des Parameters ‘project_id’ ab. Wenn der ‘project_id’ -Parameter nicht oder auf 'no' gesetzt ist, ist seine Art ein Name. Wenn der Parameter ‘project_id’ auf 'yes' gesetzt ist, ist seine Art eine ID. Abhängig von der Authentifizierungsversion hat der Parameter verschiedene Bedeutungen:
- Für Version 2 entspricht dies einem Swift-Tenantnamen oder einer Swift-Tenant-ID (abhängig von der Einstellung des Parameters ‘project_id’ ).
- Bei Version 3 entspricht dies einem Swift-Projektnamen oder einer Swift-Projekt-ID (abhängig von der Einstellung des Parameters ‘project_id’ ).
- PROJECT_ID
- Optionaler Parameter. Gültige Werte sind 'yes' und 'no '. Kann nur für die Authentifizierungsversionen 2 und 3 angegeben werden; wird ansonsten nicht benötigt. Wenn sie auf 'yes' gesetzt ist, muss der Parameter ‘project’ eine Tenant-ID oder eine Projekt-ID sein (je nachdem, ob die Authentifizierungsversion 2 oder 3 ist). Wenn er nicht festgelegt oder auf no gesetzt ist, muss die Art des Parameters 'project' ein Tenantname oder ein Projektname sein (je nachdem, ob die Authentifizierungsversion 2 oder 3 ist).
- Benutzerdomäne
- Optionaler Parameter. Sie kann nur für die Authentifizierungsversion 3 angegeben werden. Die Art dieses Parameterwerts hängt von der Einstellung des Parameters ‘user_domain_id’ ab. Wenn der ‘user_domain_id’ -Parameter nicht oder auf 'no' gesetzt ist, ist seine Art ein Name. Wenn der Parameter ‘user_domain_id’ auf 'yes' gesetzt ist, ist seine Art eine ID. Entspricht einem Benutzerdomänennamen oder einer Benutzerdomänen-ID (abhängig von der Einstellung des Parameters ‘user_domain_id’ ).
- Benutzerdomänen-ID
- Optionaler Parameter. Gültige Werte sind 'yes' und 'no '. Sie kann nur für die Authentifizierungsversion 3 angegeben werden. Wenn sie auf 'yes' gesetzt ist, muss die Art des Parameters ‘user_domain’ eine Benutzerdomänen-ID sein. Wenn er nicht festgelegt oder auf 'no' gesetzt ist, muss die Art des Parameters ‘user_domain’ ein Benutzerdomänenname sein.
- Projektdomäne
- Optionaler Parameter. Sie kann nur für die Authentifizierungsversion 3 angegeben werden. Die Art dieses Parameterwerts hängt von der Einstellung des Parameters ‘project_domain_id’ ab. Wenn der ‘project_domain_id’ -Parameter nicht oder auf 'no' gesetzt ist, ist seine Art ein Name. Wenn der Parameter ‘project_domain_id’ auf 'yes' gesetzt ist, ist seine Art eine ID. Entspricht einem Projektdomänennamen oder einer Projektdomänen-ID (abhängig von der Einstellung des Parameters ‘user_domain_id’ ).
- Projektdomänen-ID
- Optionaler Parameter. Gültige Werte sind 'yes' und 'no '. Sie kann nur für die Authentifizierungsversion 3 angegeben werden. Wenn der Parameter auf "yes" gesetzt ist, muss der Parameter ‘project_domain’ eine Projektdomänen-ID sein. Wenn er nicht festgelegt oder auf no gesetzt ist, muss die Art des Parameters ‘project_domain’ ein Projektdomänenname sein.
- domain
- Optionaler Parameter. Sie kann nur für die Authentifizierungsversion 3 angegeben werden. Sie entspricht einem übergeordneten Container für Projekte, Benutzer und Gruppen. Wenn dieser Parameter nicht gesetzt ist und der Parameter ‘domain_id’ nicht gesetzt ist oder auf "no" gesetzt ist, Optim High Performance Unload wird versucht, den Wert der Umgebungsvariablen "OS_DOMAIN_NAME" zu ermitteln.
- Domänen-ID
- Optionaler Parameter. Gültige Werte sind 'yes' und 'no '. Sie kann nur für die Authentifizierungsversion 3 angegeben werden. Wenn sie auf 'yes' gesetzt ist, muss die Art des Parameters ‘domain’ eine Domänen-ID sein. Wenn er nicht festgelegt oder auf 'no' gesetzt ist, muss die Art des Parameters ‘domain’ ein Domänenname sein.
- Bereich
- Optionaler Parameter. Kann nur für die Authentifizierungsversionen 2 und 3 angegeben werden; wird ansonsten nicht benötigt. Sie entspricht dem Bereich, in dem die Objekte gespeichert sind. Wenn dieser Parameter nicht gesetzt ist, Optim High Performance Unload wird versucht, den Wert der Umgebungsvariablen "OS_REGION_NAME" zu ermitteln.
- Benutzer-ID
- Optionaler Parameter. Gültige Werte sind 'yes' und 'no '. Sie kann nur für die Authentifizierungsversion 3 angegeben werden. Wenn der Parameter auf "yes" gesetzt ist, muss es sich bei der Art des Parameters ‘user’ um eine Benutzer-ID handeln. Wenn er nicht festgelegt oder auf 'no' gesetzt ist, muss die Art des Parameters 'user' ein Benutzername sein.
- filemaxsize
- Optionaler Parameter. Er ermöglicht die Angabe der Dateigrößenbegrenzung für die generierten Ausgabedateien. Die Größenbegrenzung, die auf Dateien für ein Swift-Ziel angewendet wird, ist standardmäßig 5 GB. Dieser Parameter muss auf einen numerischen Wert gesetzt werden, der in Megabyte angegeben wird. Der Wert muss zwischen 4 und 5120 (5 GB) liegen, wobei letzteres die Obergrenze für die Größe des Swift-Objekts ist. Wenn eine Dateigrößenbegrenzung über den Befehl ulimit festgelegt wurde, muss dieser Parameterwert kleiner als der festgelegte Grenzwert sein. Wenn eine Klausel FILEMAXSIZE in einer Steuerdatei angegeben wurde, muss der für sie angegebene Wert kleiner als dieser Parameterwert sein.
- Segmentgröße
- Optionaler Parameter. Der Wert muss auf einen numerischen Wert mit maximal 5368709120 (5GB) gesetzt werden. Sie ermöglicht es, die hochzuladenden Dateien während ihrer Uploadverarbeitung automatisch in Segmente der gewünschten Größe aufzuteilen und Dateisegmente in den Container hochzuladen.
Für Microsoft Azure -Ziele spezifische Parameter
- curl
- Optionaler Parameter. Gültige Werte sind 'yes' und 'no '. Wenn dieser Parameter nicht festgelegt ist, lautet der Wert standardmäßig 'no'. Wenn der Parameter 'curl' auf 'no' oder 'not specified' gesetzt ist, wird das Tool als Azure -CLI für die Generierung des Hochladebefehls oder die automatische Migration betrachtet. Andernfalls wird, wenn der Parameter 'curl' auf "Ja" gesetzt ist, das Tool cURL, sowohl für die Generierung von Upload-Befehlen als auch für die automatische Migration verwendet.
- Konto
- Obligatorischer Parameter. Sie ermöglicht die Angabe des zu verwendenden Azure -Kontonamens.
- SAP-stoken
- Er ist obligatorisch, wenn der Parameter 'curl' auf 'yes' gesetzt ist. Er ist stattdessen nutzlos. Ermöglicht die Angabe einer Azure -SAS (Shared Access Signature).
- blob
- Optionaler Parameter. Gültige Werte sind 'yes' und 'no '. Der Standardwert ist 'yes'. Er ermöglicht die Angabe des Azure -Objekttyps, der beim Hochladen einer Datei in den Azure -Objektspeicher berücksichtigt wird. Wenn der zugehörige Wert auf 'yes' gesetzt ist, wird die Datei als BLOB-Objekttyp in einen Azure -Container hochgeladen. Wenn der Wert auf no gesetzt ist, wird die Datei als Dateiobjekttyp in eine Azure -Dateifreigabe hochgeladen.
- container
- Es ist obligatorisch, wenn das Ausgabeformat nicht EXTERNAL ist und der Parameter 'blob' nicht angegeben oder auf yes gesetzt ist. Dies ist obligatorisch, wenn ein Befehl zur Erstellung einer externen Tabelle generiert wird. Es ist stattdessen nutzlos. Sie entspricht dem Container, in den die Datei hochgeladen wird.
- Freigabename
- Er ist obligatorisch, wenn der Parameter 'blob' auf 'no' gesetzt ist. Er ist stattdessen nutzlos. Entspricht dem Namen der Dateifreigabe, in die die Datei hochgeladen wird.
- relativepath
- Optionaler Parameter. Sie ermöglicht die Angabe des relativen Pfads, in den die Datei hochgeladen wird.
- entweder einen Kontoschlüssel, der in einem entsprechenden Abschnitt der Anmeldeinformationen-Datei gespeichert werden kann. Der Kontoschlüssel befindet sich im Portal Microsoft Azure im Speicherkonto. Unter Security + networking kann man Zugriffsschlüssel auswählen und dann Show , um die Zugriffsschlüssel anzuzeigen und einen Schlüssel von dort zu kopieren.
- oder ein Azure -SAS-Token, das über den Parameter 'sastoken' angegeben werden kann. Es muss mit ausreichenden Berechtigungen für die entsprechenden Azure -Ressourcen und -Services generiert werden. Es gibt mehrere Möglichkeiten, ein SAS-Token zu generieren. Weitere Informationen hierzu finden Sie in der offiziellen Microsoft Azure -Dokumentation.
Parameter, die für eine Dateisystemumgebung spezifisch sind
- Benutzer
- Optionaler Parameter. Sie ermöglicht es, den Benutzer der Zielmaschine anzugeben, der bei der Authentifizierung beim Kopieren der Daten berücksichtigt werden soll. Standardmäßig wird der Benutzer als ausführend betrachtet.
- url
- Obligatorischer Parameter. Damit können Sie den Namen des Zielservers angeben, auf den die Daten kopiert werden.
- Pfad
- Optionaler Parameter. Hier kann der Pfad angegeben werden, in den die von Optim High Performance Unload hochgeladen werden.Hinweis : Wenn dieser Parameter ausgelassen wird, Optim High Performance Unload werden die generierten Dateien in das Home-Verzeichnis des Benutzers hochgeladen, der für die Authentifizierung auf dem Zielserver in Betracht gezogen wird.
- IsWindows
- Optionaler Parameter. Gültige Werte sind 'yes' und 'no '. Wenn dieser Parameter nicht festgelegt ist, lautet der Wert standardmäßig 'no'. Sie ermöglicht die Angabe, ob der im Parameter 'url' angegebene Zielserver ein Windows-Server ist oder nicht. Wenn dieser Parameter auf 'yes' gesetzt ist und der Parameter 'path' ebenfalls festgelegt ist, erfolgt eine Steuerung für die Spezifikation des Parameters 'path' , um zu prüfen, ob der festgelegte Wert einem gültigen Windows-Pfad entspricht.
- Privatekey
- Optionaler Parameter. Ermöglicht die Angabe des Pfads des privaten Schlüssels, der dem Schlüsselpaar für den Benutzer zugeordnet ist, der für die Authentifizierung auf dem Zielserver berücksichtigt wird. Das Dateiformat des privaten Schlüssels sollte pem lauten. Wenn es sich bei dem System, auf dem der Upload ausgeführt wird, um ein Windows-System handelt, muss der Wert für diesen Parameter ein gültiger Windows-Pfad sein. Der öffentliche Schlüssel muss entsprechend auf dem Zielserver für den Benutzer konfiguriert werden, der für die Authentifizierung auf dem Zielserver berücksichtigt wird.
Für PostgreSQL -Ziele spezifische Parameter
- Aliasname
- Optionaler Parameter. Für den Wert muss die Groß-/Kleinschreibung beachtet werden. Er muss gesetzt werden, wenn ein Aliasname in einer Klausel LOADDEST in einer Steuerdatei angegeben wird. In diesem Fall wird anhand dieses Parameters festgelegt, dass der zugehörige Abschnitt berücksichtigt werden muss. Für eine Migrationstask muss dieser Parameter festgelegt werden. In diesem Fall muss der Wert mit dem Namen eines Abschnitts übereinstimmen, der in der Berechtigungsnachweisdatei für den betreffenden Zieltyp erstellt wurde.
- binpath
- Optionaler Parameter. Es ermöglicht die Angabe eines Verzeichnisses, das beim Erstellen des Hochladebefehls verwendet wird, indem es dem Namen des psql-Tools vorangestellt wird, um Probleme bei der Suche zu vermeiden, wenn versucht wird, es für den effektiven Upload auszuführen. Es muss sich um einen gültigen absoluten Pfad handeln.
- Datenbankname
- Obligatorischer Parameter. Er ermöglicht die Angabe des Datenbanknamens, der für das Hochladen verwendet werden soll.
- Organisator
- Optionaler Parameter. Beim Entladen von Daten können die zu generierenden Dateien auf der angegebenen Maschine erstellt werden. Bei der Migration von Daten kann der Name der Maschine angegeben werden, auf der der für die Datenmigration zu verwendende Hochladebefehl generiert und ausgeführt wird.
- host_ist_windows
- Optionaler Parameter. Gültige Werte sind 'yes' und 'no '. Wenn dieser Parameter nicht festgelegt ist, entspricht der Wert standardmäßig dem Typ der Quellenmaschine. Mit diesem Parameter können Sie den Typ der Maschine angeben, auf der der Hochladebefehl generiert oder ausgeführt wird. Wenn es sich um eine „ Unix “-Option handelt, muss der Parameterwert auf „no“ gesetzt werden. Wenn es sich um ein Windows-System handelt, muss der Parameterwert auf 'yes' gesetzt werden. Wenn die Klausel WORKING IN in der Steuerdatei angegeben wird und dieser Parameter ebenfalls angegeben wird, müssen ihre Werte entsprechend festgelegt werden. Wenn es sich bei dem Upload-Rechner um einen „ Unix “-Rechner handelt, muss die WORKING IN-Klausel mit einem „ Unix “-Pfad angegeben werden, und dieser Parameterwert muss auf „no“ gesetzt werden. Wenn es sich bei der Uploadmaschine um ein Windows-System handelt, muss die Klausel WORKING IN mit einem Windows-Pfad angegeben werden, und dieser Parameterwert muss auf yes gesetzt werden. Wenn der Parameter 'host' nicht oder auf die aktuelle Maschine gesetzt ist, ist die Einstellung dieses Parameters nutzlos. Wenn der Parameter 'binpath' festgelegt ist und auch dieser Parameter angegeben wird, müssen deren Werte entsprechend festgelegt werden: Der Parameterwert 'binpath' muss mit einem absoluten Pfad festgelegt werden, der für den Typ der Uploadmaschine gültig ist.
- Anschluss
- Optionaler Parameter. Ermöglicht die Angabe der Portnummer des betroffenen PostgreSQL -Servers. Erfolgt keine Angabe, wird die Standardportnummer 5432 angenommen.
- url
- Obligatorischer Parameter. Ermöglicht die Angabe der URL des betroffenen PostgreSQL -Servers.
Authentifizierungsparameter - Standardauthentifizierungsmethode
- Benutzer
- Ermöglicht die Angabe des gewünschten Benutzers. Dieser Benutzer muss über die entsprechenden Berechtigungen zum Ausführen des erwarteten Datenübertragungsbefehls verfügen und wird bei der Generierung berücksichtigt:
- für Standardentladung, kompatibel mit einem Db2 -Standardziel oder einem fernen Db2 -Ziel, begleitet von der Generierung eines Db2 -Ladebefehls: Dieser Parameter ist optional. Wenn die zugehörige Klausel LOADDEST die Spezifikation ihrer Option WITH STANDARD AUTH enthält, wird sie in dem vorläufigen Verbindungsschritt verwendet, der vor dem Db2 -Befehl Load generiert wurde.
- Für Standardentladung, kompatibel mit Big Data, Db2 Warehouse oder einem PostgreSQL -Ziel, begleitet von der Generierung eines Hochladebefehls, mit einer zugehörigen Klausel LOADDEST, die die Spezifikation der zugehörigen Option WITH STANDARD AUTH enthält: Dieser Parameter ist obligatorisch. Der Hochladebefehl wird mit einem vorläufigen Schritt generiert, der für eine verschlüsselte Eingabeaufforderung des Kennworts erstellt wird. Bei der Ausführung des betreffenden Befehls muss zunächst das Kennwort eingegeben werden und anschließend wird unter Berücksichtigung des eingegebenen Kennworts der eigentliche Hochladebefehl ausgeführt.
- für automatische Migration: Dieser Parameter ist obligatorisch. Die zugrunde liegende Datenübertragungsverarbeitung muss intern auf die Verwendung eines Kennworts angewiesen sein. Dieses Kennwort wird aus der Berechtigungsnachweisdatei gelesen, die dem Benutzer zugeordnet ist, der die automatische Migration ausführt. Sie muss zuvor in dieser Datei gespeichert werden, um einen Berechtigungsnachweisabschnitt des entsprechenden Typs zu erstellen: den Typ 'local', 'remote', 'warehouse', 'cloudant', 'couchdb', 'mongodb', 'swift' und 'postgresql ', je nachdem, ob es sich bei dem ausgewählten Ziel um einen Db2 -Standardtyp, einen fernen Db2 -Typ, einen Db2 Warehouse -Typ, einen Cloudant -Typ, einen CouchDB -Typ, einen MongoDB -Typ handelt. Swift one oder PostgreSQL one. Wenn es sich bei dem Ziel um ein Db2 -Standardziel, ein fernes Db2 -Ziel oder ein Db2 Warehouse -Ziel handelt, muss der angegebene Benutzer mit dem Benutzer identisch sein, der für den Parameter user im entsprechenden Abschnitt mit den Berechtigungsnachweisen festgelegt wurde.
- für Swift-Ziel: Für diesen Parameter gelten mehrere Regeln. Optionaler Parameter. In den meisten Fällen muss dieser Parameter mit einem Benutzernamen festgelegt werden. Wenn der Parameter ‘user_id’ jedoch auf 'yes' gesetzt ist und die ausgewählte Authentifizierungsversion 3 ist, muss dieser Parameter mit einer Benutzer-ID festgelegt werden. Wenn dieser Parameter nicht festgelegt ist, Optim High Performance Unload wird versucht, den Wert einer Umgebungsvariablen abhängig von der gewählten Authentifizierungsversion zu ermitteln. Wenn die Authentifizierungsversion 1 ausgewählt wurde, wird die Umgebungsvariable "ST_USER" verwendet. Wenn die ausgewählte Authentifizierungsversion 2 ist oder wenn die ausgewählte Authentifizierungsversion 3 ist und der Parameter ‘user_id’ nicht auf 'yes' gesetzt ist, wird die Umgebungsvariable als "OS_USERNAME" betrachtet. Wenn die ausgewählte Authentifizierungsversion 3 ist und der Parameter ‘user_id’ auf yes gesetzt ist, wird die Umgebungsvariable "OS_USER_ID" berücksichtigt.Hinweis: In einer Swift-Umgebung kann über eine Umgebungsvariable ein Kennwort festgelegt werden, das einem Benutzer zugeordnet ist: "ST_KEY" für die Authentifizierungsversion 1, "OS_PASSWORD" für die Authentifizierungsversion 2 oder 3. Diese Umgebungsvariablen werden jedoch nie von Optim High Performance Unload bei der Durchführung einer automatischen Migration Ein solches Passwort muss stattdessen in der Optim High Performance Unload stattdessen muss ein solches Passwort in der Anmeldedatei gespeichert werden.
Authentifizierungsparameter - Kerberos-Authentifizierungsmethode
- Benutzer
- Ermöglicht die Angabe des gewünschten Kerberos-Prinzipals. Dieser Kerberos-Prinzipal muss über geeignete Berechtigungen für die Ausführung des erwarteten Datenübertragungsbefehls verfügen. Er wird bei der Generierung des Datenübertragungsbefehls berücksichtigt, indem ein vorläufiger Schritt hinzugefügt wird, in dem ein Kerberos-Ticket von diesem Prinzipal abgerufen wird. Dieser Schritt basiert auf dem Befehl 'kinit', der Teil des Kerberos-Clients ist. Er muss installiert werden, bevor versucht wird, ein Ticket abzurufen. Beim Abrufen eines solchen Tickets muss ein Kennwort verwendet werden. Die Art und Weise, wie dieses Kennwort behandelt wird, hängt von der ausgeführten Task ab:
- Wenn es sich bei der ausgeführten Task um ein Standardentladen handelt, das von der Generierung eines Datenübertragungsbefehls begleitet wird, kann auch der zugehörige Parameter keytab konfiguriert werden. Wenn er konfiguriert ist, wird der vorausgehende Schritt für das Abrufen des Kerberos-Tickets generiert, damit er direkt auf die konfigurierte Chiffrierschlüsseldatei verweist. Wenn er nicht konfiguriert ist, wird der vorausgehende Schritt so generiert, dass während der Ausführung zur Eingabe eines Kennworts aufgefordert wird.
- Wenn es sich bei der ausgeführten Task um eine automatische Migration handelt, muss zwingend ein zugehöriger Parameter keytab konfiguriert werden.
- keytab
- Ermöglicht die Angabe eines absoluten Pfads zu einer Chiffrierschlüsseldatei, in der im Voraus das Kennwort des zu berücksichtigenden Prinzipals gespeichert worden sein muss.