Registerkarte „Eingabe“ (DataStage )

Auf der Registerkarte 'Eingabe' können Sie Details angeben, die festlegen, wie Daten in eine Dateigruppe geschrieben werden.

Nachfolgend finden Sie eine Beschreibung der einzelnen Eigenschaften auf der Registerkarte 'Eingabe':
Dateigruppe
Diese Eigenschaft definiert die Dateigruppe, in die die eingehenden Daten geschrieben werden. Sie können einen Pfadnamen für eine Dateigruppendeskriptordatei eingeben oder nach einer Dateigruppendeskriptordatei suchen (gemäß Konvention enden die Dateinamen mit .fs).
Richtlinie für Dateigruppenaktualisierung
Gibt an, welche Aktion ausgeführt werden soll, wenn die Dateigruppe, in die geschrieben wird, bereits vorhanden ist. Auswählen:
  • Erstellen (Fehler, falls vorhanden)
  • Überschreiben (Standardwert)
  • Vorhandene verwenden (Datensätze löschen). Behält vorhandene Dateien, die in einer Deskriptordatei (z. B. datasetname.ds oder filesetname.fs) aufgeführt sind, bei, verwirft aber die alten Einträge. Es wird ein Fehler gemeldet, wenn das Dataset mit einem anderen Schema bereits vorhanden ist.
  • Vorhandene verwenden (Schema & Datensätze löschen). Behält vorhandene Dateien in einer Deskriptordatei (z. B. datasetname.ds oder filesetname.fs) bei, löscht jedoch das alte Schema und die alten Datensätze.
Zusätzliche Zieleigenschaften:
Richtlinie für Dateigruppenschema
Gibt an, ob das Schema in die Dateigruppe geschrieben werden soll. Wählen Sie Schreiben oder Übergehen aus. Der Standardwert ist Schreiben.
Nach Fehler bereinigen
Diese Eigenschaft, für die standardmäßig der Wert True festgelegt ist, gibt an, dass die Stage alle teilweise geschriebenen Dateien löscht, wenn die Stage aus irgendeinem Grund fehlschlägt. Legen Sie für diese Eigenschaft den Wert False fest, um anzugeben, dass teilweise geschriebene Dateien beibehalten werden sollen.
Eine einzige Datei pro Partition
Setzen Sie diese Eigenschaft auf Wahr, um anzugeben, dass eine einzige Datei für jede Partition geschrieben wird. Der Standardwert ist Falsch.
Zurückweisungsmodus
Ermöglicht Ihnen die Angabe des Verhaltens, wenn ein Datensatz aus irgendeinem Grund nicht geschrieben werden kann. Wählen Sie Fortfahren aus, um die Operation fortzusetzen und alle zurückgewiesenen Zeilen zu löschen. Wählen Sie Fehlschlagen aus, um das Lesen zu beenden, wenn Zeilen zurückgewiesen werden, oder wählen Sie Speichern aus, um zurückgewiesene Zeilen über einen Zurückweisungslink zu senden. Der Standardwert lautet Fortfahren.
Plattenpool
Dies ist eine optionale Eigenschaft. Geben Sie den Namen des Plattenpools an, in den die Dateigruppe geschrieben werden soll. Sie können auch einen Jobparameter angeben.
Dateipräfix
Dies ist eine optionale Eigenschaft. Geben Sie ein Präfix für den Namen der Dateigruppenkomponenten an. Wenn Sie kein Präfix angeben, schreibt das System Folgendes: export.Benutzername; dabei steht Benutzername für Ihre Anmeldung. Sie können auch einen Jobparameter angeben.
Dateisuffix
Dies ist eine optionale Eigenschaft. Geben Sie ein Suffix für den Namen der Dateigruppenkomponenten an. Das Suffix wird standardmäßig nicht angegeben.
Maximale Dateigröße
Dies ist eine optionale Eigenschaft. Geben Sie die maximale Dateigröße in MB an. Der Wert muss größer-gleich 1 sein.
Schemadatei
Dies ist eine optionale Eigenschaft. Standardmäßig verwendet die Stage 'File Set' die Spaltendefinitionen, die auf der Registerkarte Spalten definiert sind, und Formatierungsinformationen von der Registerkarte Format als Schema für das Schreiben der Datei. Sie können jedoch stattdessen eine Datei angeben, die ein Schema enthält (beachten Sie jedoch, dass Sie, wenn Spalten auf der Registerkarte Spalten definiert wurden, sicherstellen müssen, dass diese der Schemadatei entsprechen). Geben Sie einen Pfadnamen ein.

Format

Wenn Sie keine der Formateinstellungen ändern, werden die Dateien in dem folgenden Format erstellt:

  • Dateien umfassen Spalten variabler Länge, die in doppelte Anführungszeichen eingeschlossen sind.
  • Alle Spalten mit Ausnahme der letzten Spalte in einer Zeile werden durch ein Komma begrenzt.
  • Zeilen werden durch einen UNIX-Zeilenumbruch begrenzt.

In den folgenden Abschnitten werden die Eigenschaftstypen und die für jeden Typ verfügbaren Eigenschaften aufgelistet.

Datensatzebene

Diese Eigenschaften definieren Details, die festlegen, wie Datensätze in der unstrukturierten Datei formatiert werden. An den Stellen, an denen Sie ein Zeichen eingeben können, kann dies in der Regel ein ASCII-Zeichen oder ein Unicode-Mehrbytezeichen sein (sofern die Unterstützung landessprachlicher Versionen aktiviert ist). Die folgenden Eigenschaften sind verfügbar:
  • Füllzeichen. Geben Sie ein ASCII-Zeichen oder einen Wert im Bereich von 0 bis 255 an. Sie können auch Leerzeichen oder Null aus einer Dropdown-Liste auswählen. Dieses Zeichen wird zum Füllen aller Lücken in einem geschriebenen Datensatz verwendet, die durch Eigenschaften der Spaltenpositionierung verursacht werden. Hierfür ist standardmäßig der Wert 0 festgelegt (d. h. das NULL-Zeichen). Wenn Sie das Leerzeichen angeben möchten, könnten Sie zum Beispiel auch das Leerzeichen oder 32 eingeben. Beachten Sie, dass dieser Wert auf ein Byte beschränkt ist. Daher können Sie kein Unicode-Zeichen mit mehreren Byte angeben.
  • Abschlussbegrenzerzeichenfolge. Geben Sie eine Zeichenfolge an, die nach der letzten Spalte eines Datensatzes anstelle des Spaltenbegrenzers geschrieben werden soll. Geben Sie ein oder mehrere Zeichen ein, die dem Datensatzbegrenzer vorausgehen, sofern ein solcher verwendet wird. Diese Angabe und 'Abschlussbegrenzer' schließen sich gegenseitig aus. Die Angabe 'Abschlussbegrenzer' ist der Standardwert. Wenn Sie beispielsweise für 'Begrenzer' den Wert 'Komma' und für 'Abschlussbegrenzer' den Wert `, ` (Komma und nachfolgendes Leerzeichen - die Angabe der Hochkommas ist nicht erforderlich) festlegen, werden alle Felder durch ein Komma begrenzt; einzige Ausnahme ist das letzte Feld, das durch ein Komma gefolgt von einem ASCII-Leerzeichen begrenzt wird.
  • Abschlussbegrenzer. Geben Sie ein einzelnes Zeichen an, das nach der letzten Spalte eines Datensatzes anstelle des Feldbegrenzers geschrieben werden soll. Geben Sie ein Zeichen ein oder wählen Sie unter 'Leerzeichen', 'Ende', 'Keine', 'Null' oder 'Komma' aus. Das folgende Diagramm dient der Veranschaulichung.
    • Leerzeichen. Die letzte Spalte eines jeden Datensatzes wird keinerlei abschließenden Leerzeichen enthalten, die am Ende des Datensatzes gefunden wurden.
    • Ende. Die letzte Spalte eines jeden Datensatzes enthält nicht den Feldbegrenzer. Dies ist die Standardeinstellung.
    • Keine. Die letzte Spalte eines jeden Datensatzes enthält keinen Begrenzer. Diese Option wird für Felder mit fester Breite verwendet.
    • Null. Die letzte Spalte eines jeden Datensatzes wird durch das ASCII-Nullzeichen begrenzt.
    • Komma. Die letzte Spalte eines jeden Datensatzes wird durch das ASCII-Kommazeichen begrenzt.
    • Tabulator. Die letzte Spalte eines jeden Datensatzes wird durch das ASCII-Tabulatorzeichen begrenzt.

      Beim Schreiben wird nun nach jedem Feld (mit Ausnahme des letzten Felds im Datensatz) ein Leerzeichen eingefügt. Zuvor wurde nach jedem Feld ein Leerzeichen eingefügt, auch nach dem letzten. (Wenn Sie zu dem Verhalten vor Version 7.5 zurückkehren möchten, bei dem nach dem letzten Feld ein Leerzeichen eingefügt wird, definieren Sie die Umgebungsvariable APT_FINAL_DELIM_COMPATIBLE.

  • Intakt. Die Eigenschaft 'Intakt' gibt eine Kennung (ID) für ein Teilschema an. Ein Teilschema gibt an, dass nur die in dem Schema genannte(n) Spalte(n) durch die Stage geändert werden kann (können). Alle anderen Spalten in der Zeile werden unverändert übergeben. Die Datei, die das Teilschema enthält, wird in der Eigenschaft Schemadatei auf der Registerkarte Eigenschaften angegeben. Diese Eigenschaft verfügt über eine abhängige Eigenschaft 'Prüfen, ob intakt'. Diese ist für Eingabelinks jedoch nicht relevant.
  • Datensatzbegrenzerzeichenfolge. Geben Sie eine Zeichenfolge an, die am Ende eines jeden Datensatzes geschrieben werden soll. Geben Sie ein oder mehrere Zeichen ein. Diese Angabe und 'Datensatzbegrenzer' (Standardwert) sowie 'Datensatztyp' und 'Datensatzpräfix' schließen sich gegenseitig aus.
  • Datensatzbegrenzer. Geben Sie ein einzelnes Zeichen an, das am Ende eines jedes Datensatzes geschrieben werden soll. Geben Sie ein Zeichen ein oder wählen Sie eine der folgenden Optionen aus:
    • UNIX Newline (Standardwert)
    • null

    (Zum Implementieren eines DOS-Zeilenumbruchs verwenden Sie die Eigenschaft "Zeichenfolge für Datensatzbegrenzer", die auf "\R\N" gesetzt ist, oder wählen Sie im Direktaufrufmenü Format als > DOS-Zeilenbegrenzer aus.)

    Hinweis: Datensatzbegrenzer und Datensatzbegrenzerzeichenfolge, Datensatzpräfix und Datensatztyp schließen sich gegenseitig aus.
  • Datensatzlänge. Wählen Sie dort Fest aus, wo Felder mit fester Länge geschrieben werden. IBM® DataStage® berechnet die entsprechende Länge für den Datensatz. Alternativ können Sie die Länge von Datensätzen fester Länge in Form der Anzahl an Byte angeben. Diese Option wird nicht standardmäßig verwendet (Standarddateien werden durch Kommas getrennt). Der Datensatz wird bis zur angegebenen Länge mit Nullen oder dem Füllzeichen aufgefüllt, sofern ein solches angegeben wurde.
  • Datensatzpräfix. Gibt an, dass einem Datensatz variabler Länge ein Präfix mit 1, 2 oder 4 Byte Länge vorangestellt wird. Für diese Option ist standardmäßig '1' als Wert festgelegt. Diese Angabe und 'Datensatzbegrenzer' (Standardwert), 'Datensatzbegrenzerzeichenfolge' und 'Datensatztyp' schließen sich gegenseitig aus.
  • Datensatztyp. Gibt an, dass Daten aus geblockten Datensätzen variabler Länge (variabel) oder impliziten Datensätze (implizit) bestehen. Wenn Sie die Eigenschaft 'Implizit' auswählen, werden Daten als Datenstrom ohne explizite Datensatzbegrenzungen geschrieben. Das Ende des Datensatzes wird abgeleitet, wenn alle Spalten, die durch das Schema definiert wurden, geparst wurden. Mit der Eigenschaft 'Variabel' können Sie eines der folgenden geblockten oder übergreifenden IBM Formate angeben: V, VB, VS, VBS oder VR. Daten werden unter Verwendung eines dieser Formate importiert. Diese Formate sind für den Export nicht verfügbar.

    Diese Eigenschaft und 'Datensatzlänge', 'Datensatzbegrenzer', 'Datensatzbegrenzerzeichenfolge' und 'Datensatzpräfix' schließen sich gegenseitig aus. Sie wird standardmäßig nicht verwendet.

Feldstandardwerte

Definiert die Standardeigenschaften für Spalten, die in die Datei(en) geschrieben werden. Diese werden auf alle geschriebenen Spalten angewendet, können jedoch für einzelne Spalten über die Registerkarte Spalten mithilfe des Dialogfelds Spaltenmetadaten bearbeiten überschrieben werden. An den Stellen, an denen Sie ein Zeichen eingeben können, kann dies in der Regel ein ASCII-Zeichen oder ein Unicode-Mehrbytezeichen sein (sofern die Unterstützung landessprachlicher Versionen aktiviert ist). Die folgenden Eigenschaften sind verfügbar:
  • Tatsächliche Feldlänge. Gibt die Anzahl der Byte an, die mit dem Füllzeichen aufgefüllt werden sollen, wenn ein Feld als 'null' identifiziert wird. Wenn DataStage ein Nullfeld identifiziert, wird ein Feld dieser Länge mit Füllzeichen geschrieben. Diese Angabe und der Nullfeldwert schließen sich gegenseitig aus.
  • Begrenzer. Gibt den abschließenden Begrenzer aller Felder in dem Datensatz an. Geben Sie ein ASCII-Zeichen ein oder wählen Sie einen Begrenzer des Typs 'Leerzeichen', 'Ende', 'Keine', 'Null', 'Komma' oder 'Tabulatorzeichen' aus.
    • Leerzeichen. Leerzeichen am Ende einer Spalte werden ignoriert, d. h., sie werden nicht als Teil der Spalte behandelt.
    • Ende. Das Ende eines Felds wird als Begrenzer verwendet, d. h., es gibt keinen separaten Begrenzer. Dies ist nicht identisch mit der Einstellung 'Keine', die für Felder mit Spalten mit fester Breite verwendet wird.
    • Keine. Kein Begrenzer (wird für feste Breite verwendet).
    • Null. Es wird ein ASCII-Nullzeichen verwendet.
    • Komma. Es wird ein ASCII-Komma verwendet.
    • Tabulator. Es wird ein ASCII-Tabulatorzeichen verwendet.
  • Begrenzerzeichenfolge. Geben Sie eine Zeichenfolge an, die am Ende eines jeden Feldes geschrieben werden soll. Geben Sie ein oder mehrere Zeichen ein. Diese Angabe und 'Begrenzer' (der Standardwert) schließen sich gegenseitig aus. Beispielsweise wird mit `, ` (Komma und nachfolgendes Leerzeichen - die Angabe der Hochkommas ist nicht erforderlich) angegeben, dass jedes Feld durch `, ` begrenzt werden soll, es sei denn, diese Angabe wird für einzelne Felder überschrieben.
  • Nullfeldlänge. Die Länge eines Felds variabler Länge in Byte, das eine Null enthält. Wenn ein Feld variabler Länge geschrieben wird, schreibt DataStage einen Längenwert von null Feldlänge, wenn das Feld eine Null enthält. Diese Angabe und der Nullfeldwert schließen sich gegenseitig aus.
  • Nullfeldwert. Gibt den Wert an, der in ein Nullfeld geschrieben wird, wenn die Quelle auf null gesetzt ist. Es kann sich um eine Zahl, eine Zeichenfolge oder ein Literal-Escapezeichen des Typs C handeln. Sie können beispielsweise einen Bytewert durch \ooo darstellen, wobei jedes Vorkommen von o eine Oktalziffer 0-7 und das erste Vorkommen von o ein Wert von < 4 ist, oder durch \xhh, wobei jedes Vorkommen von h eine Hexadezimalziffer 0-F ist. Sie müssen dieses Formular verwenden, um nicht druckbare Bytewerte zu codieren.

    Diese Eigenschaft und 'Nullfeldlänge' sowie 'Tatsächliche Länge' schließen sich gegenseitig aus. Bei der Darstellung von Daten fester Breite können Sie 'Füllzeichen' (im Abschnitt 'Allgemein' unter 'Typstandardwerte') verwenden, um ein wiederholtes abschließendes Zeichen anzugeben, wenn der von Ihnen angegebene Wert kürzer als die feste Breite des Felds ist.

    'Nullfeldwert' weist eine Untereigenschaft namens 'Trennzeichen für Nullfeldwerte' auf. Sie ist für Ausgabedaten vorgesehen und sollte bei Formatregisterkarten, die zu Eingabelinks gehören, ignoriert werden.

  • Präfixbyte. Gibt an, dass jede Spalte in der Datendatei ein Präfix aus 1, 2 oder 4 Byte besitzt, welches als binären Wert entweder die Länge der Spalte oder für ein mit Tags versehenes Feld den Tagwert enthält.

    Sie können diese Option für Felder variabler Länge verwenden. Felder variabler Länge können entweder durch ein Zeichen begrenzt werden oder durch ein vorgestelltes 1-, 2-oder 4-Byte-Präfix, das die Feldlänge enthält. DataStage fügt das Präfix vor jedem Feld ein.

    Diese Eigenschaft schließt sich gegenseitig aus mit den Eigenschaften 'Begrenzer', 'Quote' und 'Letzter Begrenzer', die standardmäßig verwendet werden.

  • Feld drucken. Diese Eigenschaft ist für Eingabelinks nicht relevant.
  • Anführungszeichen. Gibt an, dass Felder variabler Länge in einfache Anführungszeichen, doppelte Anführungszeichen oder ein anderes ASCII-Zeichen oder ein ASCII-Zeichenpaar eingeschlossen werden. Wählen Sie Einfach oder Doppelt aus oder geben Sie ein Zeichen ein. Für diese Einstellung ist standardmäßig die Verwendung doppelter Anführungszeichen festgelegt.

    Beim Schreiben fügt DataStage das führende Anführungszeichen, die Daten und ein abschließendes Anführungszeichen ein. Anführungszeichen werden nicht als Teil der Länge eines Feldes gezählt.

  • Vektorpräfix. Gibt für Felder, die Vektoren variabler Länge sind, ein 1-, 2- oder 4-Byte-Präfix an, das die Anzahl Elemente im Vektor enthält. Sie können dieses Standardpräfix für einzelne Vektoren überschreiben.

    Vektoren variabler Länge müssen entweder ein Präfix für den Vektor oder einen Link zu einem anderen Feld verwenden, um die Anzahl Elemente in dem Vektor anzugeben. Wenn dem Vektor variabler Länge ein Präfix vorangestellt ist, geben Sie mit dieser Eigenschaft die Präfixlänge an. DataStage fügt die Elementanzahl als Präfix jedes Vektorfelds variabler Länge ein. Standardmäßig wird eine Präfixlänge von 1 Byte angenommen.

Standardwerte für Datentyp

Hierbei handelt es sich um Eigenschaften, die für alle Spalten eines bestimmten Datentyps gelten, sofern sie nicht auf Spaltenebene explizit überschrieben werden. Sie sind gemäß dem Datentyp in eine Reihe von Untergruppen unterteilt.

Allgemein

Diese Eigenschaften gelten für mehrere Datentypen (sofern sie nicht auf Spaltenebene überschrieben werden):
  • Byteanordnung. Gibt an, wie mehrere Bytedatentypen (mit Ausnahme von Zeichenfolge- und Rohdatentypen) angeordnet werden. Gültige Auswahlmöglichkeiten sind:
    • little-endian. Das höchstwertige Byte - High Byte - befindet sich auf der rechten Seite.
    • big-endian. Das höchstwertige Byte - High Byte - befindet sich auf der linken Seite.
    • native-endian. Wie durch das native Format des Geräts definiert. Dies ist die Standardeinstellung.
  • Datenformat. Gibt das Datendarstellungsformat eines Felds an. Gilt für Felder aller Datentypen mit Ausnahme von 'string', 'ustring' und 'raw' sowie Datensatzfelder, Unterdatensatzfelder oder mit Tags versehene Felder, die mindestens ein Feld enthalten, das weder den Typ 'string' noch den Typ 'raw' hat. Gültige Auswahlmöglichkeiten sind:
    • Binär
    • text (Standardeinstellung)

      Die Einstellung 'binary' unterschiedliche Bedeutungen, wenn sie auf verschiedene Datentypen angewendet wird:

    • Für Dezimalzahlen hat 'binary' die Bedeutung 'gepackt'.
    • Für andere numerische Datentypen hat 'binary' die Bedeutung 'nicht Text'.
    • Für Datumsangaben ist 'binary' äquivalent zur Angabe der Eigenschaft 'julian' für das Datumsfeld.
    • Für die Uhrzeit ist 'binary' äquivalent zu 'midnight_seconds'.
    • Für Zeitmarken gibt 'binary' an, dass die erste ganze Zahl einen julianischen Tageszähler für den Datumsteil der Zeitmarke enthält und die zweite ganze Zahl den Zeitteil der Zeitmarke als die Anzahl Sekunden ab Mitternacht angibt. Eine binäre Zeitmarke gibt an, dass zwei 32-Bit-Ganzzahlen geschrieben werden.

      Standardmäßig werden Daten wie folgt als Text formatiert:

    • Für den Datentyp 'date' gibt 'text' an, dass die Daten, die geschrieben werden sollen, ein textbasiertes Datum im Format %yyyy-%mm-%dd oder im Standarddatumsformat enthalten, wenn Sie eine neue auf einem NLS-System definiert haben.
    • Für den Datentyp 'decimal' stellt ein Feld eine Dezimalzahl in einem Zeichenfolgeformat mit einem führenden Leerzeichen oder '-' gefolgt von Dezimalziffern mit einem eingebetteten Dezimalzeichen dar, wenn die Anzahl der Kommastellen nicht null ist. Das Zielzeichenfolgenformat lautet [+ | -]ddd.[ddd] und alle Argumente für die Genauigkeit und die Anzahl der Kommastellen werden ignoriert.
    • Bei numerischen Feldern (int8, int16, int32, uint8, uint16, uint32, sfloat und dfloat): DataStage geht davon aus, dass numerische Felder als Text dargestellt werden.
    • Für den Datentyp 'time' gibt 'text' an, dass das Feld die Uhrzeit im textbasierten Format %hh: %nn:%ss oder im Standarddatumsformat angibt, wenn Sie eine neue Uhrzeit auf einem NLS-System definiert haben.
    • Für den Datentyp timestamp gibt 'text' eine textbasierte Zeitmarke im Format %yyyy-%mm-%dd %hh: %nn:%ss oder im Standarddatumsformat an, wenn Sie eine neue auf einem NLS-System definiert haben.
  • Max. Breite des Feldes. Die maximale Anzahl an Bytes in einer Spalte, die als Zeichenfolge dargestellt wird. Geben Sie eine Zahl ein. Dies ist nützlich, wenn Sie Zahlen als Text speichern. Wenn Sie einen Zeichensatz mit fester Breite verwenden, können Sie die Länge genau berechnen. Wenn Sie einen Zeichensatz mit variabler Länge verwenden, berechnen Sie eine ausreichende maximale Breite für Ihre Felder. Gilt für Felder aller Datentypen außer Datum, Uhrzeit, Zeitstempel und Rohwert; und für Datensatz, Unterdatensatz oder Mit Tag versehen, wenn diese mindestens ein Feld dieses Typs enthalten.
  • Feldbreite. Die Anzahl Byte in einem Feld, das als Zeichenfolge dargestellt wird. Geben Sie eine Zahl ein. Dies ist nützlich, wenn Sie Zahlen als Text speichern. Wenn Sie einen Zeichensatz mit fester Breite verwenden, können Sie die Anzahl Byte exakt berechnen. Wenn es sich um eine Codierung variabler Länge handelt, basieren Sie Ihre Berechnung auf der Breite und Häufigkeit Ihrer Zeichen variabler Breite. Gilt für Felder aller Datentypen außer Datum, Uhrzeit, Zeitstempel und Rohwert; und für Datensatz, Unterdatensatz oder Mit Tag versehen, wenn diese mindestens ein Feld dieses Typs enthalten.

    Wenn Sie weder die Feldbreite noch die maximale Breite des Feldes angeben, haben numerische Felder, die als Text geschrieben werden, die folgende Anzahl Byte als maximale Breite:

    • 8-Bit-Ganzzahlen mit oder ohne Vorzeichen: 4 Byte
    • 16-Bit-Ganzzahlen mit oder ohne Vorzeichen: 6 Byte
    • 32-Bit-Ganzzahlen mit oder ohne Vorzeichen: 11 Byte
    • 64-Bit-Ganzzahlen mit oder ohne Vorzeichen: 21 Byte
    • Gleitkommazahl mit einfacher Genauigkeit: 14 Byte (Vorzeichen, Ziffer, Dezimalzeichen, 7 Bruchteil, "E", Vorzeichen, 2 Exponent)
    • Gleitkommazahl mit doppelter Genauigkeit: 24 Byte (Vorzeichen, Ziffer, Dezimalzeichen, 16 Bruchteil, "E", Zeichen, 3 Exponent)
    Wichtig: Wenn Sie Unicode-Zeichenspalten verwenden, müssen Sie die Feldlänge in Byte berechnen und diesen Wert in der Spalteneigenschaft 'Feldbreite' angeben.
  • Füllzeichen. Gibt das Füllzeichen an, das verwendet wird, wenn Zeichenfolgen oder numerische Werte in eine externe Zeichenfolgedarstellung exportiert werden. Geben Sie ein Zeichen ein (Einzelbyte für Zeichenfolgen; kann ein Mehrbyte-Zeichen für 'ustrings' sein) oder wählen Sie Null oder Leerzeichen aus. Das Füllzeichen wird verwendet, wenn die externe Zeichenfolgedarstellung größer ist, als für das geschriebene Feld erforderlich. In diesem Fall wird die externe Zeichenfolge mit dem Füllzeichen auf die volle Länge aufgefüllt. Der Standardwert ist Leerzeichen. Gilt für die Datentypen 'string', 'ustring' und 'numeric' sowie für Typen 'record', 'subrec' oder 'tagged', falls diese mindestens ein Feld dieses Typs enthalten.
  • Zeichensatz. Gibt den Zeichensatz an. Wählen Sie ASCII oder EBCDIC aus. Der Standardwert ist ASCII. Gilt für alle Datentypen mit Ausnahme von 'raw' und 'ustring' sowie für die Typen 'record', 'subrec' oder 'tagged', die ausschließlich Felder des Typs 'raw' oder 'ustring' enthalten.

Zeichenfolge

Diese Eigenschaften werden auf Spalten mit einem Zeichenfolgedatentyp angewendet, sofern sie nicht auf Spaltenebene überschrieben werden.
  • EBCDIC als ASCII exportieren. Wählen Sie diese Option aus, um anzugeben, dass EBCDIC-Zeichen als ASCII-Zeichen geschrieben werden sollen. Gilt für Felder des Typs 'string' und 'record', 'subrec' oder 'tagged', wenn sie mindestens ein Feld dieses Typs enthalten.
  • ASCII als EBCDIC importieren. Für Eingabelinks nicht relevant.

DECIMAL

Diese Eigenschaften werden auf Spalten mit dem Datentyp 'decimal' angewendet, sofern sie nicht auf Spaltenebene überschrieben werden.
  • Lauter Nullen zulassen. Gibt an, ob eine gepackte Dezimalspalte, die ausschließlich Nullen enthält (normalerweise nicht zulässig), als gültige Darstellung von Null behandelt werden soll oder nicht. Wählen Sie Ja oder Nein aus. Der Standardwert ist Nein.
  • Dezimaltrennzeichen. Geben Sie das ASCII-Zeichen an, das als Dezimaltrennzeichen dient (standardmäßig der Punkt).
  • Gepackt. Wählen Sie eine Option aus, um anzugeben, was die dezimalen Spalten enthalten. Gültige Auswahlmöglichkeiten sind:
    • Ja, um anzugeben, dass die Dezimalspalten Daten im gepackten Dezimalformat enthalten (Standardeinstellung). Diese Eigenschaft hat die folgenden Untereigenschaften:

      Überprüfen. Wählen Sie Ja aus, um zu überprüfen, ob die Daten gepackt sind; wählen Sie Nein aus, um die Überprüfung zu überspringen.

      Mit Vorzeichen. Wählen Sie Ja aus, um das vorhandene Vorzeichen beim Schreiben von Dezimalspalten zu verwenden. Wählen Sie Nein aus, um unabhängig vom tatsächlichen Vorzeichenwert der Spalte ein positives Vorzeichen (0xf) zu schreiben.

    • Wählen Sie Nein (getrennt) aus, um anzugeben, dass nicht gepackte Dezimalzahlen mit einem separaten Vorzeichenbyte enthalten sind. Diese Eigenschaft hat die folgende Untereigenschaft:

      Vorzeichenposition. Wählen Sie 'vorangestellt' oder 'nachgestellt' aus.

    • Wählen Sie Nein (gezont) aus, um anzugeben, dass eine nicht gepackte Dezimalzahl in ASCII- oder EBCDIC-Textformat enthalten ist. Diese Eigenschaft hat die folgende Untereigenschaft:

      Vorzeichenposition. Wählen Sie 'vorangestellt' oder 'nachgestellt' aus.

    • Wählen Sie Nein (Overpunch) aus, um anzugeben, dass das Feld ein vorangestelltes oder abschließendes Byte hat, das ein Zeichen enthält, das sowohl den numerischen Wert dieses Byte angibt als auch, ob die Zahl als Ganzes mit negativem oder positivem Vorzeichen versehen ist. Diese Eigenschaft hat die folgende Untereigenschaft:

      Vorzeichenposition. Wählen Sie 'vorangestellt' oder 'nachgestellt' aus.

  • Genauigkeit. Gibt die Genauigkeit an, mit der eine Dezimalspalte in Textformat dargestellt wird. Geben Sie eine Zahl ein. Wenn eine Dezimalzahl in eine Zeichenfolgedarstellung geschrieben wird, verwendet DataStage die Genauigkeit und den Maßstab, die für das Quellendezimalfeld definiert sind, um die Länge der Zielzeichenfolge zu bestimmen. Die Eigenschaften Genauigkeit und Dezimalstellen überschreiben diesen Standardwert. Wenn sie definiert sind, schneidet DataStage die Quellendezimalzahl ab oder füllt sie auf die Größe der Zielzeichenfolge auf. Wenn Sie auch die Eigenschaft 'Feldbreite' angegeben haben, schneidet DataStage die Quellendezimalzahl ab oder füllt sie auf die durch die Feldbreite angegebene Größe auf.
  • Rundung. Gibt an, wie eine Dezimalspalte beim Schreiben gerundet werden soll. Gültige Auswahlmöglichkeiten sind:
    • Aufrunden (obere Grenze). Die Spalte "Quelle" in eine positive Unendlichkeit kürzen. Dieser Modus entspricht dem Aufrundungsmodus IEEE 754. Beispiel: Aus 1,4 wird 2, aus -1,6 wird -1.
    • Abrunden (untere Grenze). Die Spalte "Quelle" in eine negative Unendlichkeit kürzen. Dieser Modus entspricht dem Abrundungsmodus IEEE 754. Beispiel: Aus 1,6 wird 1, aus -1,4 wird -2.
    • Auf den nächsten Wert runden. Runden Sie die Spalte "Quelle" auf den nächsten darstellbaren Wert auf oder ab. Dieser Modus entspricht dem COBOL-Modus GERUNDET. Beispiel: Aus 1,4 wird 1, aus 1,5 wird 2, aus -1,4 wird -1, aus -1,5 wird -2.
    • Nachkommastellen abschneiden. Dies ist die Standardeinstellung. Alle Nachkommastellen rechts von der äußersten rechten Nachkommastelle, die im Ziel unterstützt wird, unabhängig vom Vorzeichen verwerfen. Ist das Ziel beispielsweise eine Ganzzahl, werden alle Nachkommastellen entfernt. Wenn das Ziel eine andere Dezimalzahl mit einer kleineren Dezimalstellen-Angabe ist, wird auf die Anzahl der Kommastellen der Zieldezimalzahl gekürzt. Dieser Modus entspricht der COBOL-Funktion INTEGER-PART. Bei dieser Methode wird 1.6 zu 1, -1.6 wird zu -1.
  • Nachkommastellen. Gibt an, wie eine Quellendezimalzahl gerundet wird, wenn ihre Genauigkeit und die Anzahl ihrer Nachkommastellen größer als die des Ziels sind. Wenn der DataStage eine Quellendezimalzahl in eine Zeichenfolgedarstellung schreibt, verwendet er standardmäßig die Genauigkeit und den Maßstab, die für das Quellendezimalfeld definiert sind, um die Länge der Zielzeichenfolge zu bestimmen. Sie können den Standardwert mithilfe der Eigenschaften für Genauigkeit und Nachkommastellen überschreiben. Wenn Sie dies tun, schneidet DataStage die Quellendezimalzahl ab oder füllt sie auf die Größe der Zielzeichenfolge auf. Wenn Sie auch die Eigenschaft 'Feldbreite' angegeben haben, schneidet DataStage die Quellendezimalzahl ab oder füllt sie auf die durch die Feldbreite angegebene Größe auf.

Numerisch

Diese Eigenschaften gelten für Felder für ganze Zahlen (Integer) und für Gleitkommafelder, sofern sie nicht auf Spaltenebene überschrieben werden.
  • C_format. Führt eine nicht standardmäßige Konvertierung von Daten aus Ganzzahl- (Integer-) oder Gleitkommadaten in eine Zeichenkette durch. Diese Eigenschaft gibt eine Zeichenfolge im Format der Programmiersprache C an, die zum Schreiben von Ganzzahlzeichenfolgen oder Gleitkommazeichenfolgen verwendet wird. Diese Zeichenfolge wird an sprintf() übergeben. Wenn Sie beispielsweise ein C-Format von %x und eine Feldbreite von 8 angeben, wird sichergestellt, dass Ganzzahlen als hexadezimale 8-Byte-Zeichenfolgen formatiert werden.
  • In_format. Diese Eigenschaft ist für Eingabelinks nicht relevant..
  • Out_format. Formatzeichenfolge, die zum Konvertieren von Daten aus Ganzzahl- oder Gleitkommadaten in eine Zeichenfolge verwendet wird. Diese wird an sprintf() übergeben. Standardmäßig ruft DataStage die C-Funktion sprintf() auf, um ein numerisches Feld, das als Ganzzahl-oder Gleitkommadaten formatiert ist, in eine Zeichenfolge zu konvertieren. Wenn diese Funktion keine Daten in einem zufriedenstellenden Format ausgibt, können Sie die Eigenschaft 'out_format' angeben, um Formatierungsargumente an sscanf() zu übergeben.

Date

Diese Eigenschaften werden auf Spalten mit dem Datentyp 'date' angewendet, sofern sie nicht auf Spaltenebene überschrieben werden. Alle diese Eigenschaften sind mit der Einstellung 'Text' für das Datenformat nicht kompatibel.
  • Tage seit. Datumsangaben werden als ganze Zahl mit Vorzeichen geschrieben, die die Anzahl Tage seit dem angegebenen Datum enthält. Geben Sie ein Datum im Format %jjjj-%mm-%tt oder im Standarddatumsformat ein, wenn Sie auf einem NLS-System ein neues Format definiert haben.
  • Formatzeichenfolge. Das Zeichenfolgeformat eines Datums. Standardmäßig ist dies %yyyy-%mm-%dd.
  • Julianisch. Wählen Sie diese Option aus, um anzugeben, dass Datumsangaben als numerischer Wert geschrieben werden, der den julianischen Tag enthält. Ein Julianischer Tag gibt das Datum als die Anzahl der Tage ab 4713 BCE Januar 1, 12:00 Uhr (Mittag) an. GMT.

Zeit

Diese Eigenschaften werden auf Spalten mit dem Datentyp 'time' angewendet, sofern sie nicht auf Spaltenebene überschrieben werden. Alle diese Eigenschaften sind mit der Einstellung 'Text' für das Datenformat nicht kompatibel.
  • Formatzeichenfolge. Gibt das Format der Spalten an, die die Uhrzeit als Zeichenfolge darstellen.
  • Sekunden ab Mitternacht. Wählen Sie diese Option aus, um anzugeben, dass Uhrzeiten als binäre 32-Bit-Ganzzahl geschrieben werden, die die Anzahl Sekunden enthält, die seit Mitternacht verstrichen sind.

Zeitmarke

Diese Eigenschaften werden auf Spalten mit dem Datentyp 'timestamp' angewendet, sofern sie nicht auf Spaltenebene überschrieben werden.
  • Formatzeichenfolge. Gibt das Format einer Spalte an, die eine Zeitmarke als Zeichenfolge darstellt. Der Standardwert ist %jjjj-%mm-%tt %hh:%nn:%ss. Das Format kombiniert das Format für Datumszeichenfolgen und Zeitzeichenfolgen.