XML-Quellenknoten

Diese Funktion ist in SPSS Modeler Professional und SPSS Modeler Premium verfügbar.

Mit dem XML-Quellenknoten können Sie die Daten aus einer Datei im XML-Format in einen IBM® SPSS Modeler-Stream importieren. XML ist eine Standardsprache für den Datenaustausch und gilt für viele Unternehmen als das bevorzugte Format für diesen Zweck. So möchte beispielsweise eine Steuerbehörde Daten aus Steuererklärungen analysieren, die online und im XML-Format übermittelt wurden (siehe http://www.w3.org/standards/xml/).

Durch Importieren von XML-Daten in einen IBM SPSS Modeler-Stream können Sie zahlreiche Vorhersageanalysefunktionen an der Quelle ausführen. Die XML-Daten werden in ein Tabellenformat gegliedert, bei dem die Spalten den verschiedenen Verschachtelungsniveaus der XML-Elemente und Attribute entsprechen. Die XML-Objekte werden im XPath-Format angezeigt (siehe http://www.w3.org/TR/xpath20/).

Wichtig: Der XML-Quellenknoten berücksichtigt keine Namensbereichsdeklaration. Beispielsweise dürfen Ihre XML-Dateien keinen Doppelpunkt (:) im Tag name enthalten. Ist dies jedoch der Fall, empfangen Sie während der Ausführung Fehler zu ungültigen Zeichen.

Einzelne Datei lesen. Standardmäßig liest SPSS Modeler eine einzelne Datei, die Sie im Feld XML-Datenquelle angeben.

Alle XML-Dateien in einem Verzeichnis lesen. Wenn Sie diese Option auswählen, werden alle XML-Dateien in einem bestimmten Verzeichnis gelesen. Geben Sie die Position in dem Feld Verzeichnis an, das angezeigt wird. Aktivieren Sie das Kontrollkästchen Unterverzeichnisse einschließen, um zusätzlich XML-Dateien aus allen Unterverzeichnissen des angegebenen Verzeichnisses zu lesen.

XML-Datenquelle. Geben Sie den vollständigen Pfad und Dateinamen der XML-Quellendatei an, die Sie importieren möchten, oder verwenden Sie die Schaltfläche Durchsuchen, um die Datei zu finden.

XML-Schema. (Optional) Geben Sie den vollständigen Pfad und Dateinamen einer XSD- oder DTD-Datei an, aus der die XML-Struktur gelesen werden soll, oder verwenden Sie die Schaltfläche Durchsuchen, um diese Datei zu finden. Wenn Sie dieses Feld frei lassen, wird die Struktur aus der XML-Quellendatei gelesen. Eine XSD- oder DTD-Datei kann mehr als ein Stammelement besitzen. In diesem Fall wird ein Dialogfeld angezeigt, in dem Sie das gewünschte Stammelement auswählen, wenn Sie den Fokus auf ein anderes Feld wechseln. Weitere Informationen finden Sie in Auswählen aus mehreren Stammelementen.
Anmerkung: XSD-Indikatoren werden von SPSS Modeler ignoriert.

XML-Struktur. Ein hierarchischer Baum, der die Struktur der XML-Quellendatei anzeigt (oder das Schema, sofern Sie eines im Feld XML-Schema angegeben haben). Zum Definieren einer Datensatzgrenze wählen Sie ein Element aus und klicken auf die Schaltfläche mit dem Rechtspfeil, um das Objekt in das Feld Datensätze zu kopieren.

Attribute anzeigen. Zeigt die Attribute der XML-Elemente in dem Feld XML-Struktur an oder blendet sie aus.

Datensätze (XPath-Ausdruck). Zeigt die XPath-Syntax für ein Element an, das aus dem Feld "XML-Struktur" kopiert wurde. Dieses Element wird dann in der XML-Struktur hervorgehoben und definiert die Datensatzgrenze. Jedes Mal, wenn dieses Element in der Quellendatei gefunden wird, wird ein neuer Datensatz erstellt. Wenn das Feld leer ist, wird das erste untergeordnete Element unter dem Stamm als Datensatzgrenze verwendet.

Alle Daten lesen. Standardmäßig werden alle Daten in der Quellendatei in den Stream eingelesen.

Zu lesende Daten angeben. Wählen Sie diese Option aus, wenn Sie einzelne Elemente, Attribute oder beides importieren möchten. Durch Auswählen dieser Option wird die Feldertabelle aktiviert, in der Sie die zu importierenden Daten angeben können.

Felder. In dieser Tabelle werden die für den Import ausgewählten Elemente und Attribute angezeigt, wenn Sie die Option Zu lesende Daten angeben ausgewählt haben. Sie können die XPath-Syntax eines Elements oder Attributs entweder direkt in die Spalte "XPath" eingeben oder ein Element oder Attribut in der XML-Struktur auswählen und auf die Schaltfläche mit dem Rechtspfeil klicken, um das Objekt in die Tabelle zu kopieren. Zum Kopieren aller untergeordneten Elemente und Attribute eines Elements wählen Sie das Element in der XML-Struktur aus und klicken Sie auf die Schaltfläche mit dem Doppelpfeil.

  • XPath. Die XPath-Syntax der zu importierenden Objekte.
  • Speicherort. Der Speicherort in der XML-Struktur der zu importierenden Objekte. Fester Weg zeigt den Weg des Objekts im Verhältnis zu dem in der XML-Struktur hervorgehobenen Element (oder dem ersten untergeordneten Element unter dem Stamm, wenn kein Element hervorgehoben ist). Beliebiger Ort kennzeichnet ein Objekt mit dem angegebenen Namen an einem beliebigen Ort in der XML-Struktur. Benutzerdefiniert wird angezeigt, wenn Sie den Ort direkt in die XPath-Spalte eingeben.