Übersicht (Befehl DATASET NAME)

Mit den DATASET -Befehlen (DATASET NAME, DATASET ACTIVATE, DATASET DECLARE, DATASET COPY, DATASET CLOSE) können Sie mehrere Datenquellen gleichzeitig öffnen und steuern, welche offene Datenquelle zu einem beliebigen Zeitpunkt in der Sitzung aktiv ist. Mithilfe definierter Datasetnamen können Sie folgende Aktionen ausführen:

  • Merge data (for example, MATCH FILES, ADD FILES, UPDATE) from multiple different source types (for example, text data, database, spreadsheet) without saving each one as an external IBM® SPSS® Statistics data file first.
  • Erstellen Sie neue Datasets, die Subsets offener Datenquellen sind (z. B. Männer in einem Subset, Frauen in einem anderen, Personen unter einem bestimmten Alter in einem anderen oder Originaldaten in einem Set und transformierte/berechnete Werte in einem anderen Subset).
  • Kopieren Sie Variablen, Fälle und/oder Variableneigenschaften zwischen zwei oder mehr geöffneten Datenquellen im Dateneditor und fügen Sie sie ein.

Befehl DATASET NAME :

  • Weist dem aktiven Dataset einen eindeutigen Namen zu, der in nachfolgenden Dateizugriffsbefehlen und nachfolgenden DATASET -Befehlen verwendet werden kann.
  • Stellt die aktuelle Datendatei auch nach dem Öffnen/Aktivieren anderer Datenquellen zur Verfügung.

Es gelten folgende allgemeine Regeln:

  • Wenn das aktive Dataset bereits über einen definierten Datasetnamen verfügt, wird die vorhandene Zuordnung unterbrochen und der neue Name der aktiven Datei zugeordnet.
  • Wenn der Name bereits einem anderen Dataset zugeordnet ist, wird diese Zuordnung unterbrochen und die neue Zuordnung erstellt. Das zuvor diesem Namen zugeordnete Dataset ist geschlossen und nicht mehr verfügbar.

Basisspezifikation

Die Basisspezifikation für DATASET NAME ist der Befehlsname gefolgt von einem Namen, der den Namenskonventionen für Variablen entspricht. Weitere Informationen finden Sie im Thema Variablennamen .

Schlüsselwort WINDOW

Das Schlüsselwort WINDOW steuert den Status des Dateneditorfensters, das dem Dataset zugeordnet ist.

ASIS. Das Fenster des Dateneditors, das das Dataset enthält, ist nicht betroffen. Dies ist die Standardeinstellung.

VORDERSEITE. Das Dateneditorfenster mit dem Dataset wird an den Anfang gestellt und das Dataset wird zum aktiven Dataset für Dialogfenster.

Operationen

  • Befehle werden für das aktive Dataset ausgeführt. The Aktiv dataset is the data source most recently opened (for example, by commands such as GET DATA, GET SAS, GET STATA, GET TRANSLATE) or most recently activated by a DATASET ACTIVATE command.

    Hinweis: Das aktive Dataset kann auch geändert werden, indem Sie auf eine beliebige Stelle im Dateneditorfenster einer geöffneten Datenquelle klicken oder ein Dataset aus der Liste der verfügbaren Datasets in der Symbolleiste eines Syntaxfensters auswählen.

  • Variablen aus einem Dataset sind nicht verfügbar, wenn ein anderes Dataset das aktive Dataset ist.
  • Transformationen zum aktiven Dataset-vor oder nach der Definition eines Datasetnamens-werden mit dem benannten Dataset während der Sitzung beibehalten. Alle anstehenden Transformationen zum aktiven Dataset werden automatisch ausgeführt, sobald eine andere Datenquelle zum aktiven Dataset wird.
  • Datasetnamen können in den meisten Befehlen verwendet werden, die Referenzen auf IBM SPSS Statistics -Datendateien enthalten können.
  • Bei Befehlen, die ein neues Dataset erstellen oder ein vorhandenes Dataset überschreiben können, können Sie den Datasetnamen des aktiven Datasets nicht zum Überschreiben des aktiven Datasets verwenden. Wenn das aktive Dataset beispielsweise mydataist, führt ein Befehl mit dem Unterbefehl /OUTFILE=mydata zu einem Fehler. Um ein benanntes aktives Dataset zu überschreiben, verwenden Sie einen Stern anstelle des Datasetnamens. Beispiel: /OUTFILE=*.
  • Wenn ein Datasetname, eine Dateikennung (definiert durch den Befehl FILE HANDLE ) oder ein Dateiname verwendet werden kann, um auf IBM SPSS Statistics -Datendateien zu verweisen, haben definierte Datasetnamen Vorrang vor Dateikennungen, die Vorrang vor Dateinamen haben. Wenn beispielsweise file1 sowohl als Datasetname als auch als Dateikennung vorhanden ist, wird FILE=file1 im Befehl MATCH FILES als Verweis auf das Dataset mit dem Namen file1interpretiert und nicht als Dateikennung.

Beispiel

GET FILE='/examples/data/mydata.sav'.
SORT CASES BY ID.
DATASET NAME mydata.
GET DATA /TYPE=XLS 
  /FILE='/examples/data/excelfile.xls'.
SORT CASES BY ID.
DATASET NAME excelfile.
GET DATA /TYPE=ODBC /CONNECT=
 'DSN=MS Access Database;DBQ=/examples/data/dm_demo.mdb;'+
 'DriverId=25;FIL=MS Access;MaxBufferSize=2048;PageTimeout=5;'
 /SQL='SELECT * FROM main'.
SORT CASES BY ID.
MATCH FILES
 /FILE='mydata'
 /FILE='excelfile'
 /FILE=*
 /BY ID.
  • Eine Datendatei im Format IBM SPSS Statistics mit dem Datasetnamen mydata. Da ihm ein Datasetname zugeordnet wurde, bleibt er auch nach dem Öffnen anderer Datenquellen für die spätere Verwendung verfügbar.
  • Anschließend wird eine Excel-Datei gelesen und dem Datasetnamen excelfilezugewiesen. Wie die Datendatei IBM SPSS Statistics bleibt die Datei verfügbar, nachdem ihr ein Datasetname zugewiesen wurde, nachdem andere Datenquellen geöffnet wurden.
  • Anschließend wird eine Tabelle aus einer Datenbank gelesen. Da es sich um das zuletzt geöffnete oder aktivierte Dataset handelt, ist es das aktive Dataset.
  • Die drei Datasets werden dann zusammen mit dem Befehl MATCH FILES zusammengeführt, wobei die Datasetnamen in den Unterbefehlen von FILE anstelle von Dateinamen verwendet werden.
  • Mit einem Stern (*) wird das aktive Dataset angegeben, bei dem es sich in diesem Beispiel um die Datenbanktabelle handelt.
  • Die Dateien werden auf der Basis des Werts der Schlüsselvariablen ID, die im Unterbefehl BY angegeben wurde, zusammengeführt.
  • Da alle zusammenzuführenden Dateien in derselben Reihenfolge der Schlüsselvariablen sortiert werden müssen, wird SORT CASES für jedes Dataset ausgeführt.