Einlesen von CSV-Dateien

Wenn Sie CSV-Dateien einlesen wollen, wählen Sie in den Menüs Folgendes aus: Datei > Importieren... oder ziehen Sie eine vorhandene CSV-Datei direkt in eine offene IBM® SPSS Statistics-Instanz und legen Sie sie dort ab.

Anmerkung: Die Funktion "Daten importieren" unterstützt keine CSV-Daten, die eingebettete Zeilenumbrüche in Text in Hochkommas enthalten. Eine mögliche Fehlerumgehung besteht darin, die CSV-Datei (die eingebettete Zeilenumbrüche in Hochkommas enthält) als .xls/.xlsx-Datei zu speichern und dann die Excel-Importfunktion zu verwenden.

Über das Dialogfeld CSV-Daten importieren werden Textdatendateien eingelesen, in denen ein Komma, Semikolon oder Tabulator als Trennzeichen zwischen den Werten verwendet wird. Klicken Sie auf Importieren, nachdem Sie die entsprechenden Importeinstellungen ausgewählt haben.

Dialogfeld "Variableneinstellungen"

Trennzeichen
Das Trennzeichen ist das Zeichen, das verwendet wird, um Variablen zu trennen. Gültige Werte sind Tabulatorzeichen, Kommas, Leerzeichen, Semikolons oder ein Zeichen, das Sie definieren. Die Variablen werden für jeden Fall in derselben Reihenfolge aufgezeichnet, befinden sich aber nicht notwendigerweise an derselben Spaltenposition.
Textqualifikationszeichen
Das Qualifikationszeichen ist das Zeichen, das verwendet wird, um Werte einzuschließen, die das Trennzeichen enthalten. Das Qualifikationszeichen wird am Anfang und am Ende des Werts angezeigt. Als Qualifikationszeichen kann ein doppeltes Anführungszeichen, ein einzelnes Anführungszeichen oder kein Zeichen verwendet werden.
Variablennamen am Anfang des Dateiabschnitts
Geben Sie an, ob die Variablennamen oben in der CSV-Datei enthalten sind. Die Werte in der angegebenen Zeilennummer werden zum Erstellen der Variablennamen verwendet. Werte, die nicht den Regeln für Variablennamen entsprechen, werden in gültige Variablennamen umgewandelt.
Führende und nachfolgende Leerzeichen
Geben Sie an, ob Leerzeichen am Anfang und/oder Ende der Zeichenfolgewerte entfernt werden sollen.
Anmerkung: Nachfolgende Leerzeichen wirken sich auf die Berechnung der definierten Länge der Zeichenfolgevariablen aus. Wenn das Leerzeichen als Trennzeichen ausgewählt ist, werden mehrere aufeinanderfolgende Leerzeichen nicht als mehrere Trennzeichen behandelt.

Dialogfeld "Falleinstellungen"

Erster Fall
Gibt die erste Zeile der Datendatei an, die Datenwerte enthält. Wenn die erste(n) Zeile(n) der Datendatei aussagekräftige Beschriftungen oder anderen Text und somit keine Datenwerte enthalten, ist dies nicht Zeile 1.
Falldarstellung
Gibt an, woran der Import erkennt, wo jeder Fall endet und der nächste beginnt.
Jede Zeile stellt einen Fall dar
Jede Zeile enthält nur einen Fall. Sehr häufig ist jeder Fall in einer einzigen Zeile enthalten. Hierbei kann es sich auch um eine sehr lange Zeile in einer Datendatei mit einer großen Anzahl von Variablen handeln. Wenn nicht alle Zeilen die gleiche Anzahl von Werten enthalten, wird die Anzahl der Variablen für jeden Fall durch die Zeile mit den meisten Datenwerten festgelegt. Fällen mit weniger Datenwerten werden fehlende Werte für die zusätzlichen Variablen zugewiesen.
Folgende Anzahl von Variablen stellt einen Fall dar
Durch die festgelegte Anzahl von Variablen pro Fall wird dem Import mitgeteilt, an welcher Stelle ein Fall endet und der nächste beginnt. Eine Zeile kann mehrere Fälle enthalten, und Fälle können in der Mitte einer Zeile beginnen und in der nächsten Zeile fortgesetzt werden. Die Importfunktion bestimmt das Ende jedes Falls unabhängig von der Anzahl der Zeilen anhand der Anzahl von eingelesenen Werten. Für jeden Fall müssen Datenwerte (oder durch Trennzeichen angezeigte fehlende Werte) für alle Variablen vorhanden sein. Ansonsten wird die Datendatei nicht ordnungsgemäß eingelesen.
Zu importierende Fälle
Sie können alle Fälle der Datendatei, die ersten n Fälle (n ist eine von Ihnen festgelegte Zahl) oder eine Stichprobe mit einem bestimmten Prozentsatz der Fälle importieren. Da die Routine für Zufallsstichproben für jeden Fall eine unabhängige Pseudozufallsentscheidung trifft, entspricht der Prozentsatz der tatsächlich ausgewählten Fälle nur ungefähr dem angegebenen Prozentwert. Je mehr Fälle sich in der Datendatei befinden, desto eher entspricht der Prozentsatz ausgewählter Fälle dem angegebenen Prozentsatz.

Dialogfeld "Datenformat"

Datenoptionen
Wählen Sie Variablen im Vorschauabschnitt aus.
Sie können die vom System vorgegebenen Variablennamen durch Ihre eigenen überschreiben. Beim Einlesen von Variablennamen aus der Datendatei werden Variablennamen, die nicht den Regeln für Variablennamen entsprechen, automatisch geändert. Wählen Sie im Vorschaufenster eine Variable und geben Sie einen Variablennamen ein.
Prozentsatz der Werte, die das automatische Datenformat festlegen
Der Datentyp der einzelnen Variablen wird durch den Prozentsatz der Werte bestimmt, die dem Format entsprechen.
  • Der Wert muss größer als 50 sein.
  • Der zur Bestimmung des Prozentwerts verwendete gemeinsame Nenner ist die Anzahl der nicht leeren Werte der einzelnen Variablen.
  • Wird für den angegebenen Prozentsatz der Werte kein konsistentes Format verwendet, wird der Variablen der Zeichenfolgedatentyp zugewiesen.
  • Bei Variablen, denen auf der Basis des Prozentwerts ein numerisches Format (einschließlich Datums- und Uhrzeitformate) zugewiesen wird, wird Werten, die diesem Format nicht entsprechen, ein im System als fehlend definierter Wert zugewiesen.
Daten in lokalen Zwischenspeicher
Ein Zwischenspeicher für die Daten (Datencache) ist eine vollständige Kopie der Datendatei, die temporär auf der Festplatte gespeichert wird. Zwischenspeichern der Datendatei kann die Leistung verbessern.
Datenformat
Wählen Sie ein Datenformat aus der Dropdown-Liste aus. Weitere Informationen finden Sie in Formatierungsoptionen.