Daten aggregieren

Mit "Daten aggregieren" werden Fallgruppen im aktiven Dataset zu einzelnen Fällen kombiniert; hierbei wird eine neue, aggregierte Datei angelegt oder es werden neue Variablen im aktiven Dataset angelegt, die aggregrierte Daten enthalten. Die Fälle werden nach null oder mehreren Werten von Breakvariablen (Gruppierungsvariablen) aggregiert. Wenn keine Breakvariablen angegeben sind, ist das gesamte Dataset eine einzige Breakgruppe.

  • Wenn Sie eine neue, aggregierte Datendatei anlegen, enthält diese neue Datei je einen Fall für jede Gruppe, die in den Breakvariablen definiert sind. Liegt beispielsweise eine Breakvariable mit zwei Werten vor, enthält die neue Datendatei nur zwei Fälle. Wenn keine Breakvariable angegeben ist, enthält die neue Datendatei nur einen Fall.
  • Wenn Sie Aggregationsvariablen in das aktive Dataset aufnehmen, wird die Datendatei selbst nicht aggregiert. Jeder Fall mit denselben Werten für die Breakvariable(n) erhält dieselben Werte für die neuen Aggregationsvariablen. Wenn beispielsweise nur eine Breakvariable geschl vorliegt, erhalten alle männlichen Personen denselben Wert für eine neue Aggregationsvariable, die das Durchschnittsalter erfasst. Wenn keine Breakvariable angegeben ist, erhalten alle Fälle denselben Wert für eine neue Aggregationsvariable, die das Durchschnittsalter repräsentiert.

Breakvariable(n). Die Fälle werden auf der Basis der Breakvariablen gruppiert. Jede eindeutige Kombination von Breakvariablenwerten definiert eine Gruppe. Wenn Sie eine neue, aggregierte Datendatei erstellen, werden alle Breakvariablen in der neuen Datei unter dem bisherigen Namen und mit den vorhandenen Informationen aus dem Datenwörterbuch gespeichert. Die Breakvariablen können, wenn angegeben, numerische Variablen oder Zeichenfolgevariablen sein.

Aggregierte Variablen. Quellenvariablen werden in Verbindung mit Aggregationsfunktionen zum Erzeugen der neuen Aggregationsvariablen herangezogen. Der Name der Aggregationsvariablen wird von einer optionalen Variablenbeschriftung, dem Namen der Aggregationsfunktion und der Quellenvariablen in Klammern gefolgt.

Sie können die vorgegebenen Namen für die Aggregationsvariablen mit neuen Variablennamen überschreiben, aussagekräftige Variablenbeschriftungen verwenden und die Funktionen zum Berechnen der aggregierten Datenwerte ändern. Sie können auch eine Variable anlegen, welche die Anzahl der Fälle in jeder Breakgruppe enthält.

So aggregieren Sie eine Datendatei:

  1. Wählen Sie in den Menüs Folgendes aus:

    Daten > Aggregieren ...

  2. Wählen Sie optional Breakvariablen aus, die definieren, wie die Fälle zum Erzeugen der aggregierten Daten gruppiert werden. Wenn keine Breakvariablen angegeben sind, ist das gesamte Dataset eine einzige Breakgruppe.
  3. Wählen Sie mindestens eine Aggregationsvariable aus.
  4. Wählen Sie für jede Aggregationsvariable eine Aggregationsfunktion aus.

Zusätzlich können Sie die vorgegebenen Namen für die Aggregationsvariablen mit neuen Variablennamen überschreiben, aussagekräftige Variablenbeschriftungen verwenden und eine Variable anlegen, welche die Anzahl von Fällen in jeder Breakgruppe enthält.

Speichern von aggregierten Ergebnissen

Sie können wahlweise Aggregationsvariablen in das aktive Dataset aufnehmen oder eine neue, aggregierte Datendatei erzeugen.

  • Aggregierte Variablen zum aktiven Dataset hinzufügen. Neue Variablen, die auf Aggregierungsfunktionen beruhen, werden zum aktiven Dataset hinzugefügt. Die Datendatei selbst wird nicht aggregiert. Jeder Fall mit denselben Werten für die Breakvariablen erhält dieselben Werte für die neuen Aggregationsvariablen.
  • Neues Dataset erstellen, das nur die aggregierten Variablen enthält. Speichert die aggregierten Daten in einem neuen Dataset in der aktuellen Sitzung. Das Dataset enthält die Breakvariablen, die die aggregierten Fälle bestimmen, und alle aggregierten Variablen, die durch Aggregationsfunktionen definiert werden. Das aktive Dataset bleibt davon unberührt.
  • Neue Datendatei erstellen, die nur die aggregierten Variablen enthält. Speichert die aggregierten Daten in einer externen Datendatei. Die Datei enthält die Breakvariablen, die die aggregierten Fälle bestimmen und alle aggregierten Variablen, die durch Aggregationsfunktionen definiert werden. Das aktive Dataset bleibt davon unberührt.

Sortieroptionen für umfangreiche Datendateien

Bei äußerst umfangreichen Datendateien empfiehlt es sich, die Dateien vor der Aggregation zu sortieren.

Datei ist bereits nach Breakvariablen sortiert. Wenn die Daten bereits nach den Werten der Breakvariablen sortiert wurden, sorgt diese Option für einen schnelleren Ablauf der Prozedur und geringeren Speicherplatzbedarf. Diese Option sollte mit Bedacht verwendet werden.

  • Die Daten müssen nach den Werten der Breakvariablen sortiert werden, und zwar in derselben Reihenfolge wie die Breakvariablen, die für die Funktion "Daten aggregieren" angegeben wurden.
  • Wenn Sie Variablen in das aktive Dataset aufnehmen, wählen Sie diese Option nur dann aus, wenn die Daten anhand der Werte der Breakvariablen in aufsteigender Reihenfolge sortiert sind.

Sortieren Sie die Datei vor der Aggregation. In sehr seltenen Fällen kann es bei großen Datendateien nötig sein, die Datendatei vor dem Aggregieren nach den Werten der Breakvariablen zu sortieren. Diese Option ist nur dann angeraten, wenn Speicher- bzw. Leistungsprobleme auftreten.