Automatisch umcodieren
Im Dialogfeld "Automatisch umcodieren" wandeln Sie Zeichenfolgewerte und numerische Werte in fortlaufende Ganzzahlen um. Wenn Kategoriecodes nicht sequenziell sind, wird die Leistung durch die daraus resultierenden leeren Zellen reduziert; die Arbeitsspeicheranforderungen für zahlreiche Prozesse werden erhöht. Außerdem können einige Prozeduren keine Zeichenfolgevariablen verwenden und einige erfordern aufeinander folgende ganzzahlige Werte als Faktorstufen.
- Bei den mit "Automatisch umcodieren" erstellten neuen Variablen werden alle definierten Variablen und Wertbeschriftungen aus der alten Variablen beibehalten. Bei allen Werten ohne definierte Wertbeschriftung wird der ursprüngliche Wert als Beschriftung für den umcodierten Wert verwendet. Die alten und neuen Werte und Wertbeschriftungen werden in einer Tabelle angezeigt.
- Zeichenfolgewerte werden in alphabetischer Reihenfolge umcodiert, wobei Großbuchstaben jeweils vor den entsprechenden Kleinbuchstaben stehen.
- Fehlende Werte werden unter Beibehaltung ihrer Reihenfolge in fehlende Werte umcodiert, die größer als alle nicht fehlenden Werte sind. Wenn zum Beispiel die ursprüngliche Variable über 10 nicht fehlende Werte verfügt, würde der kleinste fehlende Wert auf 11 umcodiert, und der Wert 11 wäre ein fehlender Wert für die neue Variable.
Dasselbe Umcodierungsschema für alle Variablen verwenden. Mit dieser Option können Sie ein einziges Schema für die automatische Umcodierung auf alle ausgewählten Variablen anwenden und so ein einheitliches Codierungsschema für alle neuen Variablen erzielen.
Bei dieser Option gelten die folgenden Regeln und Einschränkungen:
- Alle Variablen müssen denselben Typ aufweisen (numerische Variable oder Zeichenfolgevariable).
- Alle beobachteten Werte für alle ausgewählten Variablen dienen als Grundlage für eine Sortierreihenfolge, mit der die Werte vor der Umcodierung in fortlaufende Ganzzahlen sortiert werden.
- Benutzerdefiniert fehlende Werte für die neuen Variablen beruhen auf der ersten Variable in der Liste mit angegebenen benutzerdefiniert fehlenden Werten. Alle anderen Werte aus anderen ursprünglichen Variablen (mit Ausnahme der systemdefiniert fehlenden Werte) werden als gültige Werte behandelt.
Leere Zeichenfolgewerte als benutzerdefiniert fehlend behandeln. Bei Zeichenfolgevariablen werden Leerwerte oder Nullwerte nicht als systemdefiniert fehlend behandelt. Mit dieser Option werden leere Zeichenfolgen automatisch in einen benutzerdefiniert fehlenden Wert umcodiert, der höher ist als der höchste nicht fehlende Wert.
Vorlagen
Sie können das Schema für die automatische Codierung in einer Vorlagendatei speichern und dann auf andere Variablen und andere Datendateien anwenden.
Sie verwenden beispielsweise zahlreiche alphanumerische Produktcodes, die Sie jeden Monat automatisch in Ganzzahlen umcodieren lassen. In einigen Monaten werden jedoch neue Produktcodes eingeführt, die das ursprüngliche Schema für die automatische Umcodierung ändern. Wenn Sie das ursprüngliche Schema in einer Vorlage speichern und dann auf die neuen Daten anwenden, die die neuen Codes enthalten, werden alle neuen Codes in den Daten automatisch in Werte umcodiert, die höher sind als der höchste Wert in der Vorlage. Auf diese Weise wird das ursprüngliche Schema für die automatische Umcodierung der ursprünglichen Produktcodes beibehalten.
Vorlage speichern unter. Speichert das Schema für die automatische Umcodierung der ausgewählten Variablen in einer externen Vorlagendatei.
- Mit den Informationen in der Vorlage werden die ursprünglichen nicht fehlenden Werte den umcodierten Werten zugeordnet.
- Nur Informationen für nicht fehlende Werte werden in der Vorlage gespeichert. Informationen zu benutzerdefiniert fehlenden Werten werden nicht beibehalten.
- Wenn Sie mehrere Variablen für die Umcodierung ausgewählt haben, ohne dabei dasselbe Schema für die automatische Umcodierung für alle Variablen festzulegen oder wenn keine vorhandene Vorlage im Rahmen der automatischen anzuwenden, wird die Vorlage auf der Grundlage der ersten Variable in der Liste aufgebaut.
- Wenn Sie mehrere Variablen für die Umcodierung ausgewählt und dabei die Option Dasselbe Umcodierungsschema für alle Variablen verwenden und/oder die Option Vorlage zuweisen aktiviert haben, enthält die Vorlage das kombinierte Schema für die automatische Umcodierung für alle Variablen.
Vorlage anwenden von. Wendet eine zuvor gespeicherte Vorlage für die automatische Umcodierung auf alle Variablen an, die zur Umcodierung ausgewählt wurden. Alle zusätzlich in den Variablen gefundenen Werte werden an das Ende des Schemas angehängt und die Beziehung zwischen den ursprünglichen und den automatisch umcodierten Werten im gespeicherten Schema bleibt erhalten.
- Alle zur Umcodierung ausgewählten Variablen müssen denselben Typ aufweisen (numerische Variable oder Zeichenfolgevariable), und dieser Typ muss mit dem Typ übereinstimmen, der in der Vorlage definiert ist.
- Vorlagen enthalten keine Informationen zu benutzerdefiniert fehlenden Werten. Benutzerdefiniert fehlende Werte für die Zielvariablen beruhen auf der ersten Variable in der Liste mit angegebenen benutzerdefiniert fehlenden Werten. Alle anderen Werte aus anderen ursprünglichen Variablen (mit Ausnahme der systemdefiniert fehlenden Werte) werden als gültige Werte behandelt.
- Wertzuordnungen aus der Vorlage werden als erstes angewendet. Alle verbleibenden Werte werden in Werte umcodiert, die höher sind als der letzte Wert in der Vorlage. Benutzerdefiniert fehlende Werte (auf der Grundlage der ersten Variable in der Liste mit definierten benutzerdefiniert fehlenden Werten) werden dabei in Werte umcodiert, die höher sind als der letzte gültige Wert.
- Wenn Sie mehrere Variablen für die automatische Umcodierung ausgewählt haben, wird zunächst die Vorlage angewendet. Anschließend wird eine kombinierte automatische Standardumcodierung für alle zusätzlichen Werte für die ausgewählten Variablen ausgeführt. So entsteht ein einziges gemeinsames Schema für die automatische Umcodierung, das alle ausgewählten Variablen erfasst.
So codieren Sie Zeichenfolgewerte oder numerische Werte in fortlaufende Ganzzahlen um:
- Wählen Sie in den Menüs Folgendes aus:
- Wählen Sie mindestens eine Variable zum Umcodieren aus.
- Geben Sie für jede ausgewählte Variable einen Namen für die neue Variable ein und klicken Sie auf Neuer Name.