Daten validieren

Im Dialogfeld "Daten validieren" können Sie verdächtige oder ungültige Fälle, Variablen und Datenwerte im aktiven Dataset identifizieren.

Beispiel. Ein Datenanalyst muss für den Auftraggeber einen monatlichen Bericht über die Kundenzufriedenheit zusammenstellen. Die monatlich erhaltenen Daten müssen einer Qualitätsprüfung unterzogen werden. Dabei muss nach ungültigen Kunden-IDs, Variablenwerten außerhalb des Bereichs sowie Kombinationen von Variablenwerten gesucht werden, die häufig fehlerhaft eingegeben werden. Im Dialogfeld "Daten validieren" kann der Analyst die Variablen angeben, durch die Kunden eindeutig identifiziert werden, Regeln für die gültigen Wertebereiche einzelner Variablen definieren und Regeln zum Erkennen unmöglicher Kombinationen für mehrere Variablen definieren. Die Prozedur liefert einen Bericht der Problemfälle und -variablen. Darüber hinaus weisen die Daten in jedem Monat die gleichen Datenelemente auf, sodass der Analyst in der Lage ist, die Regeln im folgenden Monat auf die neue Datendatei anzuwenden.

Statistik. Die Prozedur erzeugt Listen von Variablen, Fällen und Datenwerten, die verschiedene Prüfungen nicht bestehen, Häufigkeiten der Verletzung von Regeln für einzelne oder mehrere Variablen sowie einfache deskriptive Auswertungen der Analysevariablen.

Gewichtungen Die Prozedur ignoriert Angaben zur Gewichtungsvariablen und behandelt diese stattdessen wie jede andere Analysevariable.

So validieren Sie Daten:

  1. Wählen Sie in den Menüs Folgendes aus:

    Daten > Überprüfung > Daten validieren ...

  2. Wählen Sie mindestens eine Analysevariable aus, die durch grundlegende Variablenprüfungen oder Validierungsregeln für eine Variable validiert werden soll.

    Sie haben außerdem folgende Möglichkeiten:

  3. Klicken Sie auf die Registerkarte Regeln für mehrere Variablen und wenden Sie mindestens eine Regel für mehrere Variablen an.

Die folgenden Optionen sind verfügbar:

  • Wählen Sie mindestens eine Fall-ID-Variable aus, um nach doppelten oder unvollständigen IDs zu suchen. Fall-ID-Variablen werden auch zum Beschriften der fallweisen Ausgabe verwendet. Wenn mehr als eine Fall-ID-Variable angegeben wurde, wird die Kombination der Werte als Fall-ID behandelt.

Felder mit unbekanntem Messniveau

Der Messniveau-Alert wird angezeigt, wenn das Messniveau für mindestens eine Variable (ein Feld) im Dataset unbekannt ist. Da sich das Messniveau auf die Berechnung der Ergebnisse für diese Prozedur auswirkt, müssen alle Variablen ein definiertes Messniveau aufweisen.

Scandaten. Liest die Daten im aktiven Dataset und weist allen Feldern, deren Messniveau zurzeit nicht bekannt ist, das Standardmessniveau zu. Bei großen Datasets kann dieser Vorgang einige Zeit in Anspruch nehmen.

Manuell zuweisen. Öffnet ein Dialogfeld, in dem alle Felder mit unbekanntem Messniveau aufgeführt werden. Mit diesem Dialogfeld können Sie diesen Feldern ein Messniveau zuweisen. Außerdem können Sie in der Variablenansicht des Dateneditors ein Messniveau zuweisen.

Da das Messniveau für diese Prozedur bedeutsam ist, können Sie erst dann auf das Dialogfeld zur Ausführung dieser Prozedur zugreifen, wenn für alle Felder ein Messniveau definiert wurde.