Imputieren fehlender Datenwerte (multiple Imputation)

"Fehlende Datenwerte imputieren" wird verwendet, um multiple Imputationen zu erzeugen. Die vollständigen Datasets können mit Prozeduren analysiert werden, die Multiple-Imputation-Datasets unterstützen. Informationen zur Analyse von Multiple-Imputation-Datasets und eine Liste der Verfahren, die diese Daten unterstützen, finden Sie unter Multiple-Imputation-Daten analysieren . Dies ist eine Prozedur der multiplen Imputation .

Beispiel. Ein Telekommunikationsanbieter möchte einen besseren Einblick in die Servicenutzungsmuster in seiner Kundendatenbank gewinnen. Er verfügt über die vollständigen Daten der von seinen Kunden genutzten Services, jedoch fehlen in den demografischen Informationen, die das Unternehmen gesammelt hat, einige Werte. Außerdem fehlen diese Werte nicht vollkommen zufällig, so dass mehrere Imputationen verwendet werden, um das Dataset zu vervollständigen.

Wählen Sie in den Menüs Folgendes aus:

Analysieren > Multiple Imputation > Fehlende Daten imputieren Werte ...

Hinweis: Die rot markierten Felder sind Pflichtfelder. Die Schaltflächen „Einfügen“ und „OK“ werden aktiviert, nachdem Sie gültige Werte in alle erforderlichen Felder eingegeben haben.
  1. Wählen Sie mindestens zwei Variablen im Imputationsmodell aus. Die Prozedur imputiert mehrere Werte für fehlende Daten für diese Variablen.
  2. Die Anzahl der zu berechnenden Imputationen. Standardmäßig ist dieser Wert 5.
  3. Geben Sie ein Dataset oder eine Datendatei im Format IBM® SPSS® Statisticsan, in die imputierte Daten geschrieben werden sollen.

    Das Ausgabedataset besteht aus den ursprünglichen Falldaten mit fehlenden Daten plus einem Set von Fällen mit imputierten Werten für jede Imputation. Wenn beispielsweise das ursprüngliche Dataset 100 Fälle enthält und Sie haben fünf Imputationen, umfasst das Ausgabedataset 600 Fälle. Alle Variablen im Eingabedataset sind im Ausgabedataset enthalten. Wörterbucheigenschaften (Namen, Beschriftungen usw.) der vorhandenen Variablen werden in das neue Dataset kopiert. Die Datei enthält auch eine neue Variable, Imputation_, eine numerische Variable, die die Imputation angibt (0 für Originaldaten, 1..n für Fälle mit imputierten Werten).

    Die Prozedur definiert die Variable Imputation_ automatisch als aufgeteilte Variable (siehe Datei aufteilen) , wenn das Ausgabedataset erstellt wird. Wenn bei Ausführung der Prozedur Aufteilungen wirksam sind, enthält das Ausgabedataset ein Set an Imputationen für jede Kombination von Werten von ausgeteilten Variablen.

Optionale Einstellungen

Analysegewichtung. Diese Variable enthält Analysegewichtungen (Regression oder Stichprobe). Die Prozedur umfasst Analysegewichtungen in Regressions- und Klassifizierungsmodellen, die verwendet werden, um fehlende Werte zu imputieren. Analysegewichtungen werden auch in Zusammenfassungen imputierter Werte verwendet, zum Beispiel Mittelwert, Standardabweichung und Standardfehler. Fälle mit einer negativen oder nullwertigen Analysegewichtung werden ausgeschlossen.

Felder mit unbekanntem Messniveau

Der Messniveau-Alert wird angezeigt, wenn das Messniveau für mindestens eine Variable (ein Feld) im Dataset unbekannt ist. Da sich das Messniveau auf die Berechnung der Ergebnisse für diese Prozedur auswirkt, müssen alle Variablen ein definiertes Messniveau aufweisen.

Scandaten. Liest die Daten im aktiven Dataset und weist allen Feldern, deren Messniveau zurzeit nicht bekannt ist, das Standardmessniveau zu. Bei großen Datasets kann dieser Vorgang einige Zeit in Anspruch nehmen.

Manuell zuweisen. Öffnet ein Dialogfeld, in dem alle Felder mit unbekanntem Messniveau aufgeführt werden. Mit diesem Dialogfeld können Sie diesen Feldern ein Messniveau zuweisen. Außerdem können Sie in der Variablenansicht des Dateneditors ein Messniveau zuweisen.

Da das Messniveau für diese Prozedur bedeutsam ist, können Sie erst dann auf das Dialogfeld zur Ausführung dieser Prozedur zugreifen, wenn für alle Felder ein Messniveau definiert wurde.

Mit dieser Prozedur wird MULTIPLE IMPUTATION -Befehlssyntax eingefügt.