Imputar valores perdidos (Imputación múltiple)
Imputar valores perdidos se utiliza para generar imputaciones múltiples. Los conjuntos de datos completos se pueden analizar con procedimientos que soporten varios conjuntos de datos de imputación. Consulte Análisis de datos de imputación múltiple para obtener información sobre el análisis de conjuntos de datos de imputación múltiple y una lista de procedimientos que dan soporte a estos datos. Este es un procedimiento de Imputación múltiple .
Ejemplo. Un proveedor de telecomunicaciones desea comprender mejor los patrones de uso de servicio en su base de datos de clientes. Tienen datos completos de los servicios utilizados por sus clientes, pero la información demográfica recopilada por la empresa tiene diferentes valores perdidos. Además, estos valores no están perdidos de forma aleatoria, por lo que se utilizará la imputación múltiple para completar el conjunto de datos.
En los menús seleccione:
- Elija al menos dos variables en el modelo de imputación. El procedimiento imputa valores múltiples para los datos perdidos de estas variables.
- Especifique el número de imputaciones que deben calcularse. Este valor es 5 de forma predeterminada.
- Especifique un conjunto de datos o un archivo de datos con formato IBM® SPSS® Statisticsen el que deben escribirse los datos imputados.
El conjunto de datos de resultados consiste en los datos de casos originales con datos perdidos más un conjunto de casos con valores imputados para cada imputación. Por ejemplo, si el conjunto de datos original tiene 100 casos y usted tiene cinco imputaciones, el conjunto de datos de resultados contendrá 600 casos. Todas las variables del conjunto de datos de entrada se incluyen en el conjunto de datos de resultados. Propiedades del diccionario (nombres, etiquetas, etc.) de variables existentes se copian en el nuevo conjunto de datos. El archivo también contiene una nueva variable, Imputation_, una variable numérica que indica la imputación (0 para datos originales o 1..n para casos con valores imputados).
El procedimiento define automáticamente la variable Imputation_ como una variable de segmentación (consulte Archivo segmentado) cuando se crea el conjunto de datos de salida. Si las divisiones están activadas cuando se ejecuta el procedimiento, el conjunto de datos de resultados incluye un conjunto de imputaciones por cada combinación de valores de variables de segmentación.
Valores opcionales
Ponderación de análisis. Esta variable contiene ponderaciones de análisis (regresión o muestra). El procedimiento incorpora ponderaciones de análisis en modelos de regresión y clasificación utilizados para imputar valores perdidos. Las ponderaciones de análisis también se utilizan en resúmenes de valores imputados; por ejemplo, media, desviación estándar y error estándar. Los casos de ponderaciones de análisis con valor negativo o cero se excluirán.
Campos con un nivel de medición desconocido
La alerta de nivel de medición se muestra si el nivel de medición de una o más variables (campos) del conjunto de datos es desconocido. Como el nivel de medición afecta al cálculo de los resultados de este procedimiento, todas las variables deben tener un nivel de medición definido.
Explorar datos. Lee los datos del conjunto de datos activo y asigna el nivel de medición predefinido en cualquier campo con un nivel de medición desconocido. Si el conjunto de datos es grande, puede llevar algún tiempo.
Asignar manualmente. Abre un cuadro de diálogo que contiene todos los campos con un nivel de medición desconocido. Puede utilizar este cuadro de diálogo para asignar el nivel de medición a esos campos. También puede asignar un nivel de medición en la Vista de variables del Editor de datos.
Como el nivel de medición es importante para este procedimiento, no puede acceder al cuadro de diálogo para ejecutar este procedimiento hasta que se hayan definido todos los campos en el nivel de medición.
Este procedimiento pega la sintaxis del comando MULTIPLE IMPUTATION .