Imputación múltiple

El objetivo de la imputación múltiple es generar valores posibles para los valores perdidos, creando así varios conjuntos de datos "completos". Los procedimientos analíticos que trabajan con conjuntos de datos de imputación múltiple producen resultados para cada conjunto de datos "completo", además de resultados combinados que estiman cuáles habrían sido los resultados si el conjunto de datos original no tuviera valores perdidos. Estos resultados combinados suelen ser más precisos que los proporcionados por métodos de imputación individual.

Consideraciones sobre los datos de imputación múltiple

Variables de análisis. Las variables de análisis pueden ser:

  • Nominal. Una variable puede ser tratada como nominal cuando sus valores representan categorías que no obedecen a una clasificación intrínseca. Por ejemplo, el departamento de la compañía en el que trabaja un empleado. Algunos ejemplos de variables nominales son: región, código postal o confesión religiosa.
  • Ordinal. Una variable puede ser tratada como ordinal cuando sus valores representan categorías con alguna clasificación intrínseca. Por ejemplo, los niveles de satisfacción con un servicio, que abarquen desde muy insatisfecho hasta muy satisfecho. Entre los ejemplos de variables ordinales se incluyen escalas de actitud que representan el grado de satisfacción o confianza y las puntuaciones de evaluación de las preferencias.
  • Escala. Una variable puede tratarse como escala (continua) cuando sus valores representan categorías ordenadas con una métrica con significado, por lo que son adecuadas las comparaciones de distancia entre valores. Son ejemplos de variables de escala: la edad en años y los ingresos en dólares.

    El procedimiento supone que se ha asignado el nivel de medición adecuado a todas las variables. No obstante, puede cambiar temporalmente el nivel de medición para una variable pulsando con el botón derecho en la variable en la lista de variables de origen y seleccionar un nivel de medición en el menú emergente. Para cambiar de forma permanente el nivel de medición de una variable, consulte Nivel de medición de variable.

Un icono situado junto a cada variable de la lista de variables identifica el nivel de medición y el tipo de datos.

Tabla 1. Iconos de nivel de medición
  Numérico Serie Fecha Hora
Escala (Continuo)
Icono de escala
n/a
Icono de fecha de escala
Icono de tiempo de escala
Ordinal
Icono ordinal
Icono de serie ordinal
Icono de fecha ordinal
Icono de hora ordinal
Nominal
Icono nominal
Icono Cadena nominal
Icono de fecha nominal
Icono de hora nominal

Ponderaciones de frecuencia. Este procedimiento respeta las ponderaciones de frecuencia (réplica). Los casos con un valor negativo o cero de valor de ponderación de réplica se ignoran. Las ponderaciones no enteras se redondean al número entero más cercano.

Ponderación de análisis. Las ponderaciones de análisis (regresión o muestreo) se incorporan en resúmenes de valores perdidos y en modelos de imputación que se ajusten. Los casos de ponderaciones de análisis con valor negativo o cero se excluirán.

Muestras complejas. El procedimiento de Imputación múltiple no trata explícitamente los estratos, agrupaciones u otras estructuras de muestreo complejas, aunque puede aceptar ponderaciones de muestreo finales en la forma del análisis de la variable de ponderación. Tenga también en cuenta que los procedimientos de muestreos complejos actualmente no analizan de forma automática varios conjuntos de datos imputados. Para obtener una lista completa de procedimientos que dan soporte a la agrupación, consulte Análisis de datos de imputación múltiple.

Valores perdidos. Los valores perdidos tanto del usuario como del sistema se consideran valores no válidos; es decir, ambos tipos de valores perdidos se sustituyen cuando se imputan los valores y los dos se consideran valores no válidos de variables utilizadas como predictores de modelos de imputación. Los valores perdidos del usuario y del sistema también se consideran perdidos en los análisis de valores perdidos.

Replicación de los resultados (Imputar valores perdidos). Si desea replicar exactamente los resultados de imputación, utilice el mismo valor de inicialización para el generador de números aleatorios, el mismo orden de datos y el mismo orden de variables, además de utilizar la misma configuración del procedimiento.

  • Generación de números aleatorios. El procedimiento utiliza la generación de números aleatorios durante el cálculo de valores imputados. Para reproducir los mismos resultados aleatorios en el futuro, utilice el mismo valor de inicialización para el generador de números aleatorios antes de cada ejecución del procedimiento Imputar valores perdidos. Consulte el tema Generadores de números aleatorios para obtener más información.
  • Orden de casos. Los valores se imputan en el orden de casos.
  • Orden de las variables. El método de imputación de especificación totalmente condicional imputa los valores en el orden especificado en la lista Variables de análisis.

Existen dos cuadros de diálogo dedicados a la imputación múltiple.

  • Analizar patrones proporciona medidas descriptivas de los patrones de valores perdidos en los datos, y puede ser útil como paso exploratorio antes de la imputación.
  • Imputar valores de datos perdidos se utiliza para generar varias imputaciones. Los conjuntos de datos completos pueden analizarse con procedimientos que admiten conjuntos de datos de imputación múltiple. Consulte Generadores de números aleatorios para obtener información sobre el análisis de conjuntos de datos de imputación múltiple y una lista de procedimientos que dan soporte a estos datos.

Estos diálogos pegan la sintaxis del comando MULTIPLE IMPUTATION .