Imputações múltiplas
O propósito da imputação múltipla é gerar valores possíveis para valores omissos, criando assim vários conjuntos de dados "completos". Os procedimentos de análise que funcionam com vários conjuntos de dados de imputação produzem saídas para cada conjunto de dados "completos", além da saída agrupada que estima quais seriam os resultados se o conjunto de dados original nãotivesse valores omissos. Esses resultados agrupados são geralmente mais precisos do que os fornecidos por métodos de imputação única.
Considerações de dados de imputação múltipla
variáveis de análise. As variáveis de análise podem ser:
- Nominal. Uma variável pode ser tratada como nominal quando seus valores representarem categorias sem ranqueamento intrínseco (por exemplo, o departamento da empresa na qual um funcionário trabalha). Exemplos de variáveis nominais incluem região, código de endereçamento postal e filiação religiosa.
- Ordinal. Uma variável pode ser tratada como ordinal quando seus valores representarem categorias com algum ranqueamento intrínseco (por exemplo, níveis de satisfação de serviço de muito insatisfeito para muito satisfeito). Exemplos de variáveis ordinais incluem escores de atitude que representam o grau de satisfação ou de confiança e os escores de classificação de preferência.
- Scale. Uma variável pode ser tratada como escala (contínua) quando os seus valores representarem categorias ordenadas com uma métrica significativa, de forma que as comparações de distância entre os valores sejam apropriadas. Exemplos de variáveis de escala incluem idade em anos e rendimento em milhares de dólares.
O procedimento considera que o nível de medição apropriado foi designado a todas as variáveis; no entanto, é possível mudar temporariamente o nível de medição para uma variável, clicando com o botão direito do mouse na variável na lista de variáveis de origem e selecionando um nível de medição no menu pop-up. Para alterar permanentemente o nível de medição para uma variável, consulte Nível de medição variável.
Um ícone ao lado de cada variável na lista de variáveis identifica o nível de medição e o tipo de dados:
| Numérico | Sequência | Data | Hora | |
|---|---|---|---|---|
| Escala (Contínua) | n/d | |||
| Ordinal | ||||
| Nominal |
Ponderações de frequência. As ponderações de frequência (replicação) são consideradas por esse procedimento. Casos com valor de ponderação de replicação negativo ou zero são ignorados. As ponderações de número não inteiro são arredondadas para o número inteiro mais próximo.
Ponderação de Análise. As ponderações de análise (regressão ou amostragem) são incorporadas em sumarizações de valores omissos e em modelos de imputação de ajuste. Os casos com uma ponderação de análise negativa ou zero são excluídos.
Amostras complexas. O procedimento de Imputação Múltipla não trata explicitamente estrato, clusters ou outras estruturas de amostragem complexas, embora possa aceitar ponderações de amostragem final em forma da variável de ponderação de análise. Observe também que os procedimentos de Amostragem Complexa atualmente não analisam automaticamente múltiplos conjuntos de dados imputados. Para obter uma lista completa de procedimentos que suportam a conjugação, consulte Analisando Vários Dados de Imputação.
Valores Ausentes. Tanto os valores omissos do sistema quanto do usuário são tratados como valores inválidos; ou seja, ambos os tipos de valores omissos são substituídos quando valores são imputados e ambos são tratados como valores inválidos de variáveis usadas como preditoras em modelos de imputação. Os valores omissos do sistema e do usuário também são tratados como omissos em análises de valores omissos.
Replicando resultados (Imputar valores de dados omissos). Se deseja replicar seus resultados de imputação de forma exata, use o mesmo valor de inicialização para o gerador de número aleatório, a mesma ordem de dados e a mesma ordem de variável, além de usar as mesmas configurações do procedimento.
- Geração de número aleatório. O procedimento usa a geração de números aleatórios durante o cálculo de valores imputados. Para reproduzir os mesmos resultados aleatorizados no futuro, use o mesmo valor de inicialização para o gerador de números aleatórios antes de cada execução do procedimento de Imputar Valores de Dados Omissos. Veja o tópico Geradores de Número de Random para mais informações.
- Ordem de Caso. Os valores são imputados em ordem de caso.
- Ordem da variável. O método de imputação de especificação totalmente condicional (FCS) imputa valores na ordem especificada na lista Variáveis de análise.
Há dois diálogos dedicados à imputação múltipla.
- Analisar Padrões fornece medidas descritivas dos padrões de valores ausentes nos dados, e pode ser útil como uma etapa exploratória antes da imputação.
- Imputar Valores de Dados Ausentes é usado para gerar várias imputações. Os conjuntos de dados completos podem ser analisados com procedimentos que suportam conjuntos de dados de imputação múltipla. Consulte Geradores de números aleatórios para obter informações sobre a análise de conjuntos de dados de imputação múltipla e uma lista de procedimentos que suportam esses dados.
Estes diálogos colam a sintaxe de comando MULTIPLE IMPUTATION .