O IBM SPSS Data Preparation empregue técnicas avançadas para simplificar a etapa de preparação de dados, proporcionando resultados de análise de dados mais rápidos e precisos.Escolha um procedimento automatizado de preparação de dados para resultados rápidos ou selecione outros métodos para preparar conjuntos de dados mais desafiadores.Identifique facilmente casos suspeitos ou inválidos, variáveis e valores de dados.Visualize padrões de dados ausentes, resuma distribuições de variáveis e trabalhe de forma mais precisa com algoritmos projetados para atributos nominais.
Este módulo está incluído na edição Profissional do SPSS para instalações locais e na edição base para planos de assinatura.
A caixa de diálogo Validar Dados é utilizada para validar seus dados. A guia de variáveis mostra variáveis em seu arquivo. Comece selecionando as variáveis desejadas e movendo-as para a lista Variáveis de Análise.
Você pode especificar verificações básicas a serem aplicadas a variáveis e casos no seu arquivo.Por exemplo, é possível obter relatórios que identificam variáveis com um alto percentual de valores ausentes ou casos vazios.
Aplique regras a variáveis individuais para identificar valores inválidos — valores fora de uma faixa válida ou valores ausentes.Além disso, você pode criar regras personalizadas, regras de variável cruzada ou aplicar regras pré-definidas.
A preparação automatizada de dados fornece recomendações e permite que os usuários analisem e examinem as recomendações.
A preparação manual de dados é um processo complexo e demorado. Quando você precisa de resultados rapidamente, o procedimento do ADP ajuda a detectar e corrigir erros de qualidade e imputar valores ausentes em uma etapa eficiente. O recurso ADP fornece um relatório fácil de entender com recomendações e visualizações abrangentes para ajudá-lo a determinar os dados certos a serem usados em sua análise.
Execute verificações automáticas de dados e contribua para a eliminação de verificações manuais demoradas e tediosas ao utilizar o procedimento de validação de dados.Este procedimento permite que você aplique regras para realizar verificações de dados com base no nível de medida de cada variável — seja ela categórica ou contínua.Em seguida, determine a validade dos dados e elimine ou corrija casos suspeitos de acordo com sua escolha antes da análise.
O SPSS Data Preparation inclui recursos como validação de dados, preparação automatizada de dados, binagem otimizada e identificação de casos incomuns.
Com o procedimento de categorização otimizada, é possível utilizar algoritmos destinados a atributos nominais, como Naive Bayes e modelos logit, de forma mais precisa.O compartimento ideal permite que você separe, ou defina pontos de corte para, variáveis de escala.
Escolha um destes tipos de categorização ideal para pré-processar dados antes da construção do modelo:
1) Não supervisionado: crie caixas com contagens iguais.
2) Supervisionado: leve em conta a variável alvo para determinar os pontos de corte. Esse método é mais preciso que o não supervisionado; no entanto, ele também é mais intensivo em termos computacionais.
3) Abordagem híbrida: combine as abordagens não supervisionadas e supervisionadas. Esse método é particularmente útil se você tiver uma grande quantidade de valores distintos.