Destaques do recurso

Guia Variáveis

A caixa de diálogo Validar Dados é usada para validar os seus dados. A guia Variáveis mostra variáveis em seu arquivo. Inicie selecionando as variáveis desejadas e movendo-as para a lista de Variáveis de Análise.

Verificações básicas

É possível especificar verificações básicas para aplicar em variáveis e casos em seu arquivo. Por exemplo, é possível obter relatórios que identificam as variáveis com uma alta percentagem de valores omissos ou casos vazios.

Regras padrão e customizadas

Aplique regras em variáveis individuais que identifiquem valores inválidos - valores fora de um intervalo válido ou valores omissos. Também é possível criar as suas próprias regras, regras de variáveis cruzadas ou aplicar regras predefinidas.

Recomendações

A preparação automatizada de dados fornece recomendações e permite que os usuários detalhem e examinem as recomendações.

Prepare dados em uma única etapa - automaticamente

A preparação manual de dados é um processo complexo e demorado. Quando você precisar de resultados rápidos, o procedimento de ADP ajudará a detectar e corrigir erros de qualidade e imputar valores omissos, de modo eficiente, em uma etapa. O recurso do ADP fornece um relatório fácil de entender com recomendações e visualizações abrangentes para ajudá-lo a determinar os dados corretos a serem usados em sua análise.

Opções adicionais para preparação de dados

Execute verificações automáticas de dados e ajude a eliminar verificações manuais tediosas e demoradas usando o procedimento de validação de dados. Este procedimento permite que você aplique regras para executar verificações de dados com base no nível de medida de cada variável (seja categórico ou contínuo). Em seguida, determine a validade dos dados e remova ou corrija os casos suspeitos a seu critério, antes da análise.

Categorize ou configure pontos de corte para variáveis de escala

Com o procedimento de categorização ideal, é possível usar com mais precisão algoritmos projetados para atributos nominais (como Naive Bayes e modelos logit). A categorização ideal permite que você categorize – ou configure pontos de corte para – variáveis de escala.

Selecione entre três tipos de categorização ideal

Escolha um destes tipos de categorização ideal para pré-processamento de dados antes da construção de modelo. 1) Não supervisionado: crie categorias com contagens iguais. 2) Supervisionado: leve a variável de destino em consideração para determinar pontos de corte. Este método é mais preciso do que o não supervisionado; entretanto, também é mais computacionalmente intensivo. 3) Abordagem híbrida: combina as abordagens não supervisionadas e supervisionadas. Este método será particularmente útil se você tiver uma grande quantidade de valores distintos.

Detalhes técnicos

Requisitos de software

O IBM SPSS Data Preparation requer uma licença válida do IBM SPSS Statistics Base.

  • Pré-requisito: IBM SPSS Statistics

Requisitos de hardware

  • Processador: 2 GHz ou mais rápido
  • Exibição: 1024*768 ou superior
  • Memória: 4 GB de RAM obrigatórios, 8 GB de RAM ou mais recomendados
  • Espaço em disco: 2 GB ou mais

Veja como ele funciona

Compre agora e comece a utilizar