Puntos destacados de la característica

Separador Variables

El diálogo Validar datos se utiliza para validar los datos. El separador Variables muestra variables en su archivo. Empiece seleccionando las variables que quiera y muévalas a la lista de Variables de análisis.

Comprobaciones básicas

Puede especificar comprobaciones básicas para aplicar a las variables y casos de su archivo. Por ejemplo, puede obtener informes que identifican variables con un alto porcentaje de valores omitidos o casos vacíos.

Reglas estándar y personalizadas

Aplique reglas a variables individuales que identifiquen valores no válidos, valores fuera de un rango válido o valores omitidos. También puede crear sus propias reglas, reglas de variables cruzadas o aplicar reglas predefinidas.

Recomendaciones

La preparación de datos automatizada proporciona recomendaciones y permite a los usuarios obtener detalles y examinar las recomendaciones.

Prepare los datos automáticamente en un solo paso.

La preparación de datos manual es un proceso complejo que requiere mucho tiempo. Si necesita resultados rápidos, el procedimiento de ADP le ayudará a detectar y corregir errores de calidad y a imputar valores omitidos en un solo paso eficaz. La característica de ADP proporciona un informe de fácil comprensión con recomendaciones y visualizaciones completas que le ayudarán a determinar los datos adecuados para su análisis.

Opciones adicionales para la preparación de datos

Realice comprobaciones de datos automáticas y elimine las tediosas comprobaciones manuales utilizando el procedimiento de validación de datos. Este procedimiento le permite aplicar reglas para realizar comprobaciones de datos en base al nivel de medición de cada variable (ya sea categórica o continua). A continuación, determine la validez de los datos y elimine los casos que considere sospechosos antes del análisis.

Agrupe o defina puntos de corte para variables de escala

Con el procedimiento de agrupación óptimo puede utilizar algoritmos diseñados para atributos nominales, como modelos logit o Naive Bayes, con mayor precisión. La agrupación óptima le permite agrupar, o definir puntos de corte para, variables de escala.

Seleccione entre tres tipos de agrupación óptima

Elija uno de estos tipos de agrupación óptima para el preprocesamiento de datos antes de la creación de modelos. 1) No supervisado: cree agrupaciones con recuentos iguales. 2) Supervisado: tenga en cuenta la variable de destino para determinar los puntos de corte. Este método es más preciso que el no supervisado, pero también requiere más cálculos. 3) Método híbrido: combina los métodos supervisado y no supervisado. Este método resulta especialmente útil si tiene una gran cantidad de valores diferentes.

Detalles técnicos

Requisitos de software

IBM SPSS Data Preparation requiere una licencia válida de IBM SPSS Statistics Base.

  • Requisito previo: IBM SPSS Statistics

Requisitos de hardware

  • Procesador: 2 GHz o más rápido
  • Monitor: 1024*768 o superior
  • Memoria: se requieren 4 GB de RAM, se recomiendan 8 GB de RAM o más
  • Espacio de disco: 2 GB o más