Puntos destacados del dispositivo

Pestaña Variables

El cuadro de diálogo Validar Datos se utiliza para verificar sus datos. La pestaña Variables muestra las variables en su archivo. Inicie la selección de variables que desea y trasládelas a la lista Variables de Análisis.

Verificaciones básicas

Usted puede especificar las verificaciones básicas para aplicar a variables y casos en su archivo. Por ejemplo, es posible obtener informes que identifiquen variables con un porcentaje alto de valores faltantes o casos vacíos.

Reglas estándares y personalizadas

Aplique las reglas a variables individuales que identifican los valores inválidos, fuera de un rango válido o valores faltantes. Usted también puede crear sus reglas propias, de variables cruzadas o aplicar las predefinidas.

Recomendaciones

La preparación de datos automatizada presenta las recomendaciones y permite a los usuarios profundizar y examinar dichas recomendaciones.

Prepare los datos de una vez, automáticamente

La preparación manual es un proceso complejo y se pierde mucho tiempo. Cuando usted precise resultados rápidamente, el proceso de ADP le ayuda a detectar y corregir los errores de calidad e imputar los valores faltantes en una etapa eficiente. El dispositivo de ADP brinda un informe sencillo de entender con las recomendaciones completas y visualizaciones para ayudarle a determinar los datos correctos para utilizar en su análisis.

Opciones adicionales para la preparación de datos

Realice comprobaciones automáticas de los datos y ayude a eliminar las verificación manuales que consumen mucho tiempo y son tediosas, utilizando el proceso de validación de los datos. Este proceso lo habilita a aplicar las reglas que realizan las verificaciones de datos basadas en el nivel de medidas de cada variable (ya sea categórica o continua). A continuación, determine la validad de los datos y elimine o corrija los casos sospechosos a su criterio antes del análisis.

Agrupe o determine los puntos de cortes para las variables de escalas

Con el proceso de agrupamiento óptimo, es posible utilizar el algoritmo diseñado para atributos nominales (como modelos de Naive Bayes y logit). El agrupamiento óptimo lo habilita a agrupar o establecer puntos de corte para variables de escalas.

Seleccione ir de tres tipos de agrupamientos óptimos

Elija unos de estos tipos de agrupamiento óptimo para preprocesar los datos antes de la construcción del modelo. 1) No supervisado: Cree agrupamientos con las cuentas iguales. 2) Supervisado: Tome en cuenta la variable objetivo para determinar los puntos de corte. Este método es más preciso que el no supervisado. Sin embargo, también es más intensivo computacionalmente. 3) Enfoque híbrido: Combina los enfoques no supervisados y supervisados. Este método es útil especialmente si usted posee una amplia suma de valores distintos.

Detalles técnicos

Requisitos de software

IBM SPSS Data Preparation requiere la licencia válida de IBM SPSS Statistics Base.

  • Prerrequisito: IBM SPSS Statistics

Requisitos de hardware

  • Procesador: 2 GHz o más rápido
  • Monitor: 1024*768 o superior
  • Memoria: se necesita de 4 GB de RAM, 8 GB de RAM o más recomendada
  • Espacio en Disco: 2 GB o más

Vea cómo funciona