Inicio
Herramientas de análisis
SPSS
SPSS Statistics
Data Preparation
IBM® SPSS Data Preparation aplica técnicas avanzadas para agilizar la etapa de preparación de datos, ofreciendo resultados de análisis de datos más rápidos y precisos. Elija entre un procedimiento de preparación de datos automatizado para obtener resultados rápidos o seleccione otros métodos para preparar conjuntos de datos más complejos. Identifique fácilmente casos, variables y valores de datos sospechosos o no válidos. Vea patrones de datos ausentes, resuma distribuciones de variables y trabaje de forma más precisa con algoritmos diseñados para atributos nominales.
Este módulo se incluye en la edición de SPSS Professional para la versión en local, así como en la edición Base para los planes de suscripción.
El diálogo Validar datos se utiliza para validar los datos. El separador Variables muestra variables en su archivo. Empiece seleccionando las variables que quiera y muévalas a la lista de Variables de análisis.
Puede especificar comprobaciones básicas para aplicar a las variables y casos de su archivo. Por ejemplo, puede obtener informes que identifican variables con un alto porcentaje de valores omitidos o casos vacíos.
Aplique reglas a variables individuales que identifican valores no válidos: valores fuera de un rango válido o valores omitidos. También puede crear sus propias reglas, reglas inter variables o aplicar reglas predefinidas.
La preparación de datos automatizada proporciona recomendaciones y permite a los usuarios obtener detalles y examinar las recomendaciones.
La preparación de datos manual es un proceso complejo que requiere mucho tiempo. Si necesita resultados rápidos, el procedimiento de ADP le ayudará a detectar y corregir errores de calidad y a imputar valores omitidos en un solo paso eficaz. La función ADP proporciona un informe fácil de entender con recomendaciones y visualizaciones completas para ayudarle a determinar los datos correctos que debe utilizar en su análisis.
Realice comprobaciones de datos automáticas y acabe con las tediosas comprobaciones manuales utilizando el procedimiento de validación de datos. Este procedimiento le permite aplicar reglas para realizar comprobaciones de datos basándose en el nivel de medida de cada variable, ya sea categórica o continua. A continuación, determine la validez de los datos y elimine o corrija los casos que considere sospechosos antes del análisis.
SPSS Data Preparation incluye características como la validación de datos, la preparación de datos automatizada, la agrupación óptima y la identificación de casos inusuales.
Con el procedimiento de agrupación óptimo, puede utilizar de forma más precisa algoritmos diseñados para atributos nominales, como los modelos Naive Bayes y logit. La agrupación óptima le permite agrupar variables de escala o establecer puntos de corte para variables de escala.
Elija uno de estos tipos de agrupación óptima para el preprocesamiento de datos antes de crear modelos:
1) No supervisado. Crear agrupaciones con recuentos iguales.
2) Supervisado. Tener en cuenta la variable de destino para determinar los puntos de corte. Este método es más preciso que el no supervisado; sin embargo, también presenta una mayor carga de cálculo.
3) Enfoque híbrido: Combinar los enfoques no supervisado y supervisado. Este método resulta especialmente útil si tiene una gran cantidad de valores distintos.