Explorar

Esta característica requiere la opción Statistics Base.

El procedimiento Explorar genera estadísticos de resumen y representaciones gráficas, bien para todos los casos o bien de forma separada para grupos de casos. Existen numerosas razones para utilizar este procedimiento: para inspeccionar los datos, identificar valores atípicos, obtener descripciones, comprobar supuestos y caracterizar diferencias entre subpoblaciones (grupos de casos). La inspección de los datos puede mostrar que existen valores inusuales, valores extremos, discontinuidades en los datos u otras peculiaridades. La exploración de los datos puede ayudar a determinar si son adecuadas las técnicas estadísticas que está teniendo en consideración para el análisis de los datos. La exploración puede indicar que necesita transformar los datos si la técnica necesita una distribución normal. O bien, el usuario puede decidir que necesita utilizar pruebas no paramétricas.

Ejemplo. Observe la distribución de los tiempos de aprendizaje de laberintos de una serie de ratas sometidas a cuatro programas de refuerzo diferentes. Para cada uno de los cuatro grupos, se puede observar si la distribución de tiempos es aproximadamente normal y si las cuatro varianzas son iguales. También se pueden identificar los casos con los cinco valores de tiempo mayores y los cinco menores. Los diagramas de caja y los gráficos de tallo y hojas resumen gráficamente la distribución del tiempo de aprendizaje de cada uno de los grupos.

Estadísticos y gráficos. Media, mediana, media recortada al 5%, error estándar, varianza, desviación estándar, mínimo, máximo, rango, rango intercuartil, asimetría y curtosis y sus errores estándar, intervalo de confianza para la media (y el nivel de confianza especificado), percentiles, estimador-M de Huber, estimador en onda de Andrews, estimador-M redescendente de Hampel, estimador biponderado de Tukey, cinco valores mayores y cinco menores, estadístico de Kolmogorov-Smirnov con el nivel de significación de Lilliefors para contrastar la normalidad y estadístico de Shapiro-Wilk. Diagramas de caja, gráficos de tallo y hojas, histogramas, diagramas de normalidad y diagramas de dispersión por nivel con pruebas de Levene y transformaciones.

Explorar: Consideraciones sobre los datos

Datos. El procedimiento Explorar se puede utilizar para las variables cuantitativas (nivel de medición de razón o de intervalo). Una variable de factor (utilizada para dividir los datos en grupos de casos) debe tener un número razonable de valores distintivos (categorías). Estos valores pueden ser de cadena corta o numéricos. La variable de etiquetas de caso, utilizada para etiquetar valores atípicos en los diagramas de caja, puede ser de cadena corta, de cadena larga (los 15 primeros bytes) o numérica.

Supuestos. La distribución de los datos no tiene que ser simétrica ni normal.

Para explorar los datos

Esta característica requiere la opción Statistics Base.

  1. En los menús seleccione:

    Analizar > Estadísticos descriptivos > Explorar ...

  2. Seleccione una o más variables dependientes.

Si lo desea, puede:

  • Seleccionar una o más variables de factor, cuyos valores definirán grupos de casos.
  • Seleccionar una variable de identificación para etiquetar los casos.
  • Pulse en Estadísticos para obtener estimadores robustos, valores atípicos, percentiles y tablas de frecuencias.
  • Pulse en Gráficos para obtener histogramas, pruebas y gráficos de probabilidad normal y diagramas de dispersión por nivel con estadísticos de Levene.
  • Pulse Opciones para el tratamiento de los valores perdidos.

Este procedimiento pega la sintaxis del comando EXAMINE .