Distancias

Este procedimiento calcula una variedad de estadísticos que miden las similitudes o diferencias (distancias), entre pares de variables o entre pares de casos. Estas medidas de similaridad o de distancia se pueden utilizar después con otros procedimientos, como análisis factorial, análisis de clústeres o escalamiento multidimensional, para ayudar en el análisis de conjuntos de datos complejos.

Ejemplo. ¿Es posible medir similaridades entre pares de automóviles en función de ciertas características, como tipo de motor, consumo y potencia? Al calcular las similitudes entre los coches, se puede obtener una noción de qué coches son similares entre sí y cuáles son diferentes. Para un análisis más formal, puede considerar la aplicación de un análisis jerárquico de clústeres o escalamiento multidimensional a las similitudes para explorar la estructura subyacente.

Estadísticas. Las medidas de diferencia (distancia) para datos de un intervalo son Distancia euclídea, Distancia euclídea al cuadrado, Chebychev, bloque, Minkowski o personalizada; para datos de recuento, medida de chi-cuadrado o phi-cuadrado; para datos binarios, Distancia euclídea, Distancia euclídea al cuadrado, diferencia de tamaño, diferencia de configuración, varianza, forma o Lance y Williams. Las medidas de similitud para datos de intervalos son correlación de Pearson o coseno; para datos binarios, Russel y Rao, concordancia simple, Jaccard, Dice, Rogers y Tanimoto, Sokal y Sneath 1, Sokal y Sneath 2, Sokal y Sneath 3, Kulczynski 1, Kulczynski 2, Sokal y Sneath 4, Hamann, Lambda, D de Anderberg, Y de Yule, Q de Yule, Ochiai, Sokal y Sneath 5, correlación Phi de 4 puntos o dispersión.

Para obtener matrices de distancias

Esta característica requiere la opción Statistics Base.

  1. En los menús seleccione:

    Analizar > Correlacionar > Distancias ...

  2. Seleccione al menos una variable numérica para calcular distancias entre casos o seleccione al menos dos variables numéricas para calcular distancias entre variables.
  3. Seleccione una alternativa en el grupo Calcular distancias para calcular proximidades entre casos o entre variables.