Correlación de distancias

Esta característica requiere la opción Statistics Base.

El procedimiento Correlaciones a distancia calcula la dependencia entre dos variables aleatorias o datos multivariantes. Evalúa la relación no lineal de las variables, a diferencia de los métodos de correlación tradicionales.

Ejemplo
Una empresa minorista quiere saber si los datos demográficos de sus clientes (edad, ingresos, educación, estado civil) influyen en su comportamiento de compra. Los métodos tradicionales de correlación pueden fallar si las relaciones no son lineales o implican interacciones entre múltiples factores.
El procedimiento de Correlación a Distancia puede aplicarse en el escenario con las siguientes ventajas:
  • Captura las dependencias no lineales. A diferencia de la correlación de Pearson, la correlación de distancia detecta relaciones aunque no sean lineales.
  • Maneja relaciones multidimensionales. Puede evaluar la relación entre una combinación de factores demográficos y las pautas de compra.
  • Proporciona una medida exhaustiva. Una correlación de distancia significativa sugiere que los datos demográficos de los clientes influyen mucho en el comportamiento de compra, lo que orienta las estrategias de marketing específicas.
Estadísticas asociadas
  • Correlación de distancia ( dCor(X,Y )): Mide la dependencia entre los datos demográficos del cliente (X ) y el comportamiento de compra (Y ).
  • Valor p basado en permutación: Evalúa la significación estadística de la dependencia. Un valor p pequeño (por ejemplo, p<0.05 ) indica una relación fuerte.
  • Covarianza de distancia ( dCov(X,Y )): Cuantifica la fuerza de la dependencia entre variables.
  • Varianza de distancia ( dVar(X ), dVar(Y ) ): mide la variabilidad dentro de las variables individuales para normalizar la correlación.
Consideraciones sobre los datos
Para el análisis sólo pueden utilizarse variables continuas. Se requiere un mínimo de 2 variables continuas para calcular la correlación de distancias. Se permite un máximo de 30 variables.

Obtención de la correlación de distancias

  1. En el menú, haga clic en: Analizar > Correlacionar > Correlación de distancias.
    Nota: Los campos resaltados en rojo son obligatorios. Los botones Pegar y Aceptar se activan después de introducir valores válidos en todos los campos obligatorios.
  2. Seleccione dos o más variables numéricas para las que se calcula la correlación de distancias. Puede seleccionar hasta 30 variables continuas del conjunto de datos de origen para su análisis.
  3. Seleccione una variable identificadora. Si opta por una Variable ID, los resultados muestran una tabla de matriz de distancia con IDs.
  4. Haga clic en Aceptar para ejecutar el procedimiento con la configuración especificada y generar el resultado.

Este procedimiento pega la sintaxis del comando CORRELACIÓN DE DISTANCIAS.