Las variables seleccionadas presentan distribuciones diversas:Figura 1. Estadísticos descriptivos
Estas métricas indican una variabilidad sustancial en los ingresos y la duración del empleo entre los solicitantes de préstamos, lo que podría influir en las relaciones financieras de forma no lineal.
Análisis de correlación de distancias:
La correlación de distancia identifica asociaciones lineales y no lineales entre pares de variables.Figura 2. Coeficientes de correlación de distancia
Principales resultados:
Relación más fuerte: employvs.income muestra la correlación de distancia más alta ( dCor = 0.444 ), lo que sugiere una relación no lineal moderada: es probable que un mayor número de años en una empresa se asocie a unos ingresos más elevados.
Relaciones moderadas: agevs.employ y agevs.income (ambas en torno a dCor = 0.28 ) reflejan dependencias leves, posiblemente debidas a la experiencia acumulada o a la progresión profesional con la edad.
Relaciones insignificantes o inexistentes: El coeficiente deuda/ingresos muestra una asociación mínima con cualquiera de las demás variables, con valores de dCor próximos a cero y amplios intervalos de confianza que abarcan 0.
Estimaciones de la correlación de distancias
Figura 3. Estimaciones de la correlación de distancias
La covarianza de distancia ( dCov ) refleja la magnitud absoluta de la variabilidad conjunta entre variables en el espacio métrico de la distancia. Los valores más altos indican una mayor dependencia conjunta antes de la normalización.
La correlación de distancia ( dCor ) es una versión normalizada de dCov, que va de 0 (sin dependencia) a 1 (dependencia perfecta). Permite la comparación entre pares de variables de diferentes escalas.
Alta dCov y dCor
El par employs.income no sólo tiene la correlación más alta ( dCor = 0.444 ) sino también una notable dCov ( 0.0026 ), lo que muestra una variabilidad compartida sustancial.
agevs.employ y agevs.income siguen a continuación, con valores dCov más bajos pero aún significativos dCor ( ~0.28 ), revelando relaciones moderadas a pesar de las diferentes escalas.
Bajo dCov y dCor
Los pares de variables en los que interviene debtinc tienen valores dCov próximos a cero, y los valores dCor también próximos a cero, lo que confirma que el coeficiente deuda-ingresos se comporta independientemente de las demás variables de este conjunto de datos.
Mientras que dCor muestra el grado de vinculación de las variables en relación con su propia escala, dCov puede ayudar a revelar si la variabilidad conjunta bruta es trivial aunque la correlación normalizada parezca distinta de cero.
En el conjunto de datos, los valores bajos de dCov (Por ejemplo, incomevs.debtinc0.0000 ) refuerzan el argumento de que estas variables no están vinculadas estadísticamente.
Variable de distancia
Figura 4. Variable de distanciaEstos valores cuantifican la variabilidad de las distancias entre pares dentro de cada variable. En particular:
la edad y el empleo presentan la mayor variabilidad de distancia interna.
los ingresos tienen una varianza de distancia relativamente baja a pesar de un amplio rango numérico, posiblemente debido a la normalización y a una distribución sesgada.
Gráfico de dispersión de distancias por pares
El gráfico de dispersión seleccionado (edad frente a ratio de endeudamiento ) ofrece una perspectiva visual de sus distancias por pares:Figura 5. Diagrama de dispersión de las distancias entre pares
El gráfico muestra las distancias mín-máx normalizadas para la edad (eje X) y la relación entre deuda e ingresos (eje Y).
No hay ningún patrón o agrupación discernible, lo que concuerda con la muy baja correlación de distancias ( dCor = 0.0021 ).
Esto confirma además que la edad y el coeficiente deuda/ingresos son estadísticamente independientes en este conjunto de datos.