Matriz de correlaciones

El coeficiente de correlación de Pearson mide la asociación lineal entre dos variables de escala. La correlación notificada en la tabla es negativa (!), aunque no es significativamente diferente de 0 porque el valor p de 0.837 es mayor que 0.10. Esto sugiere que los diseñadores no deben centrar sus esfuerzos en hacer que los coches sean más eficientes en combustible porque no hay un efecto apreciable en las ventas.
Sin embargo, el coeficiente de correlación de Pearson funciona mejor cuando las variables están aproximadamente normalmente distribuidas y no tienen valores atípicos. Un diagrama de dispersión puede revelar estos posibles problemas.
- Para generar un diagrama de dispersión de Ventas en miles por Eficiencia de combustible, en los menús elija:
Figura 2. Generador de gráficos 
- Seleccione la galería Dispersión/Punto y elija Dispersión simple.
- Seleccione Ventas en miles como la variable y y Eficiencia de combustible como la variable x .
- Pulse la pestaña Grupos/ID de punto y seleccione Etiqueta de ID de punto.
- Seleccione Modelo como la variable por la que etiquetar los casos.
- Pulse Aceptar.

El diagrama de dispersión resultante muestra dos valores atípicos potenciales, el Metro en la parte inferior derecha del gráfico y el F-Series en la parte superior izquierda.
Se encuentra que la serie F es generalmente representativa de los vehículos en los que está trabajando su equipo de diseño, por lo que decide mantenerla en el conjunto de datos por ahora. Este punto puede parecer un valor atípico debido a la distribución de desvío de Ventas en miles, así que intente sustituirlo por Ventas transformadas en log en análisis adicionales. El Metro no es representativo de los vehículos en los que está trabajando su equipo de diseño, por lo que puede eliminarlo de forma segura de más análisis.