Matriz de correlações

Figura 1. Correlações para vendas em milhares e eficiência de combustível
Uma matriz de correlações do procedimento de Correlações Bivariadas.

O coeficiente de correlação de Pearson mede a associação linear entre as duas variáveis de escala. A correlação relatada na tabela é negativa (!), embora não seja significativamente diferente de 0 porque o valor p de 0.837 é maior que 0.10. Isso sugere que os designers não devem concentrar seus esforços em tornar os carros mais eficientes em termos de combustível, pois não há um efeito significativo nas vendas.

No entanto, o coeficiente de correlação de Pearson funciona melhor quando as variáveis são aproximadamente normalmente distribuídas e não têm outliers. Um gráfico de dispersão pode revelar esses possíveis problemas

  1. Para produzir um gráfico de dispersão de Vendas em milhares por Eficiência de combustível, nos menus, escolha:

    Gráficos > Construtor de Gráfico ...

    Figura 2 Construtor de Gráfico
    Construtor de Gráfico
  2. Selecione a galeria Dispersão / Ponto e escolha Dispersão simples.
  3. Selecione Vendas em milhares como a variável y e Eficiência de combustível como a variável x .
  4. Clique na guia Grupos / ID do Ponto e selecione Rótulo do ID do Ponto
  5. Selecione Modelo como a variável pela qual rotular casos.
  6. Clique em OK.
Figura 3. Gráfico de dispersão para vendas e eficiência de combustível
Um gráfico de dispersão para eficiência de Vendas e Combustível. Há uma nuvem de pontos na parte inferior esquerda do gráfico, com um único ponto na parte inferior direita e um único ponto na parte superior esquerda.

O gráfico de dispersão resultante mostra dois potenciais outliers, o Metro na parte inferior direita do gráfico e o F-Series na parte superior esquerda.

A F-Series é geralmente representativa dos veículos em que sua equipe de design está trabalhando, então você decide mantê-la no conjunto de dados por enquanto. Esse ponto pode parecer um valor discrepante devido à distribuição skew de Vendas em milhares, portanto, tente substituí-lo por Vendas transformadas em log em análises adicionais. O Metro não é representativo dos veículos em que sua equipe de design está trabalhando, portanto, você pode removê-lo com segurança de outras análises.

Próximo