相关性矩阵

图 1。 销售与燃油效率的相关性 (以千为单位)
来自 "双变量相关性" 过程的相关性矩阵。

皮尔逊相关系数测量两个刻度变量之间的线性关联。 表中报告的相关性为负 (!) ,尽管与 0 没有显着不同,因为 0.837 的 p 值大于 0.10。 这表明设计师们不应把精力集中在让汽车更节能上,因为对销售没有明显的影响。

但是,当变量近似正态分布且没有离群值时, Pearson 相关系数最有效。 散点图可以揭示这些可能的问题。

  1. 要按 燃油效率生成 销售额 (以千计) 散点图,请从菜单中选择:

    图形 > 图表构建器 ...

    图 2。 图表构建器
    图表构建器
  2. 选择 散点图/点 库,然后选择 "简单散点图"。
  3. 选择 销售额 (以千计) 作为 y 变量,选择 燃油效率 作为 x 变量。
  4. 单击 "组/点标识" 选项卡,然后选择 点标识标签
  5. 选择 模型 作为要作为个案标签依据的变量。
  6. 单击确定
图 3。 销售和燃油效率的散点图
销售和燃油效率的散点图。 图中左下角有云点,右下角有单点,左上角有单点。

生成的散点图显示了两个潜在的离群值,即图右下角的 Metro 和左上角的 F-Series。

发现 F-Series 通常代表您的设计团队正在处理的车辆,因此您决定将其保留在数据集中。 由于 销售额 (以千计)偏差 分布,因此此点可能显示为离群值,因此请尝试在进一步的分析中将其替换为 对数转换的销售额 。 Metro 并不代表您的设计团队正在处理的车辆,因此您可以安全地将其从进一步的分析中移除。

NEXT