相关性矩阵

皮尔逊相关系数测量两个刻度变量之间的线性关联。 表中报告的相关性为负 (!) ,尽管与 0 没有显着不同,因为 0.837 的 p 值大于 0.10。 这表明设计师们不应把精力集中在让汽车更节能上,因为对销售没有明显的影响。
但是,当变量近似正态分布且没有离群值时, Pearson 相关系数最有效。 散点图可以揭示这些可能的问题。
- 要按 燃油效率生成 销售额 (以千计) 散点图,请从菜单中选择:
图 2。 图表构建器 
- 选择 散点图/点 库,然后选择 "简单散点图"。
- 选择 销售额 (以千计) 作为 y 变量,选择 燃油效率 作为 x 变量。
- 单击 "组/点标识" 选项卡,然后选择 点标识标签。
- 选择 模型 作为要作为个案标签依据的变量。
- 单击确定。

生成的散点图显示了两个潜在的离群值,即图右下角的 Metro 和左上角的 F-Series。
发现 F-Series 通常代表您的设计团队正在处理的车辆,因此您决定将其保留在数据集中。 由于 销售额 (以千计)的 偏差 分布,因此此点可能显示为离群值,因此请尝试在进一步的分析中将其替换为 对数转换的销售额 。 Metro 并不代表您的设计团队正在处理的车辆,因此您可以安全地将其从进一步的分析中移除。