相关设置
IBM® SPSS® Modeler 可以使用描述性标签描述相关的特征以帮助突出显示重要关系。相关度量两个连续(数值范围)字段之间的关系强度。它的值介于 –1.0 和 1.0 之间。值接近于 +1.0 表示强正相关,因此在两个字段之间,大值与大值相关,小值与小值相关。值接近于 –1.0 表示强负相关,因此在两个字段之间,大值与小值相关,小值与大值相关。值接近于 0.0 表示弱相关,因此,两个字段的值或多或少地相互独立。
通过使用“相关设置”对话框,您可以控制相关标签的显示,更改定义类别的阈值,以及更改用于每个范围的标签。因为刻画相关的方式很大程度上依赖于问题域,所以您可能需要依据具体情况来自定义范围和标签。
在输出中显示相关强度标签。缺省情况下,此选项处于选中状态。取消选择此选项将在输出中省略描述标签。
相关强度。有两个选项用于定义和标记相关强度:
- 按重要性 (1-p) 定义相关强度。根据重要性标记相关,重要性等于 1 减显著性(即,1 减去平均值的差值完全归结于机遇变异的概率)。此值越接近于 1,两个字段不独立的机率越大,换句话说,它们之间存在某种关系。一般情况下,建议根据重要性而不是绝对值标记相关,因为重要性考虑了数据的可变性,例如系数 0.6 可能在某个数据集中非常显著,而在另一个数据集中根本不显著。缺省情况下,将介于 0.0 和 0.9 之间的重要性值标记为弱,将介于 0.9 和 0.95 之间的重要性值标记为中,将介于 0.95 和 1.0 之间的重要性值标记为强。
- 按绝对值定义相关强度。如上所述,根据 Pearson 相关系数(介于 –1 和 1 之间)的绝对值标记相关。此度量的绝对值越接近于 1,相关就越强。缺省情况下,将介于 0.0 和 0.3333 之间的相关(采用绝对值的形式)标记为弱,将介于 0.3333 和 0.6666 之间的相关标记为中,将介于 0.6666 和 1.0 之间的相关标记为强。但是请注意,要将任何给定值的显著性从一个数据集扩展到另一个数据集都是非常困难的;因此,在大多数情况下,建议根据概率而不是绝对值定义相关。