距离相关性

此功能需要 Statistics Base 选项。

距离相关性程序计算两个随机变量或多元数据之间的相关性。 与传统的相关性方法不同,它可以评估变量之间的非线性关系。

示例
一家零售公司希望了解客户的人口统计学特征(年龄、收入、教育程度、婚姻状况)是否会影响他们的购买行为。 如果关系是非线性的或涉及多个因素之间的相互作用,传统的相关性方法可能会失效。
在该方案中应用距离相关程序有以下好处:
  • 捕捉非线性依赖关系 与皮尔逊相关性不同,距离相关性即使不是线性关系也能检测到。
  • 处理多维关系 它可以评估人口统计因素的组合与购买模式的关系。
  • 提供全面的措施。 明显的距离相关性表明,客户人口统计学对购买行为有很大影响,从而指导有针对性的营销策略。
相关统计
  • 距离相关性( dCor(X,Y ):衡量客户人口统计 (X )与购买行为 (Y )之间的相关性。
  • 基于置换的 p 值:评估依赖关系的统计意义。 小的 p 值(例如 p<0.05 )表示关系密切。
  • 距离协方差( dCov(X,Y ):量化变量之间的依赖强度。
  • 距离方差( dVar(X ), dVar(Y ) ):测量单个变量内的变异性以使相关性正常化。
数据注意事项
只能使用连续变量进行分析。 计算距离相关性至少需要 2 个连续变量。 最多允许使用 30 个变量。

获取距离相关性

  1. 从菜单中单击分析 > 相关性 > 距离相关性
    注意: 红色标记的字段为必填项。 在所有必填字段中输入有效值后," 粘贴 "和 "确定 "按钮将被启用。
  2. 选择要计算距离相关性的两个或多个数字变量。 您最多可以从源数据集中选择 30 个连续变量进行分析。
  3. 选择一个标识符变量。 如果选择 ID 变量 ,结果将显示带有 ID 的距离矩阵表。
  4. 单击 " 确定 " 以指定设置运行程序并生成输出。

此过程粘贴 DISTANCE CORRELATION 命令语法。