ROC 分析

受试者工作特征 (ROC) 分析用于通过绘制分类检验的敏感度(1 特异性)来评估模型预测的准确性(因为阈值随预测检验结果的整个范围而变化)。 给定 ROC 曲线 (AUC) 下的完整区域表示一个重要统计,该统计表示当观察到检验变量时,预测将处于正确顺序的概率 (对于从个案组中随机选择的一个主体,以及从对照组中随机选择的另一个主体)。 ROC 分析支持有关单个 AUC、精确度与反馈 (PR) 曲线的推论,并提供选项以供比较从独立组或成对主体生成的两个 ROC 曲线。

旧的 ROC 曲线过程支持关于单个 ROC 曲线的统计推断。 这也可能由新的 ROC 分析过程恢复。 此外,新的 ROC 分析过程可以比较从独立组或成对主体生成的两条 ROC 曲线。

PR 曲线绘制精确度与反馈,当观察到的数据样本高度偏斜时趋势具有更大的信息量,此曲线还针对类分布具有较大偏差的数据提供 ROC 曲线的替代方法。

示例
银行感兴趣的是正确地将客户分类成会拖欠贷款和不会拖欠贷款两类,因此为做出这些决策制定了特殊模型。 ROC 分析可用于评估模型预测的精确度。
统计信息
AUC、对照组、缺失值、正分类、分界值、确信度、双尾渐进置信区间、分布、标准误差、独立组设计、配对样本设计、非参数假设、双负指数分布假设、中点、分割点、PR 曲线、逐步插值法、渐进显著性(双尾)、敏感度和(1 特异性)、精确度与反馈。
方法
将比较从独立组或配对主体生成的两个 ROC 曲线下的区域。 比较两个 ROC 曲线可提供有关从两个比较诊断方法生成的精确度的更多信息。

ROC 分析数据注意事项

数据
PR 曲线绘制精确度与反馈,并且在观察到的数据样本高度偏差时,趋势具有更大的信息量。 简单线性插值可能错误产生过度乐观的 PR 曲线估算。
假定
在针对从个案组随机选择的一个主体以及从控制组随机选择的另一个主体观察检验变量时,预测将采用正确顺序。 每个定义的组都包含至少一个有效观测值。 仅将一个分组变量用于单个过程。

获取 ROC 分析

此功能需要 Statistics Base 选项。

  1. 从菜单中选择:

    分析 > 分类 > ROC 分析

    注意: 红色标记的字段为必填项。 在所有必填字段中输入有效值后," 粘贴 "和 "确定 "按钮将被启用。
  2. 选择一个或多个 测试变量 测试概率变量。
  3. 选择一个 状态变量
  4. 确定 状态变量的值
  5. (可选)选择配对样本设计选项,或者选择单个分组变量(无法同时选择这两个选项)。
    • 使用配对样本设计设置以针对测试变量请求配对样本设计。 在与状态变量相关联的相同主体上度量多个检验值时,配对样本设计将比较配对样本场景中的两个 ROC 曲线。
      注: 选择 配对样本设计 时,将禁用 分组变量分布假设 (在 "选项" 对话框中) 选项。
    • 选择数字分组变量时,可以单击 定义组 ... 以请求检验变量的独立组设计,并指定两个值,一个中点或一个分割点。
  6. (可选) 单击 选项 以定义分类,测试方向,标准错误参数和缺失值设置。
  7. (可选) 单击 显示 以定义绘图和打印设置 (包括 ROC 曲线,精度-召回率曲线和模型质量设置)。
  8. 单击确定

此过程将粘贴 ROC ANALYSIS 命令语法。