ROC 分析

受試者工作特徵 (ROC) 分析是用來評量模型預測正確性的一個有用方法,評量方式是繪製分類檢定的靈敏度與(1-特異度)(因為臨界值在診斷檢定結果的整個範圍會改變)。 給定 ROC 曲線 (AUC) 下的完整區域會制定重要統計量,以代表在觀察到檢定變數時 (針對從觀察值群組隨機選取的一個受試者,以及針對從控制群組隨機選取的另一個受試者) 以正確順序進行預測的機率。 「ROC 分析」支援對單一 AUC、查準率-查全率 (PR) 曲線進行推理,並提供選項用來比較根據獨立群組或配對受試者產生的兩個 ROC 曲線。

舊的 ROC 曲線程序支援關於單一 ROC 曲線的統計推斷。 新的「ROC 分析」程序也可以回復此情況。 此外,新的 ROC 分析程序可以比較從獨立群組或成對受試者產生的兩個 ROC 曲線。

PR 曲線會繪製查準率與查全率,當觀察資料樣本高度扭曲時該曲線往往更加有用,並且它針對在類別分佈中有很大偏差的資料提供 ROC 曲線的替代方案。

範例
銀行依利息將客戶分成兩種,會借貸者與不會借貸者,因此便發展出這類特殊模型,以執行這類判斷。 ROC 分析可用來評估和評量模型預測的正確性。
統計資料
AUC、負面群組、遺漏值、正面分類、截斷值、確信強度、兩端漸近信賴區間、分佈、標準誤、獨立群組設計、成對樣本設計、無母數假設、雙負指數分佈假設、中間點、分割點、PR 曲線、逐步插入、漸近顯著性(兩尾)、靈敏度和(1-特異度)、查準率與查全率。
方法
會比較位於兩個 ROC 曲線下根據獨立群組或配對受試者產生的區域。 在兩個比較診斷方法產生的正確性方面,比較兩個 ROC 曲線可以提供更多資訊。

ROC 分析資料考量

日期
PR 曲線會繪製查準率與查全率,當觀察資料高度扭曲時此曲線往往更加有用。 簡單的線性插補可能錯誤地產生過於樂觀的 PR 曲線估計。
假設
針對從觀察值群組中隨機選取的一個受試者以及從控制群組中隨機選取的另一個受試者觀察檢定變數時,將會以正確的順序進行預測。 每一個定義的群組將至少包含一個有效的觀察。 單個程序只會使用一個分組變數。

取得 ROC 分析

本功能需要 Statistics Base 選項。

  1. 從功能表中選擇:

    分析 > 分類 > ROC 分析

  2. 選取一個或多個檢定機率變數。
  3. 選取一個狀態變數。
  4. 識別狀態變數的值。
  5. 選擇性地選取成對樣本設計選項,或選取單個分組變數(不能同時選取兩個選項)。
    • 使用成對樣本設計設定來要求針對檢定變數提供成對樣本設計。 在某個狀態變數關聯的相同受試者上測量多個檢定值時,成對樣本設計會比較成對樣本情境中的兩個 ROC 曲線。
      附註: 當選取 成對樣本設計 時,會停用 分組變數分佈假設 (在「選項」對話框中) 選項。
    • 當選取數值分組變數時,您可以按一下「 定義組別 ... 」。 以要求檢定變數的獨立群組設計,並指定兩個值、中間點或分割點。
  6. 選擇性地按一下 選項 ,以定義分類、檢定方向、標準誤參數及遺漏值設定。
  7. 選擇性地按一下 顯示 ,以定義繪製及列印設定 (包括 ROC 曲線、查準率-查全率曲線及模型品質設定)。
  8. 按一下確定

此程序會貼上 ROC ANALYSIS 指令語法。