評估圖

評估圖類似於直方圖或集合圖形。 評估圖表顯示預測特定結果的精確模型。 它們的工作方式是根據預測值及預測的信賴度來排序記錄,將記錄分割成相等大小 (分位數) 的群組,然後繪製每個分位數的準則值 (從最高到最低)。 多個模型在圖形中顯示為個別的行。

透過將特定值或值範圍定義為「命中」來處理結果。 通常,匹配表示相關的某類別(如向顧客銷售)或某事件(如某項醫療診斷)成功執行。

旗標
輸出欄位直接明確;相符數對應於 true 值。
名義
對於名義輸出欄位,集中的第一個值定義一次相符。
連續
對於連續輸出欄位,相符數的值等於或大於欄位範圍的中間點。

評估圖也可以是累加的,因此每個點都等於對應分位數加上所有較高分位數的值。 累加圖表通常能夠更好的表現模型效能,而非累加圖則更有利於指出模型中可能存在問題的地方。

建立簡單的評估圖

  1. 圖表類型 區段中,按一下 評估 圖示。

    即會更新畫布,以顯示評估圖範本。

  2. 設定目標欄位預測欄位信任欄位變數。 目標欄位可以為任何實例化旗標或具有兩個或多個值的名義欄位。 預測欄位定義用作預測值的變數。 信任欄位定義用來建立預測信任的變數。
    附註: 預測欄位 變數類型必須符合為 目標欄位選取的變數類型。
  3. 指定用於指出使用者定義相符的自訂條件。 此選項更適合於定義相關結果,而不是從目標欄位類型和值的順序中推測結果。

    您必須為相符條件指定 CLEM 表示式。 例如, @TARGET = "YES" 是一個有效條件,指出目標欄位的 Yes 值在評估中被計算為命中。 指定的條件用於所有目標欄位。

  4. 按一下 在專案中儲存視覺化 控制項,以將視覺化儲存至專案。 您也可以從視覺化中選取 建立新資產 ,並提供視覺化資產名稱、說明及圖表名稱。
  5. 按一下 套用 ,將視覺化儲存至專案。 現在可以在 資產 標籤下使用新的視覺化資產。

選項

目標欄位
列出具有兩個以上值的實例化旗標或名義欄位變數。
使用者定義的符合項
指定命中值。 點閱指出感興趣的事件 (例如,特定醫療診斷)。
預測欄位
列出可用作預測值的變數。
信賴度欄位
列出可建立預測信賴度的變數。
累加圖
啟用後即會建立累加圖。 累加圖表中繪製的值代表每個分位數與所有更高分位數的和。
顯示模式
這些設定控制哪些圖表以預覽模式顯示在輸出中。
單一模式
選取後,只有模型分類調整圖會以預覽模式顯示在輸出。
標準模式
選取後,模型分類調整圖、截斷圖、矩陣長條圖、ROC 圖、增益圖、ROI 圖以及利潤圖會以預覽模式顯示在輸出中。
完整模式
選取後,模型分類調整圖、截斷圖、矩陣長條圖、ROC 圖、增益圖、ROI 圖、利潤圖、GINI 圖、提升圖及回應圖會以預覽模式顯示在輸出中。
評估圖
截斷
截斷圖表會針對指定的截斷值,顯示所選取變數的預測值與實際值。
矩陣長條
矩陣長條圖是判斷多重變數之間是否存在線性相關性的好方法。
ROC
ROC (接收端作業性質) 會評估分類架構的效能,其中會針對具有兩個種類的一個變數對受試者進行分類。
增益
增益的定義是相對於全部匹配,發生於每個分位數中的匹配的百分比。 收益計算方式為 (number of hits in quantile / total number of hits) × 100%
投資報酬率
投資報酬 (ROI) 也需要確定營收和成本,從這一點上來說,它與利潤相同。 ROI 將分位數的成本和利潤進行比較。 ROI 計算為 (profits for quantile / costs for quantile) × 100%
利潤
利潤等於每條記錄的營收減去該記錄的成本。 分位數的利潤是分位數中所有記錄的利潤總和。 這裡假定營收僅套用至命中數,但成本可套用至所有的記錄。 利潤及成本都可以是固定的,也可以由資料中的欄位決定。 其計算方法為(分位數中所有記錄營收的總和 - 分位數中所有記錄成本的總合)。
Kolmogorov-Smirnov(K)
比較變數的觀察累積分佈函數與指定的理論分佈 (可以是常態、均勻、指數或 Poisson)。
GINI
GINI 測量統計離散且預期代表收入或財富分佈。 它是最常用的不平等測量方法。
增益率
提升將每個分位數中的記錄數(即命中數)百分比與訓練資料集中命中數的總百分比進行比較。 其計算方式為 (hits in quantile / records in quantile) / (total hits / total records)
回應
回應是分位數中命中的記錄百分比。 回應計算為 (hits in quantile / records in quantile) × 100%
評估圖設定
下列設定僅適用於利潤圖和 ROI 圖。
成本
指定與每筆記錄相關聯的固定成本。
收入
指定與代表相符的每筆記錄相關聯的固定營收。
重量
如果資料中的記錄代表多個單元,那麼可以使用頻率加權來調整結果。 指定與每筆記錄相關聯的固定加權。