建模簡介

模型是一組規則、公式或方程式,可用於根據輸入欄位或變數集預測結果。例如,金融機構可使用模型來根據已知的過去申請人的資訊,預測貸款申請人是風險良好還是很差。

預測結果的能力是預測分析的主要目標,瞭解建模過程是使用 IBM® SPSS® Modeler 的關鍵。

圖 1. 簡單決策樹模型
簡單的決策樹模型

此範例使用決策樹模型,它使用一系列決策規則對記錄進行分類(並預測回應),例如:

IF income = Medium 
AND cards <5
THEN -> 'Good'

雖然此範例使用 CHAID(卡方自動互動偵測)模型,但是它旨在一般介紹,大部分概念廣泛適用於 IBM SPSS Modeler 中的其他建模類型。

若要瞭解任何模型,您首先需要瞭解進入模型的資料。此範例中的資料包含銀行客戶的相關資訊。使用了下列欄位:

欄位名稱(F) 說明
信用評級 信用評級:0=差,1=良好,9=遺漏值
年齡 年齡(歲)
收入 收入層次:1=低,2=中,3=高
信用卡 所持有的信用卡數目:1=五張以下,2=五張或更多
教育程度 教育程度:1=高中,2=大學
汽車貸款 借汽車貸款的次數:1=零次或一次,2=超過兩次

銀行維護曾向銀行貸款之客戶的歷程資訊的資料庫,包括他們是還清貸款(信用評級 = 良好)還是拖欠(信用評級 = 不良)。透過使用此現有資料,銀行希望建置一個模型,使他們能夠預測將來貸款申請人拖欠貸款的可能性如何。

透過使用決策樹模型,您可以分析兩個客戶群組的性質,並預測拖欠貸款的可能性。

此範例使用名為 modelingintro.str 的串流,可從 Demos 資料夾中 streams 子資料夾下取得。資料檔案是 tree_credit.sav。如需相關資訊,請參閱Demos 資料夾主題。

我們來看一看串流。

  1. 從主功能表中選擇下列各項:

    檔案 > 開啟串流

  2. 按一下「開啟」對話框的工具列上的金色塊圖示並選擇 Demos 資料夾。
  3. 按兩下 streams 資料夾。
  4. 按兩下名為 modelingintro.str 的檔案。

下 一個(N)