建模簡介
模型是一組規則、公式或方程式,可用於根據輸入欄位或變數集預測結果。例如,金融機構可使用模型來根據已知的過去申請人的資訊,預測貸款申請人是風險良好還是很差。
預測結果的能力是預測分析的主要目標,瞭解建模過程是使用 IBM® SPSS® Modeler 的關鍵。

此範例使用決策樹模型,它使用一系列決策規則對記錄進行分類(並預測回應),例如:
IF income = Medium
AND cards <5
THEN -> 'Good'
雖然此範例使用 CHAID(卡方自動互動偵測)模型,但是它旨在一般介紹,大部分概念廣泛適用於 IBM SPSS Modeler 中的其他建模類型。
若要瞭解任何模型,您首先需要瞭解進入模型的資料。此範例中的資料包含銀行客戶的相關資訊。使用了下列欄位:
| 欄位名稱(F) | 說明 |
|---|---|
| 信用評級 | 信用評級:0=差,1=良好,9=遺漏值 |
| 年齡 | 年齡(歲) |
| 收入 | 收入層次:1=低,2=中,3=高 |
| 信用卡 | 所持有的信用卡數目:1=五張以下,2=五張或更多 |
| 教育程度 | 教育程度:1=高中,2=大學 |
| 汽車貸款 | 借汽車貸款的次數:1=零次或一次,2=超過兩次 |
銀行維護曾向銀行貸款之客戶的歷程資訊的資料庫,包括他們是還清貸款(信用評級 = 良好)還是拖欠(信用評級 = 不良)。透過使用此現有資料,銀行希望建置一個模型,使他們能夠預測將來貸款申請人拖欠貸款的可能性如何。
透過使用決策樹模型,您可以分析兩個客戶群組的性質,並預測拖欠貸款的可能性。
此範例使用名為 modelingintro.str 的串流,可從 Demos 資料夾中 streams 子資料夾下取得。資料檔案是 tree_credit.sav。如需相關資訊,請參閱Demos 資料夾主題。
我們來看一看串流。
- 從主功能表中選擇下列各項:
- 按一下「開啟」對話框的工具列上的金色塊圖示並選擇 Demos 資料夾。
- 按兩下 streams 資料夾。
- 按兩下名為 modelingintro.str 的檔案。