建模简介

模型是一组规则、公式或方程式，可以使用它们来根据一组输入字段或变量预测输出。例如，金融机构可以使用模型来根据以往的申请人的已知相关信息预测贷款申请人具有较低风险还是较高风险。

预测结果的能力是预测性分析的中心目标，了解建模过程是使用 IBM® SPSS® Modeler的关键。

本示例使用决策树模型，该模型使用一系列决策规则对记录进行分类（并预测响应），例如：

IF income = Medium 
AND cards <5
THEN -> 'Good'

虽然此示例使用 CHAID (卡方自动交互检测) 模型，但它旨在作为一般介绍，并且大多数概念广泛适用于 IBM SPSS Modeler中的其他建模类型。

无论要了解哪种模型，均需要首先了解进入该模型的数据。此示例中的数据包含有关银行客户的信息。其中使用了下列字段：

对于已申请银行贷款的客户，银行维护其相关历史信息的数据库，这些信息包括客户是偿还了贷款（信用评级 = 优良）还是拖欠贷款（信用评级 = 不良）。通过使用此现有数据，银行将构建一个模型，该模型使他们能够预测未来的贷款申请者拖欠贷款的可能性。

通过使用决策树模型，您可以分析两组客户的特征并预测贷款拖欠的发生可能性。

本示例使用了名为 modelingintro.str 的流，该流位于 streams 子文件夹下的 Demos 文件夹中。数据文件是 tree_credit.sav。请参阅主题 Demos Folder 以获取更多信息。

我们来看一下流。