概述 (MODEL HANDLE 命令)
MODEL HANDLE 读取包含预测模型规范的外部 XML 文件或 ZIP 归档。 它对模型规范进行高速缓存,并将唯一名称 (句柄) 与高速缓存的模型相关联。 然后,该模型可以由 APPLYMODEL 和 STRAPPLYMODEL 变换函数用于计算评分和其他结果 (请参阅 评分表达式)。 MODEL CLOSE 命令用于从内存中废弃高速缓存的模型。
通过对每个模型使用单独的 MODEL HANDLE 命令,可以将不同的模型应用于相同的数据。
选项
变量映射。 您可以将原始模型中的任何或所有变量映射到当前活动数据集中的不同变量。 缺省情况下,模型将应用于当前活动数据集中与原始模型中的变量同名的变量。
处理缺失值。 您可以选择如何处理具有缺失值的个案。 缺省情况下,会尝试将合理值替换为缺失值,但您可以选择将缺失值视为系统缺失值。
基本规范
基本规范为 NAME 和 FILE。 NAME 指定引用此模型时要使用的模型句柄名称。 FILE 指定包含模型规范的外部文件。
子命令顺序
- 可以按任何顺序指定子命令。
语法规则
- 使用
MAP子命令时,必须同时指定VARIABLES和MODELVARIABLES关键字。 - 允许多个
MAP子命令。 每个MAP子命令都应该为变量的不同子集提供映射。 给定变量的后续映射将覆盖同一变量的任何先前映射。
操作
- 模型句柄仅在当前工作会话期间使用。 句柄未与数据文件一起保存。
- 发出用于更改计算机代码页的
SET LOCALE命令需要关闭任何现有模型句柄 (使用MODEL CLOSE) 并重新打开模型 (使用MODEL HANDLE) ,然后再继续评分。
评分支持的模型
IBM® SPSS® Statistics 可以对 IBM SPSS Statistics, IBM SPSS Modeler和 IBM SPSS AnswerTree创建的模型进行评分。
下表列出了支持评分的每种模型类型的可用评分函数集。 表示为 PROBABILITY
(category) 的函数类型指 PROBABILITY 函数的特定类别(可选的第三个参数)的规范。
| 模型类型 | 支持的功能 |
|---|---|
树(分类目标) |
|
树(刻度目标) |
|
Boosted 树 (C5.0) |
|
线性回归 |
|
自动线性模型 |
|
二元 Logistic 回归 |
|
条件 Logistic 回归 |
|
多项 Logistic 回归 |
|
一般线性模型 |
|
判别 |
|
二阶聚类 |
|
K-平均值聚类 |
|
科荷伦 |
|
神经网络(分类目标) |
|
神经网络(刻度目标) |
|
朴素贝叶斯 |
|
异常检测 |
|
规则集 |
|
广义线性模型(分类目标) |
|
广义线性模型(刻度目标) |
|
广义线性混合模型(分类目标) |
|
广义线性混合模型(刻度目标) |
|
有序多项回归 |
|
Cox 回归 |
|
最近相邻元素(刻度目标) |
|
最近相邻元素(分类目标) |
|
- 对于二项 Logistic 回归、多项 Logistic 回归和 Naive Bayes 模型,
CONFIDENCE函数返回的值与PROBABILITY函数返回的值相同。 - 对于 K 均值模型,
CONFIDENCE函数返回的值是最短距离。 - 对于树和规则集模型,置信度可以解释为所预测类别的调整后的概率,并且始终小于
PROBABILITY给出的值。 对于这些模型,置信值比PROBABILITY给出的值更可靠。 - 对于神经网络模型,置信度提供了所预测类别的可能性是否远远大于位居次席的预测类别的可能性的度量。
- 对于有序多项回归和广义线性模型,当目标变量是二项时,支持
PROBABILITY函数。 - 对于没有目标变量的最近相邻元素模型,可用函数有
NEIGHBOR和DISTANCE。
有关从模型应用评分函数的信息,请参阅 评分表达式。