概述 (MODEL HANDLE 命令)

MODEL HANDLE 读取包含预测模型规范的外部 XML 文件或 ZIP 归档。 它对模型规范进行高速缓存,并将唯一名称 (句柄) 与高速缓存的模型相关联。 然后,该模型可以由 APPLYMODELSTRAPPLYMODEL 变换函数用于计算评分和其他结果 (请参阅 评分表达式)MODEL CLOSE 命令用于从内存中废弃高速缓存的模型。

通过对每个模型使用单独的 MODEL HANDLE 命令,可以将不同的模型应用于相同的数据。

选项

变量映射。 您可以将原始模型中的任何或所有变量映射到当前活动数据集中的不同变量。 缺省情况下,模型将应用于当前活动数据集中与原始模型中的变量同名的变量。

处理缺失值。 您可以选择如何处理具有缺失值的个案。 缺省情况下,会尝试将合理值替换为缺失值,但您可以选择将缺失值视为系统缺失值。

基本规范

基本规范为 NAMEFILENAME 指定引用此模型时要使用的模型句柄名称。 FILE 指定包含模型规范的外部文件。

子命令顺序

  • 可以按任何顺序指定子命令。

语法规则

  • 使用 MAP 子命令时,必须同时指定 VARIABLESMODELVARIABLES 关键字。
  • 允许多个 MAP 子命令。 每个 MAP 子命令都应该为变量的不同子集提供映射。 给定变量的后续映射将覆盖同一变量的任何先前映射。

操作

  • 模型句柄仅在当前工作会话期间使用。 句柄未与数据文件一起保存。
  • 发出用于更改计算机代码页的 SET LOCALE 命令需要关闭任何现有模型句柄 (使用 MODEL CLOSE) 并重新打开模型 (使用 MODEL HANDLE) ,然后再继续评分。

评分支持的模型

IBM® SPSS® Statistics 可以对 IBM SPSS StatisticsIBM SPSS ModelerIBM SPSS AnswerTree创建的模型进行评分。

下表列出了支持评分的每种模型类型的可用评分函数集。 表示为 PROBABILITY (category) 的函数类型指 PROBABILITY 函数的特定类别(可选的第三个参数)的规范。

表 1. 模型类型支持的函数
模型类型 支持的功能

树(分类目标)

PREDICT, PROBABILITY, PROBABILITY (category), CONFIDENCE, NODEID

树(刻度目标)

PREDICT, NODEID, STDDEV

Boosted 树 (C5.0)

PREDICT, CONFIDENCE

线性回归

PREDICT, STDDEV

自动线性模型

PREDICT

二元 Logistic 回归

PREDICT, PROBABILITY, PROBABILITY (category), CONFIDENCE

条件 Logistic 回归

PREDICT

多项 Logistic 回归

PREDICT, PROBABILITY, PROBABILITY (category), CONFIDENCE

一般线性模型

PREDICT, STDDEV

判别

PREDICT, PROBABILITY, PROBABILITY (category)

二阶聚类

PREDICT

K-平均值聚类

PREDICT

科荷伦

PREDICT

神经网络(分类目标)

PREDICT, PROBABILITY, PROBABILITY (category), CONFIDENCE

神经网络(刻度目标)

PREDICT

朴素贝叶斯

PREDICT, PROBABILITY, PROBABILITY (category), CONFIDENCE

异常检测

PREDICT

规则集

PREDICT, CONFIDENCE

广义线性模型(分类目标)

PREDICT, PROBABILITY, PROBABILITY (category), CONFIDENCE

广义线性模型(刻度目标)

PREDICT, STDDEV

广义线性混合模型(分类目标)

PREDICT, PROBABILITY, PROBABILITY (category), CONFIDENCE

广义线性混合模型(刻度目标)

PREDICT

有序多项回归

PREDICT, PROBABILITY, PROBABILITY (category), CONFIDENCE

Cox 回归

PREDICT, CUMHAZARD

最近相邻元素(刻度目标)

PREDICT, NEIGHBOR, NEIGHBOR(K), DISTANCE, DISTANCE(K)

最近相邻元素(分类目标)

PREDICT, PROBABILITY, PROBABILITY (category), CONFIDENCE,NEIGHBOR, NEIGHBOR(K),DISTANCE, DISTANCE(K)

  • 对于二项 Logistic 回归、多项 Logistic 回归和 Naive Bayes 模型,CONFIDENCE 函数返回的值与 PROBABILITY 函数返回的值相同。
  • 对于 K 均值模型,CONFIDENCE 函数返回的值是最短距离。
  • 对于树和规则集模型,置信度可以解释为所预测类别的调整后的概率,并且始终小于 PROBABILITY 给出的值。 对于这些模型,置信值比 PROBABILITY 给出的值更可靠。
  • 对于神经网络模型,置信度提供了所预测类别的可能性是否远远大于位居次席的预测类别的可能性的度量。
  • 对于有序多项回归和广义线性模型,当目标变量是二项时,支持 PROBABILITY 函数。
  • 对于没有目标变量的最近相邻元素模型,可用函数有 NEIGHBORDISTANCE

有关从模型应用评分函数的信息,请参阅 评分表达式