时间序列模型块

时间序列建模操作创建了具有前缀 $TS- 的多个新字段,如下表所示。

表 1. 时间序列建模操作创建的新字段
字段名称 描述
$TS-colname 每个目标序列模型预测的值。
$TSLCI-colname 每个已预测序列的置信区间下限值。*
$TSUCI-colname 每个已预测序列的置信区间上限值。*
$TSNR-colname 每列生成的模型数据中的噪声残差值。*
$TS-Total 此行的 $TS-colname 值的总计。
$TSLCI-Total 此行的 $TSLCI-colname 值的总计。*
$TSUCI-Total 此行的 $TSUCI-colname 值的总计。*
$TSNR-Total 此行的 $TSNR-colname 值的总计。*

* 这些字段的可见性(例如,在添加表格节点的输出中)取决于时间序列模型块的“设置”选项卡上的选项。有关更多信息,请参阅时间序列模型设置主题。

对于输入到时间序列构建节点中的每个序列,时间序列模型块将显示为这些序列选择的不同模型的详细信息。可以输入多个序列(例如有关产品线、地区或仓库的数据),且对于每个目标序列可生成一个独立的模型。例如,如果认为东部地区的收入可拟合 ARIMA 模型,但西部地区的收入仅能拟合简单移动平均值模型,那么会使用适合的模型对每个地区进行评分。

对于每个构建的模型,缺省的输出有:模型类型、指定的预测变量数及拟合度测量(缺省为平稳的 R 平方)。如果已指定离群值方法,那么会有一列用于显示检测到的离群值数。缺省输出还包括 Ljung-Box Q 列、自由度列和显著相关值列。

还可以选择高级输出,其中将显示以下附加列:

  • R 平方
  • RMSE(均方根误差)
  • MAPE(平均绝对百分误差)
  • MAE(平均绝对误差)
  • MaxAPE(最大绝对百分比误差)
  • MaxAE(最大绝对误差)
  • 标准化BIC(标准化贝叶斯信息准则)

生成。可以回到流或选用板的模型块生成“时间序列”建模节点。

  • 生成“建模”节点。使用用于创建此模型集的设置将“时间序列”建模节点放置到流中。举例而言,此操作的意义在于,如果要使用这些模型设置,却找不到用于生成这些设置的建模节点时,可以在流中获得这些设置。
  • 模型至选用板。将包含所有目标的模型块放入模型管理器。

Model

图 1. “全选”按钮和“取消全选”按钮
“全选”按钮和“取消全选”按钮

复选框。选择要在评分时使用的模型。缺省情况下会选中所有复选框。选中所有取消选中所有按钮会以一个简单的操作作用于所有的复选框。

排序依据。使您能够按指定显示列的升序或降序对各个输出行进行排序。“选定”选项可根据由复选框选定的一行或多行对输出进行排序。举例而言,此操作的意义在于,使名称为从“Market_1”到“Market_9”之间的目标字段显示在“Market_10”之前,因为在缺省排序顺序下,“Market_10”将直接显示在“Market_1”之后。

查看。缺省视图(简单)将显示基本的输出列集合。高级选项将显示拟合度测量的附加列。

估算中使用的记录数。原始源数据文件中的行数。

目标。“类型”节点中标识为目标字段(角色为目标的字段)的字段。

模型。用于此目标字段的模型的类型。

预测变量。用于此目标字段的预测变量(角色为输入的字段)数。

离群值。只有在已请求(在“专家建模器”或 ARIMA 标准中)自动检测离群值时,才会显示此列。显示的值为检测到的离群值数。

固定 R 方 (Stationary R-squared). 用于比较模型的平稳部分与简单均数模型的度量值。当存在趋势或季节模式时该度量值对普通 R 平方更具优势。平稳的 R 平方可为范围是负无穷大到 1 的负值。负值表示所检验的模型比基准模型差。正值表示所检验的模型比基准模型好。

R 方 (R-Squared). 线性模型的拟合优度测量,有时称为决定系数。它是因变量中由回归模型解释的变异的比例。它的取值范围介于 0 到 1 之间。最小值表示模型不能很好地拟合数据。

RMSE. 均方根误差。均方误差的平方根。用于测量因变量序列与其模型预测水平的差异程度,用与因变量序列相同的单位数表示。

MAPE. 平均绝对误差百分比。测量相关序列距其模型预测等级的变化程度的测量。它使用独立单元,因此可以用于比较具有不同单元的序列。

MAE. 平均绝对误差。测量序列与其模型预期水平的变化程度。MAE 在原始序列单元中报告。

MaxAPE. 最大绝对百分比误差。最大预测误差,以百分比形式表示。此测量对设想预测的最坏情形很有帮助。

MaxAE. 最大绝对误差。最大预测误差作为独立序列以相同单位表示。与 MaxAPE 相似,它对设想预测的最坏情形很有帮助。最大绝对误差和最大绝对百分比误差可以出现在不同的序列点。例如,当某一较大序列值的绝对误差略大于某一较小序列值的绝对误差时。在这种情况下,最大绝对误差将出现在较大序列值处,最大绝对百分比误差将出现在较小序列值处。

标准化 BIC (Normalized BIC). 标准化贝叶斯信息准则。尝试说明模型复杂性的模型总体拟合度的一般性测量。它是一种基于均方误差的评分,包含模型中参数数量的罚分和序列的长度。罚分会去除具有更多参数的模型的优势,使得统计量易于通过不同模型针对相同序列进行比较。

Q。Ljung-Box Q 统计量。该模型中残差错误的随机测试。

df。自由度。估计特定目标时自由变化的模型参数量。

Sig。Ljung-Box 统计量的显著性值。显著性值小于 0.05 表示残差错误不是随机的。

汇总统计。此部分包含不同列的各种汇总统计量,包括均值、最小值、最大值和百分位值。