检查模型

  1. 双击时间序列模型块,然后选择“输出”选项卡可显示有关为每个市场生成的模型的数据。
    图 1. 为市场生成的时间序列模型
    为市场生成的时间序列模型

    在左侧“输出”列中,选择任意市场的模型信息预测变量数线可显示用作各个目标预测变量的字段数,本例中为 0。

    模型信息表中的剩余线可显示每个模型的不同拟合度测量值。平稳的 R 方值提供了由模型解释的序列中总方差所占比例的估计值。该值越高(最大值为 1.0),则模型拟合会越好。

    Q(#) 统计量df显著性线与 Ljung-Box 统计量相关,该检验是对模型中残差的随机检验;错误的随机性越大,模型可能就越好。Q(#) 是 Ljung-Box 统计量本身,而 df(自由度)表示估算特定目标时可以自由改变的模型参数的数目。

    显著性线给出了 Ljung-Box 统计量的显著性值,从而以另一种方式来表示指定的模型是否正确。显著性值小于 0.05 表示残差误差不是随机的,则意味着所观测的序列中存在模型无法解释的结构。

    如果将平稳的 R 方显著性值考虑在内,那么专家建模器为 Market_3Market_4 选择的模型完全可以接受。Market_1Market_2Market_5显著性值都小于 0.05,这表示可能还需要进行一些实验,以便为这些市场找到拟合度更好的模型。

    屏幕上将显示多个其他拟合度测量值。R 方值提供了可由模型解释的时间序列中总方差的估计值。由于此统计量的最大值为 1.0,因此在这一点上,我们的模型表现不错。

    RMSE 指均方根误差,它用于度量序列的实际值与模型预测值之间的差异,以序列自身所用单位表示。由于这是误差测量值,因此该值越小越好。乍一看, Market_2 Market_3 的模型的成功率低于其他三个市场,但根据目前所观察的统计量仍可以接受。

    其他的拟合度测量值包括均值绝对百分比误差(MAPE)及其最大值(MAXAPE)。绝对误差百分比用于度量目标序列与其模型预测水平的差异程度,以百分比值表示。通过检查所有模型中的均值和最大值,可以大概知道预测的不确定性程度。

    MAPE 值显示所有模型的平均不确定性都在 1% 左右,这是一个很低的值。MAXAPE 值显示最大绝对误差百分比,这对设想预测的最坏情况很有帮助。该值显示大多数模型的最大百分比误差大约在 1.8% 至 3.7% 之间,只有 Market_4 稍高,接近 7%,但仍然是一组很低的数字。

    MAE (平均绝对误差)值用于显示预测误差绝对值的均值。类似于 RMSE 值,此值以序列自身所用单位表示。MAXAE 显示以同一单位表示的最大预测误差,并指示预测的最坏情况。

    尽管关注的是这些绝对值,但由于目标序列表示的是不同规模市场的订户量,因此在此情况下百分比误差值(MAPE 和 MAXAPE)更有用。

    MAPE 和 MAXAPE 值可以使用模型表示可接受的不确定性吗?毫无疑问这些值很小。由于可接受风险因问题的不同而有所变化,因此商业意识可以在此派上用场。假设拟合度统计在可接受的范围之内,然后继续查看残差。

    相对于仅查看拟合度统计,检查模型残差的自相关函数 (ACF) 和偏自相关函数 (PACF) 的值可以通过更量化的方式深入了解模型。

    合理指定的时间模型将捕获所有非随机的变异,其中包括季节性、趋势、循环周期以及其他重要的因素。如果是这种情况,那么任何误差都不应随时间的推移与其自身相关联(自相关)。这两个自相关函数中的显著结构都可以表明基础模型不完整。

  2. 对于第四市场,在左侧列中单击相关图可显示模型中残差的自相关函数 (ACF) 值和偏自相关函数 (PACF) 值。
    图 2. 第四市场的 ACF 值和 PACF 值
    第四市场的 ACF 值和 PACF 值

    在这些图中,已将误差变量的原始值延迟多达 24 个时间段并与原始值进行比较,以确定随着时间推移是否存在任何相关性。要使模型可接受,上 (ACF) 图中的条形在正(上)方向或负(下)方向均不应扩展到阴影区之外。

    如果出现此情况,您需要检查下 (PACF) 散点图,以了解是否已确认此处的结构。PACF 散点图主要关注在控制插入时间点的序列值之后的相关性。

    Market_4 的值都位于阴影区之内,因此我们可以继续检查其他市场的值。

  3. 单击各个其他市场以及市场总计的相关图

    其他市场的值均有部分位于阴影区之外,这证实了我们先前通过显著性值所作的猜测。我们需要在某些时间点试验这些市场的其他一些模型,以了解是否可以得到更好的拟合,但对于该示例的剩余部分,我们将关注还能从 Market_4 模型中获取哪些内容。

  4. 在“图形”选用板中,将“时间散点图”节点附加到时间序列模型块。
  5. 在“图”选项卡上,取消选中在单独面板中显示序列复选框。
  6. 序列列表上,单击字段选择器按钮,选中 Market_4$TS-Market_4 字段,然后单击确定将其添加到列表中。
  7. 单击运行,以显示第一个地区市场的实际数据和预测数据的线图。
    图 3. 选择要绘制的字段
    选择要绘制的字段

    注意预测($TS-Market_4)线如何通过实际数据的末端向外延伸。 目前已得出对此市场未来三个月的预期需求的预测。

    整个时间序列上的实际数据线和预测数据线在图上非常接近,表明对此特定时间序列这是一个可靠的模型。

    图 4. Market_4 的实际数据和预测数据时间散点图
    Market_4 的实际数据和预测数据时间散点图

    将模型保存在文件中,以便在将来的示例中使用:

  8. 单击 确定 关闭当前图形。
  9. 打开时间序列模型块。
  10. 选择 文件 > 保存节点 并指定文件位置。
  11. 单击保存

    现在虽然有了此特定市场的可靠模型,但该预测的误差到底有多大呢?可通过检查置信度区间得到预测的误差大小。

  12. 双击流中最后一个时间散点图节点(标注为 Market_4 $TS-Market_4)可重新打开该节点的对话框。
  13. 单击字段选择器按钮,然后将 $TSLCI-Market_4$TSUCI-Market_4 字段添加到序列列表中。
  14. 单击运行
图 5. 添加更多要绘制的字段
添加更多要绘制的字段

现在有了与以前一样的图形,但添加了置信度区间上限 ( $TSUCI ) 和下限 ( $TSLCI )。

请注意置信度区间的边界如何随预测时限而分叉,这表示预测越指向更远的将来,不确定性就变得越来越大。

但是,随着每个时段的流逝,您就会多一个时段(在本例中为月)的实际使用率数据作为预测的依据。您可以将这些新数据读入流中,并再次应用您的模型,因为您知道它是可靠的。有关更多信息,请参阅重新应用时间序列模型主题。

图 6. 添加了置信区间的时间散点图
添加了置信区间的时间散点图

Next