檢查模型

  1. 按兩下「時間數列」模型塊,然後選取「輸出」標籤來顯示針對每一個市場產生之模型的相關資料。
    圖 1. 針對市場產生的時間數列模型
    為市場產生的時間序列模型

    在左側的「輸出」直欄中,選取任何市場的模型資訊預測值數行會顯示使用了多少個欄位作為每一個目標的預測值;在此情況下為無。

    模型資訊表格中的剩餘行會顯示每一個模型的各種適合度測量。恆定 R 平方值會對數列中由模型解釋的變異總數的比例進行估計。該值越大(上限為 1.0),模型適合度越好。

    Q(#) 統計資料df顯著性行與測試模型中殘差誤隨機性的 Ljung-Box 統計資料有關;誤差隨機性越大,模型可能越好。Q(#) 是 Ljung-Box 統計資料本身,而 df(自由度)指出估計特定目標時自由變化的模型參數數目。

    顯著性行提供 Ljung-Box 統計資料的顯著性值,另外可指示模型是否正確指定。顯著性值少於 0.05 表示殘差誤不是隨機的,暗示在觀察數列中有模型未說明的結構。

    考量到恆定 R 平方顯著性值,Expert Modeler 為 Market_3Market_4 選擇的模型完全可接受。Market_1Market_2Market_5顯著性值全都小於 0.05,指出可能必須對這些市場用更適合的模型進行實驗。

    顯示畫面會顯示許多其他的適合度測量。R 平方值會對時間數列中可由模型解釋的變異總數進行估計。因為此統計資料的值上限為 1.0,我們的模型在這方面非常好。

    RMSE 是均方根誤差,數列實際值與模型預測值差異程度的量數,以數列本身使用的相同單位表示。因為這是誤差測量,我們希望這個值越低越好。初看起來似乎 Market_2Market_3 的模型沒有其他三個市場的模型那麼成功,但根據我們到目前為止所看到的統計資料仍可接受。

    其他的這些適合度測量包括平均絕對百分比誤差 (MAPE) 及其上限值 (MAXAPE)。絕對百分比誤差是目標數列與其模型預測層級差異程度的量數,用百分比值表示。透過檢查所有模型中的平均值及上限,您可以在預測中取得不確定性的指示。

    MAPE 值表明所有模型的平均不確定性約為 1% ,這個值是非常低的。MAXAPE 值顯示絕對百分比誤差上限,並對於想像您預測的最糟情況非常有用。它顯示大部分模型的最大百分比誤差約在 1.8 至 3.7% 這個範圍,仍然是一組很低的數字,只有 Market_4 很高,接近 7%。

    MAE(平均絕對誤差)值顯示預測誤差的絕對平均值。像 RMSE 值一樣,此值使用數列本身所用的相同單位表示。MAXAE 以相同的單位顯示最大的預測誤差,並指出預測的最糟情況。

    雖然這些絕對值非常有趣,但百分比誤差值(MAPE 與 MAXAPE)在此情況下更為有用,因為目標數列代表大小不同的市場的訂閱者數。

    MAPE 及 MAXAPE 值是否代表可接受的模型不確定性?它們肯定非常低。在這種狀況下商業意識開始起作用,因為可接受的風險會隨著問題而變。我們假設適合度統計資料處於可接受的範圍,並繼續查看殘差誤。

    透過檢查模型殘差的自相關係數函數 (ACF) 和局部自相關係數函數 (PACF) 值,可更加定量地瞭解模型,而不是簡單地檢視適合度統計資料。

    明確指定的時間數列模型會擷取所有非隨機變異,包括週期性、趨勢、循環和其他重要因素。如果是這種情況,則任何誤差隨著時間的推移都不應該與其本身產生關聯(自動產生關聯)。在任一自相關係數函數中的顯著性結構都暗示基礎模型不完整。

  2. 針對左側直欄中的第四個市場,按一下相關圖以顯示模型中殘差誤的自相關係數函數 (ACF) 和局部自相關係數函數 (PACF) 值。
    圖 2. 第四個市場的 ACF 及 PACF 值
    第四個市場的 ACF 和 PACF 值

    在這些繪圖中,誤差變數的原始值已遞延最多 24 個時段,並與原始值相互比較來查看是否隨著時間推移存在任何相關性。針對要接受的模型,無論是正向(向上)還是逆向(向下),上部繪圖 (ACF) 中的任何長條都不應延伸到陰影區域外部。

    如果發生這種情況,您需要檢查下部繪圖 (PACF) 來查看在那裡結構是否已確認。PACF 繪圖會在介入時間點控制數列值之後查看相關性。

    Market_4 的值都在陰影區域內,因此我們可以繼續檢查其他市場的值。

  3. 按一下相關圖以取得其他每一個市場及總計。

    其他市場的值都在陰影區域外部顯示部分值,確認了之前我們根據其顯著性值做出的懷疑。我們需要在某個點對那些市場的一些不同模型進行實驗,以查看我們是否可以更適合,但是針對此範例的剩餘部分,我們會集中於可以從 Market_4 模型中學到別的什麼。

  4. 從「圖形」選用區中,將「時間繪圖」節點連接至「時間數列」模型塊。
  5. 在「繪圖」標籤上,清除在個別畫面中顯示數列勾選框。
  6. 數列清單上按一下欄位選取器按鈕,選取 Market_4$TS-Market_4 欄位,然後按一下確定以將其新增至清單。
  7. 按一下執行以顯示第一個當地市場的實際和預測資料線條圖。
    圖 3. 選取要繪製的欄位
    選取要繪圖的欄位

    注意預測 ($TS-Market_4) 線條如何超過實際資料的末尾。 您現在有了這個市場今後三個月的預期需求預測。

    在整個時間數列中實際和預測資料的線條在圖形上挨在一起,指出這是此特定時間數列的可靠模型。

    圖 4. Market_4 的實際和預測資料時間繪圖
    Market_4 的實際與預測資料的時間圖

    在檔案中儲存模型以供在未來範例中使用:

  8. 按一下確定以關閉現行圖形。
  9. 開啟「時間數列」模型塊。
  10. 選擇檔案 > 儲存節點,並指定檔案位置。
  11. 按一下「儲存」。

    您有了這個特定市場的可靠模型,但該預測的誤差限度是多少呢?您可以透過檢查信賴區間取得此值的指示。

  12. 按兩下串流中的最後一個「時間繪圖」節點(標為 Market_4 $TS-Market_4 的節點)以再次開啟其對話框。
  13. 按一下欄位選取器按鈕,並將 $TSLCI-Market_4$TSUCI-Market_4 欄位新增至數列清單。
  14. 按一下「執行」。
圖 5. 將更多欄位新增至繪圖
將更多欄位新增至圖形

現在您的圖形與之前相同,但新增了信賴區間的上限 ($TSUCI) 和下限 ($TSLCI)。

注意信賴區間的界限如何在預測期間演變,指出進一步預測未來時的不確定性增加。

但隨著每個時段過去,您會擁有另一個(在此情況下)月的實際使用資料,您可據此進行預測。 您可以將新資料讀入串流,並立即重新套用您認為可靠的模型。如需相關資訊,請參閱重新套用時間序列模型主題。

圖 6. 新增了信賴區間的時間繪圖
新增了信賴區間的時間圖

下 一個(N)