Modele przyczynowe szeregów czasowych

Modelowanie przyczynowe szeregów czasowych jest próbą wykrycia kluczowych zależności przyczynowych w danych o szeregach czasowych. W procesie modelowania przyczynowego szeregów czasowych użytkownik określa zbiór szeregów przewidywanych i zbiór potencjalnych zmiennych wejściowych dla tych szeregów przewidywanych. Następnie procedura buduje autoregresyjny model każdego szeregu przewidywanego i uwzględnia tylko te zmienne wejściowe, które z przewidywanym szeregiem łączą relacje przyczynowe. Ta strategia różni się od tradycyjnego modelowania szeregów czasowych, w którym użytkownik musi jawnie określić predyktory dla przewidywanego szeregu. Ponieważ w modelowaniu przyczynowym szeregów czasowych zazwyczaj buduje się modele dla wielu powiązanych szeregów czasowych, wynik tego modelowania nazywamy systemem modelu.

W kontekście modelowania przyczynowego szeregów czasowych termin przyczynowe odnosi się do przyczynowości w sensie Grangera. Szereg czasowy X jest uznawany za „przyczynę w sensie Grangera” innego szeregu czasowego Y, jeśli regresja dla Y przy przeszłych wartościach szeregów X i Y zwraca lepszy model dla Y niż regresja tylko przy przeszłych wartościach dla Y.

Uwaga: Węzeł modelowania przyczynowego szeregów czasowych nie obsługuje etapów Ocena modelu ani Champion Challenger programu IBM® SPSS Collaboration and Deployment Services.

Przykłady

Osoby podejmujące decyzje biznesowe mogą korzystać z modelowania przyczynowego szeregów czasowych do odkrywania relacji przyczynowych w dużych zestawach metryk w oparciu o czas opisujących procesy biznesowe. Efektem analizy może być zidentyfikowanie możliwych do zmiany danych wejściowych mających największy wpływ na kluczowe wskaźniki wydajności.

Menedżerowie dużych systemów IT mogą korzystać z modelowania przyczynowego szeregów czasowych do wykrywania anomalii w dużych zbiorach powiązanych ze sobą metryk operacyjnych. Model przyczynowy umożliwia wówczas więcej niż tylko wykrywanie anomalii i odkrywanie najbardziej prawdopodobnych ich przyczyn.

Wymagania dotyczące zmiennych

Wymagana jest co najmniej jedna zmienna przewidywana. Domyślnie zmienne o predefiniowanej roli Brak nie są używane.

Struktura danych

Modelowanie przyczynowe szeregów czasowych obsługuje dwa rodzaje struktur danych.

Dane kolumnowe
W przypadku danych kolumnowych każda zmienna szeregu czasowego zawiera dane dla jednego szeregu czasowego. Struktura ta jest tradycyjną strukturą danych szeregów czasowych, stosowaną przez kreator modeli szeregów czasowych.
Dane wielowymiarowe
W przypadku danych wielowymiarowych każda zmienna szeregu czasowego zawiera dane dla wielu szeregów czasowych. Oddzielne szeregi czasowe w ramach danej zmiennej są wówczas identyfikowane na podstawie zestawu wartości zmiennych jakościowych, zwanych także zmiennymi wymiarów. Na przykład dane sprzedaży dla dwu różnych kanałów sprzedaży (detalicznego i internetowego) mogą być przechowywane w jednej zmiennej sales. Zmienna wymiarowa o nazwie channel i wartościach 'retail' oraz 'web' określa rekordy powiązane z każdym z tych dwu kanałów sprzedaży.
Uwaga: Do utworzenia modelu przyczynowego szeregów czasowych potrzebna jest odpowiednio duża liczba punktów. W programie obowiązuje ograniczenie:
m>(L + KL + 1)
gdzie m jest liczbą punktów danych, L jest liczbą opóźnień, a K jest liczbą predyktorów. Dane muszą być na tyle obszerne, by liczba punktów danych (m) spełniała ten warunek.