Temporale kausale Modelle
Temporale kausale Modellierung versucht, die wichtigsten kausalen Beziehungen in Zeitreihendaten aufzuspüren. Bei der temporalen kausalen Modellierung geben Sie eine Gruppe von Zielzeitreihen und eine Gruppe von potenziellen Eingaben für diese Ziele an. Daraufhin erstellt die Prozedur ein autoregressives Zeitreihenmodell für jedes der Ziele und schließt nur solche Eingaben ein, die eine kausale Beziehung zum Ziel haben. Dieser Ansatz unterscheidet sich von der konventionellen Zeitreihenmodellierung, bei der Sie die Prädiktoren für eine Zielzeitreihe explizit angeben müssen. Da bei der temporalen kausalen Modellierung üblicherweise Modelle für mehrere zusammengehörige Zeitreihen erstellt werden, wird das Ergebnis als Modellsystem bezeichnet.
Im Kontext der temporalen kausalen Modellierung wird mit dem Begriff kausal die Granger-Kausalität bezeichnet. Eine Zeitreihe X wird als "Granger-Ursache" einer anderen Zeitreihe Y bezeichnet, wenn die Regression für Y im Hinblick auf vergangene Wert von X und von Y zu einem besseren Modell für Y führt als allein die Regression auf vergangene Werte von Y.
Beispiele
Entscheidungsträger verwenden temporale kausale Modellierung, um kausale Beziehungen in einer großen Gruppe zeitbasierter Metriken zu entdecken, die das Geschäft beschreiben. Möglicherweise deckt die Analyse einige wenige steuerbare Eingaben auf, die den größten Einfluss auf wesentliche Leistungsindikatoren haben.
Manager großer IT-System können temporale kausale Modellierung verwenden, um Anomalien in einer großen Gruppe von Betriebsmesswerten, die in Wechselbeziehung zueinander stehen, zu erkennen. Das kausale Modell erlaubt dann, über die Anomalieerkennung hinaus die wahrscheinlichsten Fehlerursachen der Anomalien zu ermitteln.
Feldanforderungen
Es muss mindestens ein Ziel geben. Standardmäßig werden Felder mit der vordefinierten Rolle "Keine" nicht verwendet.
Datenstruktur
Die temporale kausale Modellierung unterstützt zwei Datenstrukturtypen.
- Spaltenbasierte Daten
- Bei spaltenbasierten Daten enthält jedes Zeitreihenfeld die Daten für eine einzelne Zeitreihe. Dies ist die traditionelle Struktur für Zeitreihendaten, wie sie von der Zeitreihenmodellierung verwendet wird.
- Mehrdimensionale Daten
- For multidimensional data, each time series field contains the data for multiple time series. Separate time series, within a particular field, are then identified by a set of values of categorical fields referred to as dimension fields. Beispielsweise könnten Umsatzdaten für zwei unterschiedliche Vertriebskanäle (Einzelhandel und Internet) in einem einzigen Feld namens Umsatz gespeichert werden. Ein Dimensionsfeld mit dem Namen Kanal und den Werten 'Einzelhandel' und 'Internet' gibt die Datensätze an, die jedem der beiden Vertriebskanäle zugeordnet sind.
m>(L + KL + 1) Dabei ist m die Anzahl der Datenpunkte, L ist die Anzahl der Lags und K ist die Anzahl der Prädiktoren. Stellen Sie sicher, dass Ihr Dataset groß genug ist, damit die Anzahl der Datenpunkte (m) die Bedingung erfüllt.