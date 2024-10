Autokorrelation oder serielle Korrelation analysieren Zeitreihendaten, um nach Korrelationen von Werten an verschiedenen Punkten in einer Zeitreihe zu suchen. Diese wichtige Analysemethode misst, wie ein Wert mit sich selbst korreliert. Anstatt den Korrelationskoeffizienten zwischen verschiedenen Variablen zu berechnen, wie z. B. zwischen X1 und X2, berechnen wir den Grad der Korrelation einer Variable selbst in den einzelnen Zeitschritten des Datensatzes. Bei der Erstellung eines linearen Regressionsmodells ist eine der wichtigsten Annahmen, dass die Fehler bei der Vorhersage der unabhängigen Variablen in diesem Modell unabhängig sind. Bei der Arbeit mit Zeitreihendaten stoßen Sie häufig auf Fehler, die zeitabhängig sind. Das heißt, die Abhängigkeit in den Fehlern erscheint aufgrund einer zeitlichen Komponente. Über die Zeit korrelierte Fehlerterme werden als autokorrelierte Fehler bezeichnet. Diese Fehler verursachen Probleme bei einigen der gängigeren Methoden zur Erstellung einer linearen Regression, wie z. B. der gewöhnlichen Methode der kleinsten Quadrate. Der Weg, um diese Probleme zu lösen, besteht darin, die abhängige Variable auf sich selbst zu regressieren und dabei die durch einen Autokorrelationstest ermittelten Zeitverzögerungen zu verwenden. Die „Verzögerung“ ist einfach ein früherer Wert der abhängigen Variable.„ Wenn Sie über monatliche Daten verfügen und den kommenden Monat vorhersagen möchten, können Sie die Werte der beiden Vormonate als Eingabe verwenden. Dies bedeutet, dass Sie die beiden vorherigen Verzögerungen auf den aktuellen Wert zurückführen.

Genauso wie die Korrelation eine lineare Beziehung zwischen zwei Variablen misst, misst die Autokorrelation die Beziehung zwischen verzögerten Werten einer Zeitreihe durch ein lineares Modell. Wenn Daten einen Trend aufweisen, sind die Autokorrelationen für kleine Verzögerungen in der Regel groß und positiv, da zeitlich nahe liegende Beobachtungen auch im Wert nah beieinander liegen. Die Autokorrelationsfunktion, oft auch ACF (Auto Correlation Function) genannt, einer Trendzeitreihe neigt also dazu, positive Werte zu haben, die mit zunehmender Verzögerung langsam abnehmen.

Wenn Daten saisonale Schwankungen oder Muster aufweisen, sind die Autokorrelationen für die saisonalen Verzögerungen (bei einem Vielfachen des saisonalen Zeitraums) größer als für andere Verzögerungen. Wenn die Daten sowohl trend- als auch saisonabhängig sind, sehen Sie eine Kombination dieser Effekte. Zeitreihen, die keine Autokorrelation aufweisen, sind echte Zufallsprozesse und werden als weißes Rauschen bezeichnet. Der ACF ist ein Korrelationskoeffizient zwischen zwei Werten in einer Zeitreihe.

Es gibt einige wichtige Methoden, um eine Autokorrelation zu testen:

Sie können die Residuen berechnen und diese Standardfehler zum Zeitpunkt t, gewöhnlich geschrieben als et, gegen t darstellen. Cluster von Residuen, die auf einer Seite der Nulllinie liegen, können darauf hinweisen, dass Autokorrelationen existieren und signifikant sind.

Mit Hilfe eines Durbin-Watson-Tests können Sie feststellen, ob eine Zeitreihe eine Autokorrelation enthält. Um dies in R zu tun, erstellen Sie eine lineare Regression, die die abhängige Variable auf die Zeit regressiert, und übergeben dieses Modell dann zur Berechnung der Durbin-Watson-Statistik. Um dies in Python zu tun, können Sie die Residuen aus einem angepassten linearen Regressionsmodell an den Test übergeben.

Eine andere Möglichkeit besteht darin, einen Ljung-Box-Test zu verwenden und die Werte der Zeitreihe direkt an den Test zu übergeben. Der Ljung-Box-Test hat die Nullhypothese, dass die Residuen unabhängig verteilt sind, und die Alternativhypothese, dass die Residuen nicht unabhängig verteilt sind und eine Autokorrelation aufweisen. In der Praxis bedeutet dies, dass Ergebnisse, die kleiner als 0,05 sind, darauf hinweisen, dass in den Zeitreihen eine Autokorrelation besteht. Sowohl die Python- als auch die R-Bibliotheken bieten Methoden, um diesen Test durchzuführen.

Die gebräuchlichste Option ist die Verwendung einer Korrelationsdiagramm-Visualisierung, die aus den Korrelationen zwischen bestimmten Verzögerungen in der Zeitreihe erstellt wird. Ein Muster in den Ergebnissen ist ein Hinweis auf Autokorrelation. Dies wird grafisch dargestellt, indem gezeigt wird, wie stark die verschiedenen Verzögerungen in der Zeitreihe miteinander korrelieren. Nachfolgend sehen Sie ein Beispieldiagramm: