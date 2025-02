L'autocorrelazione, o correlazione seriale, analizza i dati delle serie temporali per cercare correlazioni nei valori in punti diversi di una serie temporale. Questo metodo di analisi chiave misura il modo in cui un valore è correlato a se stesso. Invece di calcolare il coefficiente di correlazione tra diverse variabili, come X1 e X2, calcoliamo il grado di correlazione di una variabile stessa a fasi temporali in tutto il set di dati. Quando si costruisce un modello di regressione lineare, uno dei presupposti principali è che gli errori nella previsione della variabile indipendente in quel modello siano indipendenti. Spesso, quando si lavora con dati di serie temporali, si riscontrano errori dipendenti dal tempo. Cioè la dipendenza negli errori appare a causa di una componente temporale. I termini di errore correlati nel tempo sono chiamati errori autocorrelati. Questi errori causano problemi con alcuni dei modi più comuni di creare una regressione lineare, ad esempio i minimi quadrati ordinari. Il modo per risolvere questi problemi è quello di far regredire la variabile dipendente su se stessa utilizzando i ritardi temporali identificati da un test di autocorrelazione. Il "ritardo" è semplicemente un valore precedente della variabile dipendente. Se si dispone di dati mensili e si desidera prevedere il mese successivo, è possibile utilizzare i valori dei due mesi precedenti come input. Ciò significa che si stanno regredendo i due ritardi precedenti rispetto al valore corrente.

Allo stesso modo in cui la correlazione misura una relazione lineare tra due variabili, l'autocorrelazione misura la relazione tra i valori ritardati di una serie temporale attraverso un modello lineare. Quando i dati hanno una tendenza, le autocorrelazioni per piccoli ritardi tendono ad essere ampie e positive perché anche le osservazioni vicine nel tempo hanno un valore prossimo. Quindi la funzione di autocorrelazione, spesso chiamata ACF, di una serie temporale con tendenza tende ad avere valori positivi che diminuiscono lentamente all'aumentare dei ritardi.

Quando i dati presentano fluttuazioni o modelli stagionali, le autocorrelazioni saranno maggiori per i ritardi stagionali (a multipli del periodo stagionale) rispetto agli altri ritardi. Quando i dati sono sia di tendenza che stagionali, si verifica una combinazione di questi effetti. Le serie temporali che non mostrano alcuna autocorrelazione sono processi veramente casuali e si chiamano rumore bianco. L'ACF è un coefficiente di correlazione tra due valori in una serie temporale.

Esistono alcuni modi chiave per testare l'autocorrelazione:

È possibile calcolare i residui e tracciare quegli errori standard al tempo t, di solito scritti come et, rispetto a t. Eventuali cluster di residui che si trovano su un lato della linea dello zero possono indicare dove le autocorrelazioni sono presenti e significative.

L'esecuzione di un test di Durbin-Watson può aiutare a identificare se una serie temporale contiene autocorrelazione. Per fare ciò in R, bisogna creare una regressione lineare che regredisce la variabile dipendente nel tempo e poi passare quel modello per calcolare la statistica di Durbin-Watson. Per fare questo in Python, è possibile passare i residui da un modello di regressione lineare al test.

Un'altra opzione consiste nell'utilizzare un test di Ljung-Box e passare i valori delle serie temporali direttamente al test. Il test di Ljung-Box prevede l'ipotesi nulla che i residui siano distribuiti indipendentemente e l'ipotesi alternativa che i residui non siano distribuiti indipendentemente e mostrino autocorrelazione. Ciò significa in pratica che i risultati inferiori a 0,05 indicano che l'autocorrelazione esiste nella serie temporale. Entrambe le librerie Python e R forniscono metodi per eseguire questo test.

L'opzione più comune consiste nell'utilizzare una visualizzazione del correlogramma generata dalle correlazioni tra ritardi specifici nella serie temporale. Un modello nei risultati è un'indicazione dell'autocorrelazione. Questo viene tracciato mostrando la correlazione di diversi ritardi durante la serie temporale. Di seguito è riportato un grafico di esempio: