La modellazione autoregressiva e la modellazione a media mobile sono due approcci differenti per la previsione di dati delle serie temporali. ARIMA integra questi due approcci, da cui il nome. La previsione è una branca dell'apprendimento automatico che utilizza il comportamento passato di una serie temporale per prevedere uno o più valori futuri di tale serie temporale. Immagina di acquistare del gelato per rifornire un piccolo negozio. Se sai che le vendite di gelato aumentano in modo costante con la bella stagione, probabilmente devi considerare di aumentare l'ordine per le prossime settimane rispetto all'ordine effettuato questa settimana. Di quanto dovrebbe essere più grande l'ordine dipende dall'entità dell'aumento delle vendite di gelato di questa settimana rispetto alle vendite della settimana appena passata. Non possiamo prevedere il futuro senza un passato con cui confrontarlo, quindi i dati delle serie temporali passate sono molto importanti per i modelli ARIMA e per tutti i metodi di previsione e analisi delle serie temporali.

ARIMA è uno degli approcci più utilizzati nella previsione delle serie temporali e può essere utilizzato in due modi diversi a seconda del tipo di dati delle serie temporali con cui stai lavorando. Nel primo caso, abbiamo creato un modello ARIMA non stagionale che non richiede di tenere conto della stagionalità nei dati delle tue serie temporali. Prevediamo il futuro basandoci semplicemente su modelli presenti nei dati passati. Nel secondo caso, teniamo conto della stagionalità, ovvero dei cicli regolari che influenzano le serie temporali. Questi cicli possono essere giornalieri, settimanali o mensili e aiutano a definire modelli nei dati passati delle serie temporali che possono essere utilizzati per prevedere i valori futuri. Come gran parte della data science, il fondamento della previsione consiste nell'avere a disposizione dati di serie temporali validi con cui addestrare i modelli. Una serie temporale è una sequenza ordinata di misurazioni di una variabile a intervalli di tempo equamente distanziati. È importante ricordare che non tutti i set di dati che contengono un elemento temporale sono effettivamente dati di serie temporali a causa di questo requisito di intervalli di tempo equidistanti.