Che cos'è un modello di serie temporali?

Autori

Ivan Belcic

Staff writer

Cole Stryker

Staff Editor, AI Models

IBM Think

Cos'è un modello di serie temporale?

Un modello di serie temporali è un modello di machine learning in grado di analizzare i dati delle serie temporali sequenziali e prevedere i valori futuri. I set di dati delle serie temporali sono costituiti da valori di dati ordinati nel tempo, dove il tempo è una variabile indipendente. L'analisi delle serie temporali consente di prevedere i valori dei dati futuri in base ai valori precedenti nella sequenza. 

Cos'è la modellazione delle serie temporali?

La modellazione di serie temporali è l'uso di algoritmi di machine learning e metodi statistici per analizzare i punti dati che cambiano in un periodo di tempo. 

I set di dati delle serie temporali differiscono dagli altri set di dati in quanto non sono costituiti da punti dati indipendenti e non correlati. Mentre molti set di dati si basano su osservazioni individuali, i set di dati delle serie temporali sono etichettati con timestamp e tengono traccia delle variabili nel tempo, creando dipendenze tra i punti dati. Le dipendenze sono relazioni tra punti dati in cui il valore di uno influenza il valore di un altro. 

Con la modellazione di serie temporali univariate, il tempo è l'unica variabile indipendente. Tutte le altre variabili dipendono dai valori precedenti. La modellazione multivariata delle serie temporali introduce altre variabili indipendenti, come le condizioni meteorologiche o le informazioni demografiche.

Le ultime notizie nel campo della tecnologia, supportate dalle analisi degli esperti

Resta al passo con le tendenze più importanti e interessanti del settore relative ad AI, automazione, dati e oltre con la newsletter Think. Leggi l' Informativa sulla privacy IBM.

Grazie per aver effettuato l'iscrizione!

L'abbonamento sarà fornito in lingua inglese. Troverai un link per annullare l'iscrizione in tutte le newsletter. Puoi gestire i tuoi abbonamenti o annullarli qui. Per ulteriori informazioni, consulta l'Informativa sulla privacy IBM.

Concetti chiave per la modellazione delle serie temporali

Molti dei concetti fondamentali della modellazione delle serie temporali sono caratteristiche temporali, ovvero aspetti dei dati correlati o derivati dal tempo. Questi concetti includono: 

  • Autocorrelazione

  • Stagionalità

  • Stazionarietà

Autocorrelazione

L'autocorrelazione misura il grado in cui i valori correnti corrispondono ai valori passati dei dati storici in una serie temporale. Un'elevata autocorrelazione significa che l'iterazione corrente di una serie temporale è strettamente correlata alle versioni ritardate. L'autocorrelazione identifica se una serie temporale si ripete e può indicare stagionalità. 

L'autocorrelazione può essere positiva o negativa. L'autocorrelazione positiva significa che valori alti portano a valori più alti e valori bassi a valori più bassi. L'autocorrelazione negativa è l'opposto, ovvero valori alti seguono valori bassi e viceversa.

Stagionalità

La stagionalità è una caratteristica dei dati delle serie temporali in cui esiste un modello ricorrente basato su un intervallo di tempo regolare, ad esempio il cambio delle stagioni. Ad esempio, una piattaforma di e-commerce potrebbe vendere più occhiali da sole in primavera e in estate e più sciarpe in autunno e in inverno. Le famiglie in genere consumano più elettricità durante il giorno che di notte. 

Le variazioni stagionali dipendenti dal tempo sono utili per prevedere valori futuri con modelli di forecasting. Gli strumenti di visualizzazione dei dati come diagrammi e grafici descrivono la stagionalità come una fluttuazione ripetuta, spesso sotto forma di onda sinusoidale. 

Durante l'analisi dei dati delle serie temporali, il processo di scomposizione rivela l'eventuale stagionalità presente nei dati, nonché le tendenze e il rumore. Le tendenze sono aumenti o diminuzioni a lungo termine dei valori dei dati, mentre il rumore si riferisce a variazioni casuali che non seguono modelli prevedibili. Il rumore spesso deriva da errori e outlier.

Stazionarietà

Una serie temporale stazionaria ha proprietà statistiche statiche, come la media e la varianza. Con la stazionarietà, i punti dati possono variare con la stagionalità, ma non c'è tendenza maggiore. Una serie temporale delle temperature globali medie annue moderne non sarebbe stazionaria a causa degli effetti dei cambiamenti climatici che fanno aumentare le temperature. 

La stazionarietà è necessaria per il funzionamento efficace della maggior parte dei modelli di serie temporali. Il test di Dickey-Fuller rivela se un set di dati è stazionario. I set di dati di serie temporali senza stazionarietà possono essere trasformati con tecniche come la differenziazione per rimuovere le tendenze e isolare altri modelli, come la stagionalità e l'autocorrelazione.

Mixture of Experts | 12 dicembre, episodio 85

Decoding AI: Weekly News Roundup

Unisciti al nostro gruppo di livello mondiale di ingegneri, ricercatori, leader di prodotto e molti altri mentre si fanno strada nell'enorme quantità di informazioni sull'AI per darti le ultime notizie e gli ultimi insight sull'argomento.

Modelli di serie storiche

Quando affrontano una sfida di previsione di serie temporali, i data scientist possono scegliere tra vari algoritmi di machine learning. A seconda della natura del set di dati, alcuni sono più adeguati di altri. I modelli in una fase prevedono il punto successivo in una serie temporale, mentre i modelli in più fasi producono previsioni su più serie temporali. 

I tipi di modello di serie temporale includono: 

  • Autoregressive integrated moving average (ARIMA) 

  • Livellamento esponenziale

  • Generalized autoregressive conditional heteroscedasticity (GARCH) 

  • Long short-term memory (LSTM) 

Prophet, l'open source di Meta, e DeepAR di Amazon sono altri due modelli di AI sviluppati per la modellazione di serie temporali. È anche possibile adattare i modelli di regressione lineare per le attività di forecasting delle serie temporali. Altri modelli di apprendimento supervisionato, come XGBoost e foreste casuali, possono essere applicati ai dati di serie temporali non lineari.

Autoregressive integrated moving average (ARIMA)

La famiglia di modelli ARIMA è composta da numerosi modelli modulari che possono essere eseguiti da soli o combinati in vari raggruppamenti. ARIMA è un modello statistico che prevede i valori futuri in base agli eventi passati e funziona meglio con serie temporali stazionarie che mostrano la stagionalità. Eccelle con i set di dati univariati e può essere adattato anche per casi d'uso multivariati. 

Le configurazioni ARIMA includono: 

  • Autoregressione (AR): i modelli autoregressivi, indicati come AR(p), prevedono i valori futuri di una variabile basata sui valori passati in un termine stocastico, ovvero uno che è imperfettamente prevedibile. Il parametro p indica il grado di ritardo o il numero di punti dati utilizzati per fare una previsione. Un valore di p pari a 1 riporterebbe all'osservazione precedente della serie. 

  • Media mobile (MA): i modelli a media mobile, indicati come MA(q), prevedono i valori futuri in base agli errori di previsione passati. Il parametro q è il numero di errori inclusi nella previsione. Un modello MA(1) incorporerebbe un errore passato. 

  • Integrazione (I): i modelli integrati aggiungono differenze (d) per rendere stazionaria una serie temporale. La differenziazione sostituisce i valori dei dati con la differenza tra i valori correnti e i valori passati, creando una nuova serie per rappresentare la modifica dei valori. Il parametro d indica il numero di volte in cui i punti dati vengono differenziati. 

  • Autoregressive moving average (ARMA): i modelli ARMA combinano l'autoregressione con le medie mobili. I modelli ARMA possono elaborare serie temporali stazionarie e sono indicati come ARMA(p, q). 

  • Autoregressive integrated moving average (ARIMA): i modelli ARIMA, indicati come ARIMA(p, d, q) aggiungono differenziazioni alle serie temporali non stazionarie del modello. 

  • Seasonal autoregressive integrated moving average (SARIMA): i modelli SARIMA aggiungono la stagionalità.. I parametri per la stagionalità sono rappresentati con lettere maiuscole e il parametro m indica la durata della stagione. I modelli SARIMA sono indicati come SARIMA(p, d, q)(P, D, Q)m e richiedono una grande quantità di dati storici. 

  • SARIMA with exogenous variables (SARIMAX): i dati di serie temporali più complesse includono variabili oltre al tempo. I modelli SARIMAX incorporano variabili esterne per generare previsioni più sfumate. 

  • Vector autoregression (VAR): mentre ARIMA funziona meglio con le attività univariate, l'autoregressione vettoriale (VAR) può gestire set di dati multivariati. I modelli VAR, inclusi VARMA e VARMAX, possono effettuare stime per più modelli di serie temporali contemporaneamente.

Livellamento esponenziale

I modelli di livellamento esponenziale riducono il rumore assegnando progressivamente meno peso o importanza alle osservazioni più vecchie nelle serie temporali. Le osservazioni più recenti sono considerate più rilevanti per fare previsioni future. I modelli di livellamento esponenziale includono: 

  • Simple exponential smoothing (SES): la forma più elementare di livellamento esponenziale modifica la MA per dare più peso alle osservazioni recenti. Rispetto a un semplice modello a media mobile, SES riduce il rumore, preservando maggiori dettagli. 

  • Double exponential smoothing (DES): l'applicazione dello smoothing esponenziale in modo ricorsivo può aiutare a contrastare i trend. DES utilizza i parametri α come fattore di livellamento dei dati e β come fattore di livellamento della tendenza. 

  • Triple exponential smoothing (TES): per i set di dati con trend e stagionalità, TES (noto anche come livellamento esponenziale di Holt-Winters, HWES), applica lo smoothing una terza volta. Il parametro γ è il fattore di livellamento stagionale. 

  • TBATS: TBATS (trigonometric, Box-Cox, ARMA, trend and seasonal components) è un modello di livellamento esponenziale specializzato per set di dati di serie temporali con stagionalità complessa.

Generalized autoregressive conditional heteroscedasticity (GARCH)

GARCH è un modello specializzato che tiene traccia della volatilità nel settore finanziario. Ad esempio, nel mercato azionario, la volatilità è il grado e la velocità con cui fluttuano i prezzi delle azioni. Eteroschedasticità significa che gli errori in un modello di regressione non condividono la stessa varianza nel tempo. 

Nella data science, le variabili sono considerate omoschedastiche se le loro varianze sono uguali ed eteroschedastiche se non lo sono.

Long short-term memory (LSTM)

LSTM porta la potenza delle reti neurali di deep learning alla modellazione di serie temporali. Un modello LSTM è una rete neurale ricorrente (RNN) specializzata in dati sequenziali, come una serie temporale. Gli LSTM eccellono nell'acquisizione di dipendenze a lungo raggio: relazioni tra punti dati distanti in sequenza. 

Poiché possono conservare più contesto rispetto ad altri tipi di modelli, i modelli LSTM funzionano bene in applicazioni complesse, come l'elaborazione del linguaggio naturale (NLP) e il riconoscimento di voci e immagini nel mondo reale. Richiedono grandi quantità di dati di addestramento e possono essere creati in Python.

Metriche di modellazione delle serie temporali

Le metriche di benchmarking, i test e la convalida aiutano a ottimizzare le prestazioni del modello, come fanno in molte altre applicazioni di machine learning. 

Le metriche di modellazione delle serie temporali includono: 

  • Errore quadratico medio (MSE): la media dei quadrati dell'errore a ogni timestamp. 

  • Radice dell'errore quadratico medio (RMSE): la radice quadrata dell'MSE. 

  • Errore assoluto medio (MAE): la media dei valori di errore per ogni osservazione. 

  • Errore percentuale medio assoluto (MAPE): esprime il MAE in percentuale, mostrando l'entità dell'errore. Il MAPE è noto anche come deviazione percentuale assoluta media (MAPD). MAPE è una funzione di perdita comune per i problemi di regressione.

Casi d'uso della modellazione delle serie temporali

I modelli di serie temporali giocano un ruolo importante nell'analisi dei dati, aiutando i data scientist e i leader aziendali con: 

  • Riconoscimento dei pattern: i modelli delle serie temporali identificano le fluttuazioni ricorrenti dei dati nel tempo, come i cambiamenti stagionali, i cicli a lungo termine e le tendenze generali. Ad esempio, nel settore della moda, le vendite di magliette aumentano stagionalmente ogni primavera ed estate. Le tendenze della moda ricompaiono e svaniscono in cicli pluridecennali: le vestibilità oversize sono attualmente popolari come lo erano negli anni '90. 

  • Rilevamento delle anomalie: le anomalie sono punti dati che si discostano dal resto dei punti dati in un set di dati. Sebbene le anomalie occasionali possano essere attribuite al rumore, quantità maggiori di dati anomali possono indicare cambiamenti imprevisti, problemi nella pipeline di dati e opportunità di miglioramento. 

  • Forecasting: sulla base di dati storici, i modelli di serie temporali possono prevedere punti dati futuri della serie. Le organizzazioni possono utilizzare queste previsioni per prendere migliori decisioni basate sui dati.

Soluzioni correlate
Strumenti e soluzioni per l'analytics

Per prosperare, le aziende devono utilizzare i dati per fidelizzare i clienti, automatizzare i processi aziendali e innovare con soluzioni basate sull'AI.

Esplora le soluzioni di analytics
Servizi di consulenza per dati e analytics

Sblocca il valore dei dati aziendali con IBM Consulting e crea un'organizzazione basata su insight in grado di generare vantaggi aziendali.

Esplora i servizi di analytics
IBM Cognos Analytics

Introduzione a Cognos Analytics 12.0, insight basati sull'AI per prendere decisioni migliori.

Esplora Cognos Analytics
Fasi successive

Per prosperare, le aziende devono utilizzare i dati per fidelizzare i clienti, automatizzare i processi aziendali e innovare con soluzioni basate sull'AI.

Esplora le soluzioni di analytics Esplora i servizi di analytics