I modelli di analitica predittiva sono progettati per valutare i dati storici, scoprire modelli, osservare tendenze e utilizzare tali informazioni per prevedere tendenze future. I modelli di analitica predittiva più diffusi includono modelli di classificazione, clustering e serie storiche.
Modelli di classificazione
I modelli di classificazione rientrano nel ramo dei modelli di machine learning supervisionato. Questi modelli categorizzano i dati sulla base dei dati storici, descrivendo le relazioni all'interno di un determinato set di dati. Ad esempio, questo modello può essere utilizzato per classificare i clienti o i potenziali clienti in gruppi per fini di segmentazione. In alternativa, può anche essere utilizzato per rispondere a domande con output binari, come rispondere sì o no oppure vero e falso; viene frequentemente utilizzato per casi d'uso come il rilevamento delle frodi e la valutazione del rischio di credito. I tipi di modelli di classificazione includono regressione logistica, alberi decisionali, foresta casuale, reti neurali e Naïve Bayes.
Modelli di clustering
I modelli di clustering rientrano nell'ambito dell'apprendimento senza supervisione. Raggruppano i dati in base ad attributi simili. Ad esempio, un sito di e-commerce può utilizzare il modello per separare i clienti in gruppi simili in base a caratteristiche comuni e sviluppare strategie di marketing per ciascun gruppo. Gli algoritmi di clustering più comuni includono il k-means clustering, il clustering a spostamento medio, il clustering spaziale basato sulla densità di applicazioni con rumore (DBSCAN), il clustering di massimizzazione delle aspettative (EM) utilizzando Gaussian Mixture Models (GMM) e il clustering gerarchico.
Modelli di serie storiche
I modelli di serie storiche utilizzano diversi input di dati con una frequenza temporale specifica, ad esempio giornaliera, settimanale, mensile, ecc. È prassi comune tracciare un grafico della variabile dipendente nel tempo per valutare la stagionalità, le tendenze e il comportamento ciclico dei dati, che potrebbero indicare la necessità di una trasformazione e di tipi di modelli specifici. I modelli autoregressivi (AR), a media mobile (MA), ARMA e ARIMA sono tutti modelli di serie storiche utilizzati di frequente. Ad esempio, un call center può utilizzare uno dei modelli di serie storiche per prevedere il numero di chiamate che riceverà ogni ora in diversi momenti della giornata.