Les modèles d’analyse prédictive sont conçus pour évaluer les données historiques, repérer des schémas, observer les tendances et utiliser ces informations pour prédire les tendances futures. Parmi les modèles d’analyse prédictive populaires figurent la classification, l’agrégation et les modèles de séries temporelles.
Modèles de classification
Les modèles de classification relèvent de la branche des modèles de machine learning supervisés. Ces modèles catégorisent les données en fonction des données historiques, décrivant les relations au sein d’un jeu de données donné. Ils peuvent par exemple être utilisés pour classer les clients ou prospects en groupes, à des fins de segmentation. On peut également s’en servir pour répondre aux questions avec des sorties binaires, telles que « oui »/« non », ou « vrai »/« faux » ; ces modèles sont souvent utilisés dans la détection des fraudes et l’évaluation des risques de crédit. Les types de modèles de classification comprennent la régression logistique, les arbres décisionnels, la forêt aléatoire, les réseaux neuronaux et la classification naïve bayésienne.
Modèles de partitionnement
Les modèles de partitionnement relèvent de l’apprentissage non supervisé. Ils regroupent les données en fonction d’attributs similaires. Par exemple, un site de commerce électronique peut utiliser ce type de modèle pour répartir les clients en groupes similaires en fonction de caractéristiques communes et développer des stratégies marketing pour chaque groupe. Les algorithmes de partitionnement courants incluent le partitionnement en k-moyennes, le mean-shift, le partitionnement DBSCAN (density-based spatial clustering of applications with noise), le partitionnement espérance-maximisation (ou EM pour Expectation-Maximization) à l’aide de modèles de mélange gaussien (GMM) et le partitionnement hiérarchique.
Modèles de séries temporelles
Les modèles de séries temporelles utilisent différentes entrées de données à une fréquence temporelle spécifique, telle que quotidienne, hebdomadaire, mensuelle, etc. Il est courant de tracer la variable dépendante dans le temps afin d’évaluer les données en termes de saisonnalité, de tendances et de comportement cyclique, ce qui peut indiquer la nécessité de transformations et de types de modèles spécifiques.Les modèles autorégressifs (AR), moyenne mobile (MA), ARMA et ARIMA sont tous des modèles de séries temporelles fréquemment utilisés. Par exemple, un centre d’appels peut utiliser un modèle de série temporelle pour prévoir le nombre d’appels qu’il recevra par heure à différents moments de la journée.