L’analyse prédictive est une branche de l’analytique avancée qui permet de prédire les résultats futurs à l’aide de données historiques combinées à une modélisation statistique, à des techniques d’exploration de données et au machine learning.
Les entreprises utilisent l’analyse prédictive afin de repérer des tendances dans ces données et ainsi identifier les risques et les opportunités. L’analyse prédictive est souvent associée au big data et à la science des données.
Aujourd’hui, les entreprises sont inondées de données (fichiers journaux, images ou encore vidéos), et toutes ces données se trouvent dans des référentiels disparates au sein de l’organisation. Pour obtenir des informations à partir de ces données, les data scientists utilisent le deep learning et les algorithmes de machine learning pour repérer des tendances et formuler des prédictions sur les événements futurs. Parmi ces techniques statistiques figurent les modèles de régression linéaire et logistique, les réseaux neuronaux et les arbres de décision. Certaines de ces techniques de modélisation utilisent les apprentissages prédictifs initiaux pour obtenir davantage d’informations prédictives.
Découvrez pourquoi IBM a été nommé leader dans le rapport IDC MarketScape : Worldwide AI Governance Platforms 2023.
Obtenir l’eBook sur les magasins de données pour l’IA
Les modèles d’analyse prédictive sont conçus pour évaluer les données historiques, repérer des schémas, observer les tendances et utiliser ces informations pour prédire les tendances futures. Parmi les modèles d’analyse prédictive populaires figurent la classification, l’agrégation et les modèles de séries temporelles.
Modèles de classification
Les modèles de classification relèvent de la branche des modèles de machine learning supervisés. Ces modèles catégorisent les données en fonction des données historiques, décrivant les relations au sein d’un jeu de données donné. Ils peuvent par exemple être utilisés pour classer les clients ou prospects en groupes, à des fins de segmentation. On peut également s’en servir pour répondre aux questions avec des sorties binaires, telles que « oui »/« non », ou « vrai »/« faux » ; ces modèles sont souvent utilisés dans la détection des fraudes et l’évaluation des risques de crédit. Les types de modèles de classification comprennent la régression logistique, les arbres décisionnels, la forêt aléatoire, les réseaux neuronaux et la classification naïve bayésienne.
Modèles de partitionnement
Les modèles de partitionnement relèvent de l’apprentissage non supervisé. Ils regroupent les données en fonction d’attributs similaires. Par exemple, un site de commerce électronique peut utiliser ce type de modèle pour répartir les clients en groupes similaires en fonction de caractéristiques communes et développer des stratégies marketing pour chaque groupe. Les algorithmes de partitionnement courants incluent le partitionnement en k-moyennes, le mean-shift, le partitionnement DBSCAN (density-based spatial clustering of applications with noise), le partitionnement espérance-maximisation (ou EM pour Expectation-Maximization) à l’aide de modèles de mélange gaussien (GMM) et le partitionnement hiérarchique.
Modèles de séries temporelles
Les modèles de séries temporelles utilisent différentes entrées de données à une fréquence temporelle spécifique, telle que quotidienne, hebdomadaire, mensuelle, etc. Il est courant de tracer la variable dépendante dans le temps afin d’évaluer les données en termes de saisonnalité, de tendances et de comportement cyclique, ce qui peut indiquer la nécessité de transformations et de types de modèles spécifiques.Les modèles autorégressifs (AR), moyenne mobile (MA), ARMA et ARIMA sont tous des modèles de séries temporelles fréquemment utilisés. Par exemple, un centre d’appels peut utiliser un modèle de série temporelle pour prévoir le nombre d’appels qu’il recevra par heure à différents moments de la journée.
L’analyse prédictive peut être déployée dans divers secteurs pour répondre à différents problèmes métier. Vous trouverez ci-dessous quelques cas d’utilisation par secteur pour illustrer comment l’analyse prédictive peut éclairer la prise de décisions dans des situations réelles.
Une organisation qui sait à quoi s’attendre en fonction des tendances passées dispose d’un avantage dans la gestion de ses stocks, de son personnel, de ses campagnes marketing et de la plupart des autres aspects opérationnels.
IBM Watson Studio permet aux data scientists, aux développeurs et aux analystes de créer, d’exécuter et de gérer des modèles d’IA, et d’optimiser les décisions n’importe où sur IBM Cloud Pak for Data.
IBM SPSS Statistics est une puissante plateforme logicielle statistique. Elle offre une interface conviviale et un ensemble robuste de fonctionnalités qui permettent à votre organisation d'extraire rapidement des informations exploitables à partir de vos données.
IBM SPSS Modeler est une solution de science des données et de machine learning (ML) de pointe, conçue pour aider les entreprises à accélérer la création de valeur en accélérant les tâches opérationnelles pour les data scientists.
Avec IBM Consulting, exploitez les données de votre entreprise et développez une organisation basée sur les analyses pour tirer des avantages métier.
L’analyse prédictive moderne peut permettre à votre entreprise d’extraire des informations en temps réel de ses données pour prédire et façonner votre avenir. Lisez ce guide pour en savoir plus.
Créez un modèle de ML pour estimer le risque associé à l’octroi d’une carte de crédit à un demandeur et déterminer s’il devrait en recevoir une.
Découvrez comment IBM SPSS Modeler peut améliorer la productivité de vos data scientists et vous offrir un ROI rapide grâce à l’outil Forrester Consulting commandé par IBM.