Qu’est-ce que la régression linéaire ?

Qu’est-ce que la régression linéaire ?

L’analyse de régression linéaire est utilisée pour prévoir la valeur d’une variable en fonction de la valeur d’une autre. La variable que vous souhaitez prévoir est appelée variable dépendante. La variable que vous utilisez pour prévoir la valeur de l’autre variable est appelée variable indépendante.

Cette forme d’analyse permet d’estimer les coefficients de l’équation linéaire, impliquant une ou plusieurs variables indépendantes qui prédisent le mieux la valeur de la variable dépendante. La régression linéaire permet d’ajuster une ligne droite ou une surface qui minimise les écarts entre les valeurs de sortie prédites et réelles. Il existe des calculateurs de régression linéaire simples qui utilisent une méthode de « moindres carrés » pour découvrir la ligne la plus adaptée à un ensemble de données appariées. Vous estimez ensuite la valeur de X (variable dépendante) à partir de Y (variable indépendante).

Design 3D de balles roulant sur une piste

Les dernières actualités et informations en matière d’IA 


La newsletter hebdomadaire Think vous apporte toute l’actualité sur l’IA, le cloud et bien d’autres sujets.

Générer des prédictions plus facilement

Vous pouvez effectuer une régression linéaire dans Microsoft Excel ou utiliser des logiciels statistiques comme IBM SPSS Statistics qui simplifient considérablement le processus d’utilisation des équations de régression linéaire, des modèles de régression linéaire et de la formule de régression linéaire. SPSS Statistics peut être utilisé dans des techniques comme la régression linéaire simple et la régression linéaire multiple.

Vous pouvez appliquer la méthode de régression linéaire dans divers programmes et environnements, notamment :

  • Régression linéaire R.
  • Régression linéaire MATLAB.
  • Régression linéaire Sklearn.
  • Régression linéaire Python.
  • Régression linéaire Excel.
Groupe d’experts | Podcast

Décryptage de l’IA : Tour d’horizon hebdomadaire

Rejoignez notre panel d’ingénieurs, de chercheurs, de chefs de produits et autres spécialistes de premier plan pour connaître l’essentiel de l'actualité et des dernières tendances dans le domaine de l’IA.

Pourquoi la régression linéaire est importante

Les modèles de régression linéaire sont relativement simples et fournissent une formule mathématique facile à interpréter qui peut générer des prédictions. La régression linéaire peut être appliquée à divers domaines dans les affaires et les études universitaires.

Vous constaterez que la régression linéaire est utilisée dans tous les domaines, des sciences biologiques, comportementales, environnementales et sociales aux affaires. Les modèles de régression linéaire sont devenus un moyen éprouvé de prédire l’avenir scientifiquement et de manière fiable. La régression linéaire étant une procédure statistique établie de longue date, les propriétés des modèles de régression linéaire sont bien comprises et peuvent être entraînées très rapidement.

Un moyen éprouvé de prédire l’avenir scientifiquement et de manière fiable

Les techniques de régression linéaire améliorent la prise de décision des dirigeants d’entreprise et responsables d’organisation. À partir des masses de données collectées, la régression linéaire les aide à exploiter ces données pour mieux gérer la réalité, au lieu de se fier à l’expérience et à l’intuition. Vous pouvez ainsi transformer des quantités considérables de données brutes en informations exploitables.

La régression linéaire permet aussi d’obtenir des informations de valeur en découvrant des schémas et des relations que vos collègues ont pu voir auparavant en pensant les avoir compris. Par exemple, l’analyse des données de ventes et d’achats peut vous aider à découvrir des habitudes d’achat spécifiques à certains jours ou à certaines heures. Les informations recueillies grâce à l’analyse de régression permettent ainsi aux chefs d’entreprise d’anticiper les périodes où les produits de leur société seront très demandés.

Principales hypothèses d’une régression linéaire efficace

Hypothèses à prendre en compte pour réussir une analyse de régression linéaire :

  • Pour chaque variable : tenez compte du nombre de cas valides, de la moyenne et de l’écart type. 
  • Pour chaque modèle : examinez les coefficients de régression, la matrice de corrélation, les corrélations de parties et partiales, le R multiple, le R2, le R2 ajusté, la variation du R2, l’erreur standard de l’estimation, le tableau d’analyse de variance, les valeurs prédites et les résidus. Prenez également en compte les intervalles de fiabilité à 95 % pour chaque coefficient de régression, la matrice de variance-covariance, le facteur d’inflation de la variance, la tolérance, le test de Durbin-Watson, les mesures de distance (Mahalanobis, Cook et valeurs à effet de levier), DfBeta, DfFit, les intervalles de prédiction et les informations de diagnostic au cas par cas. 
  • Graphiques : examinez les nuages de points, les graphiques partiels, les histogrammes et les graphiques de probabilité normale.
  • Données : les variables dépendantes et indépendantes doivent être quantitatives. Les variables catégorielles, comme la religion, le principal domaine d’études ou la région de résidence, doivent être recodées en variables binaires (factices) ou en d’autres types de variables de contraste.
  • Autres hypothèses : pour chaque valeur de la variable indépendante, la distribution de la variable dépendante doit être normale. La variance de la distribution de la variable dépendante doit être constante pour toutes les valeurs de la variable indépendante. La relation entre la variable dépendante et chaque variable indépendante doit être linéaire et toutes les observations doivent être indépendantes.

Assurez-vous que vos données répondent aux hypothèses de régression linéaire

Avant d’effectuer une régression linéaire, vous devez vous assurer que vos données peuvent être analysées à l’aide de cette procédure. Vos données doivent passer par certaines hypothèses requises.

Voici comment vérifier ces hypothèses :

  1. Les variables doivent être mesurées de manière continue. Le temps, les ventes, le poids et les résultats des tests sont des exemples de variables continues. 
  2. Utilisez un nuage de points pour déterminer rapidement s’il existe une relation linéaire entre ces deux variables.
  3. Les observations doivent être indépendantes les unes des autres (c’est-à-dire qu’il ne doit pas y avoir de dépendance).
  4. Vos données ne doivent pas présenter de valeurs aberrantes significatives. 
  5. Vérifier l’homoscédasticité, un concept statistique selon lequel les variances le long de la ligne de régression linéaire la mieux ajustée restent égales tout au long de cette ligne.
  6. Les valeurs résiduelles (erreurs) de la ligne de régression la plus adaptée suivent la distribution normale.

Exemples de régression linéaire réussie

Évaluer les tendances et les estimations des ventes

Vous pouvez également utiliser l’analyse de régression linéaire pour tenter de prédire les ventes annuelles totales d’un vendeur (la variable dépendante) à partir de variables indépendantes telles que l’âge, la formation et les années d’expérience.

Analyser l’élasticité des prix

Les changements de prix ont souvent une incidence sur le comportement des consommateurs, et la régression linéaire peut vous aider à analyser cet impact. Par exemple, si le prix d’un produit particulier change constamment, l’analyse de régression vous permet de voir si la consommation diminue lorsque le prix augmente. Que se passe-t-il si la consommation ne diminue pas de manière significative lorsque le prix augmente ? À partir de quel prix les acheteurs cessent-ils d’acheter le produit ? Ces informations sont très utiles aux dirigeants du commerce de détail.

Évaluer les risques dans une compagnie d’assurance

Les techniques de régression linéaire peuvent être utilisées pour l’analyse de risque. Par exemple, une compagnie d’assurance peut disposer de ressources limitées pour examiner les demandes d’indemnisation des propriétaires ; grâce à la régression linéaire, l’équipe de la compagnie peut construire un modèle d’estimation des coûts des demandes d’indemnisation. L’analyse peut ainsi aider les chefs d’entreprise à prendre des décisions importantes sur les risques à prendre.

Analyse dans le sport

La régression linéaire ne concerne pas toujours les entreprises. Elle est également importante dans le domaine du sport. Par exemple, vous pouvez vous demander si le nombre de matchs gagnés par une équipe de basket-ball au cours d’une saison est lié au nombre moyen de points marqués par l’équipe par match. Un nuage de points indique que ces variables sont liées de manière linéaire. Le nombre de matchs gagnés et le nombre moyen de points marqués par l’adversaire sont également liés de manière linéaire. Ces variables ont une relation négative. Plus le nombre de matchs gagnés augmente, plus le nombre moyen de points marqués par l’adversaire diminue. La régression linéaire permet de modéliser la relation entre ces variables. Un bon modèle peut ainsi permettre de prédire le nombre de matchs que les équipes gagneront.

Solutions connexes
IBM watsonx.ai

Entraînez, validez, réglez et déployez une IA générative, des modèles de fondation et des capacités de machine learning avec IBM watsonx.ai, un studio d’entreprise nouvelle génération pour les générateurs d’IA. Créez des applications d’IA en peu de temps et avec moins de données.

Découvrir watsonx.ai
Solutions d’intelligence artificielle

Mettez l’IA au service de votre entreprise en vous appuyant sur l’expertise de pointe d’IBM dans le domaine de l’IA et sur son portefeuille de solutions.

Découvrir les solutions d’IA
Conseils et services en matière d’IA

Réinventez les workflows et les opérations critiques en ajoutant l’IA pour optimiser les expériences, la prise de décision et la valeur métier en temps réel.

Découvrir les services d’IA
Passez à l’étape suivante

Bénéficiez d’un accès centralisé aux fonctionnalités couvrant le cycle de développement de l’IA. Produisez des solutions IA puissantes offrant des interfaces conviviales, des workflows et un accès à des API et SDK conformes aux normes du secteur.

Découvrir watsonx.ai Réserver une démo en direct