Régression linéaire
La procédure Régression linéaire estime les coefficients de l'équation linéaire, impliquant une ou plusieurs variables indépendantes, qui estiment le mieux la valeur de la variable dépendante. Par exemple, vous pouvez essayer d'estimer les ventes annuelles globales d'un commercial (la variable dépendante) à partir de variables indépendantes telles que l'âge, l'éducation et les années d'expérience.
Exemple. Le nombre de matches gagnés par une équipe de basket-ball au cours d'une saison est-il lié au nombre moyen de points marqués par l'équipe à chaque match ? Un nuage de points indique que ces variables ont un lien linéaire. Le nombre de matches gagnés et le nombre moyen de points marqué par l'équipe adverse ont également un lien linéaire. Ces variables ont une relation négative. Lorsque le nombre de matches gagnés augmente, le nombre moyen de points marqués par les adversaires diminue. A l'aide de la régression linéaire, vous pouvez modéliser la relation entre ces variables. Un bon modèle peut être utilisé pour prévoir combien de matches les équipes vont gagner.
Statistiques: Pour chaque : nombre d'observations valides, moyenne et écart type. Pour chaque modèle : coefficient de régression, matrice de corrélation, mesure et corrélations partielles, R multiple, R 2, R 2 ajusté, modification dans R 2, erreur standard de l'estimation, tableau d'analyse de variance, prévisions et résidus. En plus, intervalles de confiance à 95 % pour chaque coefficient de régression, matrice variances-covariances, facteur d'inflation de la variance, tolérance, test de Durbin-Watson, mesures de distances (Mahalanobis, Cook, et valeurs influentes), DfBêta, différence de prévision, intervalles d'estimation et informations de diagnostic des observations. Tracés : nuages de points, tracés partiels, histogrammes et tracés de probabilités gaussiens.
Régression linéaire : Remarques sur les données
Données. Les variables dépendantes et indépendantes doivent être quantitatives. Les variables catégorielles, comme la religion, la qualification, la zone de résidence, doivent être enregistrées sous forme de variables binaires (muettes) ou sous de tout autre type de variables de contraste.
Hypothèses: Pour chaque valeur de la variable indépendante, la distribution de la variable dépendante doit être normale. La variance de la distribution de la variable dépendante doit être constante pour toutes les valeurs de la variable indépendante. La relation entre la variable dépendante et chaque variable indépendante doit être linéaire et toutes les observations doivent être indépendantes.
Obtenir une analyse de régression linéaire
Cette fonction nécessite l'option Statistiques de base.
- A partir des menus, sélectionnez :Remarque : les champs surlignés en rouge sont obligatoires. Les boutons Coller et OK sont activés après avoir saisi des valeurs valides dans tous les champs obligatoires.
- Dans la boîte de dialogue Régression linéaire, sélectionnez une variable numérique dépendante.
- Sélectionnez une ou plusieurs variables indépendantes.
(En option) Vous avez également ces possibilités :
- Grouper des variables indépendantes en blocs et spécifier différentes méthodes d'entrée pour différents sous-groupes de variables.
- Choisir une variable de sélection pour limiter l'analyse à un sous-groupe d'observations ayant une ou des valeurs particulières pour cette variable.
- Sélectionner une variable d'identification d'observations pour identifier des points sur les tracés.
- Sélectionnez une variable de pondération WLS numérique pour une analyse des moindres carrés pondérés.
WLS: Permet d'obtenir un modèle pondéré des moindres carrés. Les points de données sont pondérés par l'inverse de leur variance. Ainsi, les observations dont la variance est élevée ont moins d'impact sur l'analyse que celles dont la variance est faible. Si la valeur de la variable de pondération est nulle, négative ou manquante, l'observation est exclue de l'analyse.
Cette procédure reproduit la syntaxe de commande REGRESSION .