Régression aux moindres carrés partiels

La procédure Régression aux moindres carrés partiels estime les modèles de régression aux moindres carrés partiels (également connus sous le nom de "projection to latent structure", PLS). La technique de prévision PLS constitue une solution de remplacement par rapport à la régression par les moindres carrés classiques, à la corrélation canonique ou à la modélisation d'équation structurelle, particulièrement utile lorsque les variables de prédicteur présentent une forte corrélation ou lorsque le nombre de prédicteurs dépasse le nombre d'observations.

PLS combine des fonctions d'analyse des composants principaux et la régression multiple. Un ensemble de facteurs latents expliquant autant que possible la covariance entre les variables indépendantes et dépendantes est extrait. Ensuite, une étape de régression prévoit les valeurs des variables dépendantes à l'aide de la décomposition des variables indépendantes.

Tableaux
Proportion de variance expliquée (par facteur latent), pondérations de facteurs latents, chargements de facteurs latents, importance de la variable indépendante dans la projection (VIP), et estimations des paramètres de régression (par variable dépendante) sont tous générés par défaut.
Graphiques
L'importance des variables dans la projection (VIP), les scores factoriels, les pondérations des facteurs pour les trois premiers facteurs latents et la distance au modèle sont tous produits à partir de l'onglet Options .

Remarques sur les données

Niveau de mesure
Les variables dépendantes et indépendantes (prédicteur) peuvent être échelle, nominal ou ordinal. La procédure considère que le niveau de mesure approprié a été assigné à toutes les variables, bien que vous puissiez changer provisoirement le niveau de mesure d'une variable en cliquant avec le bouton droit de la souris sur la variable dans la liste des variables source, puis en sélectionnant un niveau de mesure dans le menu contextuel. Les variables catégorielles (nominales ou ordinales) sont traitées de manière équivalente par la procédure.
Codage de variable catégorielle
La procédure recode provisoirement les variables dépendantes catégorielles via la codification un-de-c pendant la durée de la procédure. S'il existe c catégories d'une variable, la variable est stockée en tant que vecteurs c , avec la première catégorie notée (1,0, ..., 0), la catégorie suivante (0,1,0, ..., 0), ..., et la catégorie finale (0,0, ..., 0, 1). Les variables dépendantes catégorielles sont représentées à l'aide de la codification de façon fictive, c'est-à-dire, elles omettent simplement l'indicateur correspondant à la catégorie de référence.
Pondérations de fréquence
Les valeurs de pondération sont arrondies au nombre entier le plus près avant utilisation. Les observations avec des pondérations manquantes ou des pondérations inférieures à 0,5, ne sont pas utilisées dans les analyses.
Valeur manquante
Les valeurs manquantes spécifiées par l'utilisateur et par le système sont traitées comme non valides.
Rééchelonnement
Tous les variables de modèle sont centrées et standardisées, dont les variables indicateur représentant les variables catégorielles.

Obtention de la régression des moindres carrés partiels

A partir des menus, sélectionnez :

Analyser > Régression > moindres carrés partiels ...

  1. Sélectionnez au moins une variable dépendante.
  2. Sélectionnez au moins une variable indépendante.

(En option) Vous avez également ces possibilités :

  • Indiquer une catégorie de référence pour les variables catégorielles dépendantes (nominale ou ordinale).
  • Indiquer une variable à utiliser comme identificateur unique pour les jeux de données enregistrés et les sorties par observation.
  • Indiquer une limite supérieure sur le nombre de facteurs latents à extraire.

Cette procédure reproduit la syntaxe de commande PLS .

Prérequis

La procédure de régression aux moindres carrés partiels est une commande d'extension Python qui requiert la fonctionnalité Python , qui fait partie de votre produit IBM® SPSS® Statistics . Cette procédure nécessite également la présence des bibliothèques Python NumPy et SciPy, qui sont toutes les deux disponibles gratuitement.
Remarque: pour les utilisateurs qui travaillent en mode d'analyse distribuée (requiert IBM SPSS Statistics Server), NumPy et SciPy doivent être installés sur le serveur. Contactez votre administrateur système pour obtenir de l'aide.
Utilisateurs Windows et Mac

Pour Windows et Mac, NumPy et SciPy doivent être installés sur une version distincte de Python 3.10 à partir de la version installée avec IBM SPSS Statistics. Si vous ne disposez pas d'une version distincte de Python 3.10, vous pouvez la télécharger à partir du site http://www.python.org. Installez ensuite NumPy et SciPy for Python version 3.10. Les programmes d'installation sont disponibles sur le site http://www.scipy.org/Download.

Pour permettre l'utilisation de NumPy et SciPy, vous devez définir votre emplacement Python à la version de Python 3.10 où vous avez installé NumPy et SciPy. Vous pouvez configurer l'emplacement de Python à partir de l'onglet Emplacements des fichiers de la boîte de dialogue Options (Edition > Options).

Utilisateurs Linux

Nous vous suggérons de télécharger vous-même les versions source et compilée des bibliothèques NumPy et SciPy. La source est disponible à l'adresse http://www.scipy.org/Download. Vous pouvez installer NumPy et SciPy dans la version de Python 3.10 qui est installée avec IBM SPSS Statistics. Il se trouve dans le répertoire Python , à l'emplacement où IBM SPSS Statistics est installé.

Si vous choisissez d'installer NumPy et SciPy sur une version de Python 3.10 autre que celle qui est installée avec IBM SPSS Statistics, vous devez définir votre emplacement Python pour qu'il pointe vers cette version. L'emplacement Python est défini dans l'onglet Emplacements des fichiers de la boîte de dialogue Options (Editer > Options).

Serveur Windows et Unix

NumPy et SciPy doivent être installés, sur le serveur, sur une version distincte de Python 3.10 à partir de la version installée avec IBM SPSS Statistics. S'il n'existe pas de version distincte de Python 3.10 sur le serveur, elle peut être téléchargée à partir de http://www.python.org. NumPy et SciPy pour Python 3.10 sont disponibles à l'adresse http://www.scipy.org/Download. Pour permettre l'utilisation de NumPy et SciPy, 'emplacement Python du serveur doit être défini sur la version de Python 3.10 où NumPy et SciPy sont installés. L'emplacement Python est défini à partir de la IBM SPSS Statistics.