Analyse des composantes de variance

L'analyse des Composantes de variance, relative aux modèles à effets mixtes, estime la contribution de chaque effet aléatoire sur la variance de la variable dépendante. Cette procédure est particulièrement intéressante pour l'analyse des modèles mixtes, tels que tracé partiel, mesures répétées univariées et plans de blocs aléatoires. Le calcul des composantes de variance vous permet de déterminer les éléments sur lesquels se concentrer pour réduire la variance.

Il existe quatre méthodes différentes d'estimation des composantes de variance : estimation partiale quadratique des normes minimales (MINQUE), analyse de variance, maximum de vraisemblance (ML) et maximum de vraisemblance restreint (REML). Ces différentes méthodes disposent de nombreuses spécifications.

La sortie par défaut pour toutes les méthodes inclut les estimations des composantes de variance. Si la méthode ML ou REML est utilisée, une matrice de covariance asymptotique est également affichée. Les autres sorties possibles comprennent un tableau ANOVA et les carrés moyens attendus pour la méthode ANOVA et un historique des itérations pour les méthodes ML et REML. L'analyse des composantes de variance est totalement compatible avec la procédure GLM - Univarié.

La pondération WLS vous permet de spécifier une variable utilisée pour pondérer les observations pour une analyse pondérée, par exemple pour compenser les variations de précision des mesures.

Exemple : Un collège agricole mesure, pendant un mois, la prise de poids de cochons élevés par 6 soues différentes. La variable Soue est un facteur aléatoire avec six niveaux. (Les six soues étudiées constituent un échantillon aléatoire d'une population plus vaste de soues.) Le chercheur découvre que la variance dans la prise de poids est plus liée aux différences de soue qu'aux différences entre les cochons dans une soue.

Démonstration

Remarques sur les données des composantes de variance

Données : La variable dépendante est quantitative. Les facteurs sont qualitatifs. Il peut s'agir de valeurs numériques ou alphanumériques de huit octets au maximum. L'un des facteurs au moins doit être aléatoire. Cela signifie que les niveaux du facteur doivent constituer un échantillon aléatoire des niveaux possibles. Les covariables sont des variables quantitatives liées à la variable dépendante.

Hypothèses : Toutes les méthodes partent du principe que les paramètres d'un effet aléatoire ont une moyenne nulle, des variances constantes finies et ne sont pas corrélées deux à deux. Les paramètres de différents effets aléatoires ne sont pas corrélés non plus.

Le terme résiduel a également une moyenne nulle et une variance constante finie. Il n'est pas corrélé avec les paramètres d'un effet aléatoire quelconque. On part du principe que les termes résiduels des différentes observations ne sont pas corrélés.

A partir de ces hypothèses, les observations de même niveau d'un facteur aléatoire sont corrélées. Cela différencie l'analyse des composantes de variance d'un modèle linéaire général.

ANOVA et MINQUE ne nécessitent pas d'hypothèses de normalité. Ces deux méthodes ont la puissance de modérer les abandons de l'hypothèse de normalité.

ML et REML requièrent que le paramètre de modèle et le terme résiduel soient distribués normalement.

Procédures apparentées : Utilisez la procédure Explorer pour étudier les données avant de mener l'analyse des composantes de variance. Pour tester les hypothèses, utilisez GLM – Univarié, GLM - Multivarié et GLM - Mesures répétées.

Obtenir les tableaux des composantes de variance

Cette fonction nécessite l'option Statistiques avancées.

  1. A partir des menus, sélectionnez :

    Analyse > Modèle linéaire général > Composantes de variance...

  2. Sélectionnez une variable dépendante.
  3. Sélectionnez des variables pour Facteurs fixés, Facteurs aléatoires et Covariables en fonction de vos données. Pour spécifier une variable de pondération, utilisez Pondération WLS.

Cette procédure reproduit la syntaxe de commande VARCOMP.