Modèles linéaires mixtes généralisés

Les modèles linéaires mixtes généralisés étendent le modèle linéaire de sorte que :

La cible est linéairement reliée aux facteurs et aux covariables via une fonction de lien spécifiée.
La cible peut avoir une distribution non normale.
Les observations peuvent être corrélées.

Les modèles linéaires mixtes généralisés couvrent une grande variété de modèles, depuis des modèles de régression linéaire simples jusqu'à des modèles multiniveaux complexes pour des données longitudinales non normales.

Exemples : La commission scolaire du secteur peut utiliser un modèle mixte linéaire généralisé pour déterminer si une méthode d'apprentissage expérimentale est efficace pour l'amélioration des notes en mathématiques. Les élèves d'une même classe devraient être corrélés puisque le même enseignant leur dispense les cours, et les classes d'une même école devraient aussi être corrélées donc nous pouvons inclure des effets aléatoires aux niveaux de l'école et de la classe pour prendre en compte les différentes sources de variabilité. Démonstration

Les chercheurs en médecine peuvent utiliser un modèle mixte linéaire généralisé pour déterminer si un médicament anti-convulsion peut réduire le taux des crises d'épilepsie d'un patient. Les mesures répétées chez le même patient sont normalement corrélées positivement, donc un modèle mixte avec des effets aléatoires devrait être adéquat. Le champ cible, le nombre de crises, prend des valeurs positives, donc un modèle mixe linéaire généralisé avec une distribution de Poisson et un lien de log devraient être appropriés. Démonstration

Les dirigeants d'un fournisseur de services de télévision câblée, de service téléphoniques et Internet peuvent utiliser un modèle mixte linéaire généralisé pour en savoir plus sur les clients potentiels. Du fait que les réponses possibles ont des niveaux de mesure nominaux, l'analyste de la société utilise un modèle mixte logit généralisé avec une constante aléatoire pour capturer la corrélation entre les réponses aux questions d'utilisation du service selon différents types de services (tv, téléphone, Internet) et les réponses d'une enquête donnée. Démonstration

L'onglet Structure des données vous permet de spécifier les relations structurelles existant entre les enregistrements de votre jeu de données lorsque les observations sont corrélées. Si les enregistrements du jeu de données représentent des observations indépendantes, vous n'avez pas besoin de spécifier quoi que ce soit sur cet onglet.

Sujets : La combinaison des valeurs des champs catégoriels spécifiés doit définir de manière unique les sujets à l'intérieur du jeu de données. Par exemple, un seul champ ID du patient doit suffire à définir les sujets dans un même hôpital, mais la combinaison des variables ID de l'hôpital et ID du patient peut être nécessaire si les numéros d'identification des patients ne sont pas uniques entre les hôpitaux. Dans le cas de mesures répétées, plusieurs observations sont enregistrées pour chaque sujet, de sorte que chaque sujet peut occuper plusieurs enregistrements dans le jeu de données.

Un sujet est une unité d'observation considérée comme indépendante des autres sujets. Par exemple, lors d'une étude médicale, la mesure de la tension artérielle d'un patient peut être considérée comme étant indépendante des résultats des autres patients. La définition des sujets devient particulièrement importante lorsqu'il existe deux évaluations répétées par sujet et que vous souhaitez modéliser la corrélation entre ces observations. Par exemple, vous pouvez vous attendre à ce que les mesures de tension artérielle d'un patient unique lors de visites consécutives chez le docteur soient en corrélation.

Tous les champs spécifiés comme Sujets dans l'onglet Structure des données sont utilisés pour définir les sujets dans le cadre de la structure de covariance des résidus, et constituent la liste des champs possibles à utiliser lors de la définition des sujets pour les structures de covariance à effets aléatoires sur le Bloc d'effet aléatoire.

Mesures répétées : Les champs spécifiés ici sont utilisés pour identifier des observations répétées. Par exemple, une variable unique Semaine peut identifier les 10 semaines d'observations dans une étude médicale, ou les variables Mois et Jour peuvent être utilisées ensemble pour identifier les observations quotidiennes sur une année entière.

Définir les groupes de covariance par : Les champs catégoriels spécifiés ici définissent des ensembles indépendants de paramètres de covariance d'effets répétés, un ensemble étant défini pour chaque catégorie par la classification croisée des champs de regroupement. Tous les sujets ont le même type de covariance ; les sujets à l'intérieur de la même classe de covariance auront les mêmes valeurs de paramètres.

Type de covariance répétée : Indique la structure de covariance des résidus. Les structures disponibles sont :

Autorégressif de premier ordre (AR1)
Moyenne mobile autorégressive (1,1) (ARMA11)
Symétrie composée
Diagonale
Identité mise à l'échelle
Toeplitz
Sans structure
Composantes de variance

Cette procédure reproduit la syntaxe de commande GENLINMIXED.

Obtention d'un modèle linéaire mixte généralisé