Modèles mixtes linéaires généralisés

Les modèles mixtes linéaires généralisés élargissent le modèle linéaire de sorte que :

  • La cible est liée de manière linéaire aux facteurs et covariables par une fonction de lien spécifiée.
  • La cible peut avoir une distribution non normale
  • Les observations peuvent être corrélées.

Les modèles mixtes linéaires généralisés couvrent une large variété de modèles, depuis les modèles de régression linéaire simple aux modèles multi-niveaux complexes destinés aux données longitudinales non normales.

Exemples. La commission scolaire régionale peut utiliser un modèle mixte linéaire généralisé pour déterminer si une méthode d'apprentissage expérimentale est efficace pour l'amélioration des notes en mathématiques. Les élèves d'une même classe devraient être corrélés puisque le même enseignant leur dispense les cours, et les classes d'une même école devraient aussi être corrélées donc nous pouvons inclure des effets aléatoires aux niveaux de l'école et de la classe pour prendre en compte les différentes sources de variabilité.

Les chercheurs dans le domaine médical peuvent utiliser un modèle mixte linéaire généralisé pour déterminer si un nouveau médicament anti-convulsions peut réduire le taux de crises épileptiques chez un patient. Les mesures répétées chez le même patient sont normalement corrélées positivement, donc un modèle mixte avec des effets aléatoires devrait être adéquat. Le champ cible, en l'occurrence le nombre de crises, prend des valeurs entières positives, donc un modèle mixte linéaire généralisé avec une distribution de Poisson et un lien log peut être approprié.

Les dirigeants d'une société de prestation de services de télévision par câble, de téléphonie et Internet peuvent utiliser un modèle mixte linéaire généralisé pour mieux connaître leurs clients potentiels. Les réponses possibles ayant des niveaux de mesure nominaux, l'analyste de la société utilise un modèle mixte logit généralisé avec une constante aléatoire, pour capturer la corrélation entre les réponses aux questions sur l'utilisation du service selon le type de service (télévision, téléphone, internet) au sein des réponses à une enquête donnée.

L'onglet Structure des données vous permet de spécifier les relations structurelles entre les enregistrements de votre jeu de données, lorsque les observations sont corrélées. Si les enregistrements du jeu de données représentent des observations indépendantes, vous n'avez pas besoin de spécifier quoi que ce soit sur cet onglet.

Sujets. La combinaison des valeurs des champs catégoriels spécifiés doit définir de manière unique les sujets à l'intérieur du jeu de données. Par exemple, un seul champ ID du patient devrait suffire à définir les sujets d'un hôpital donné, mais la combinaison de l'ID de l'hôpital et de l'ID du patient peut être nécessaire si les numéros d'identification des patients ne sont pas uniques entre les hôpitaux. Dans le cas de mesures répétées, plusieurs observations sont enregistrées pour chaque sujet, de sorte que chaque sujet peut occuper plusieurs enregistrements dans le jeu de données.

Un sujet est une unité d'observation qui peut être considérée indépendante des autres sujets. Par exemple, la mesure de pression artérielle d'un patient au sein d'une étude médicale peut être considérée indépendante des mesures prise sur les autres patients. La définition des sujets devient particulièrement importante lorsqu'il existe deux mesures répétées par sujet et que vous souhaitez modéliser la corrélation entre ces observations. Par exemple, vous pouvez vous attendre à ce que les mesures de la pression artérielle d'un patient donné soient corrélées, lors de visites consécutives chez le médecin.

Tous les champs spécifiés comme Sujets dans l'onglet Structure des données sont utilisés pour définir les sujets dans le cadre de la structure de covariance des résidus, et constituent la liste des champs possibles à utiliser lors de la définition des sujets pour les structures de covariance à effets aléatoires sur le Bloc d'effet aléatoire.

Mesures répétées. Les champs spécifiés ici permettent d'identifier les observations répétées. Par exemple, une variable unique Semaine peut identifier les 10 semaines d'observation au cours d'une étude médicale, ou les variables Mois et Jour peuvent être utilisés ensemble pour identifier les observations quotidiennes sur une période d'un an.

Définir les classes de covariance par. Les champs catégoriels spécifiés ici définissent des ensembles indépendants de paramètres de covariance d'effets répétés, un ensemble étant défini pour chaque catégorie par la classification croisée des champs de regroupement. Tous les sujets ont le même type de covariance ; les sujets faisant partie du même regroupement de covariance auront les mêmes valeurs de paramètres.

Coordonnées de la covariance spatiale. Les variables de cette liste spécifient les coordonnées des observations répétées lorsque l'un des types de covariance spatiale est sélectionné pour le type de covariance répété.

Type de covariance répétée. Indique la structure de covariance des résidus. Les structures disponibles sont les suivantes :

  • Autorégressive de premier ordre (AR1)
  • Moyenne mobile autorégressive (1,1) (ARMA11)
  • Symétrie composée
  • Diagonale
  • Identité mise à l'échelle
  • Spatiale : Puissance
  • Spatiale : Exponentielle
  • Spatiale : Gausse
  • Spatiale : Linéaire
  • Spatiale : Log linéaire
  • Spatiale : Sphérique
  • Toeplitz
  • Sans structure
  • Composantes de variance