Méthode(Imputation multiple)

L'onglet Méthode spécifie de quelle manière les valeurs manquantes seront imputées, y compris les types des modèles utilisés. Les prédicteurs sont codés par indicateurs (factices).

Méthode d'imputation
La méthode Automatique analyse les données et utilise la méthode monotone si les données présentent un motif de valeurs manquantes monotone ; le reste du temps, la spécification entièrement conditionnelle est utilisée. Si vous êtes certain de la méthode à utiliser, vous pouvez la spécifier comme méthode personnalisée.
Spécification entièrement conditionnelle
Il s'agit d'une méthode de Monte Carlo par chaînes de Markov (MCMC) itérative pouvant être utilisée lorsque le motif de données manquantes est arbitraire (monotone ou non).
Pour chaque itération et pour chaque variable dans l'ordre spécifié par la liste de variables, la méthode de spécification entièrement conditionnelle (FCS) ajuste un modèle univarié (variable dépendante unique) en utilisant toutes les autres variables du modèle comme prédicteurs, et impute ensuite les valeurs manquantes pour la variable à ajuster. Cette méthode se poursuit jusqu'à ce que le nombre maximal d'itérations soit atteint, et les valeurs imputées à l'itération maximale sont enregistrées dans le jeu de données imputé.
Itérations maximum
Spécifie le nombre d'itérations, ou "d'étapes", utilisées par les chaînes de Markov dans la méthode FCS. Si la méthode FCS a été choisie automatiquement, elle utilise 10 itérations par défaut. Lorsque vous avez précisément choisi FCS, vous pouvez spécifier un nombre d'itérations personnalisé. Vous pourriez avoir à augmenter le nombre d'itérations si la chaîne de Markov n'a pas convergé. Dans l'onglet Sortie, vous pouvez enregistrer les données de l'historique des itérations FCS et les visualiser sous forme de tracé pour évaluer la convergence.
Monotone
Méthode non-itérative pouvant être utilisée uniquement lorsque les données présentent un motif de valeurs manquantes monotone. Un motif monotone existe lorsqu'il est possible d'ordonner les variables de façon à ce que, si une variable a une valeur non manquante, toutes les variables précédentes auront également des valeurs non manquantes. Lorsque vous la spécifiez comme une méthode Personnalisée, veillez à spécifier les variables de la liste dans un ordre faisant apparaître un motif monotone.
Pour chaque variable de l'ordre monotone, la méthode monotone ajuste un modèle univarié (variable dépendante unique) en utilisant toutes les variables précédentes comme prédicteurs, et impute ensuite les valeurs manquantes pour la variable à ajuster. Ces valeurs imputées sont enregistrées dans le jeu de données imputé.
Inclure des interactions d'ordre 2
Lorsque la méthode d'imputation est automatiquement choisie, le modèle d'imputation de chaque variable comprend un terme constant et des effets majeurs pour les variables de prédicteur. Losqu'une méthode spécifique est choisie, vous pouvez, si vous le désirez, inclure toutes les interactions bidirectionnelles possibles parmi les variables de prédicteur catégoriel.
Type de modèle pour les variables d'échelle
Régression linéaire
Lorsque la méthode d'imputation est automatiquement sélectionnée, la régression linéaire est utilisée comme modèle univarié pour les variables d'échelle.
Correspondance de moyenne prévisionnelle (PMM)
Lorsqu'une méthode spécifique est choisie, vous pouvez également choisir l'égalisation par la moyenne prédictive (PMM) comme modèle pour les variables d'échelle. La méthode PMM est une variante de régression linéaire qui garantit que les valeurs imputées sont plausibles. Pour PMM, la valeur imputée est basée sur la valeur définie pour la valeur Sélectionner une observation complète de manière aléatoire à partir des prévisions les plus proches (k), où (k) est un entier positif dont la valeur par défaut est 5.
La régression logistique est toujours utilisée comme modèle univarié pour les variables catégorielles. Indépendamment du type de modèle, les prédicteurs catégoriels sont traités à l'aide de la codification par indicateurs (factice).
Tolérance de singularité
Les matrices singulières (ou non inversables) comportent des colonnes linéairement dépendantes, ce qui peut provoquer de graves problèmes pour l'algorithme d'estimation. Même les matrices presque singulières peuvent générer des résultats médiocres. C'est pourquoi la procédure traite une matrice dont le déterminant est inférieur à la tolérance en tant que matrice singulière. Indiquez une valeur positive.

Spécification d'une méthode d'imputation

Cette fonction nécessite l'option Valeurs manquantes.

  1. A partir des menus, sélectionnez :

    Analyser > Imputation multiple > Imputer les données manquantes Valeurs ...

  2. Dans la boîte de dialogue Imputer les valeurs de données manquantes, cliquez sur l'onglet Méthode.