Contraintes(Imputation multiple)

L'onglet Contraintes vous permet de restreindre le rôle d'une variable pendant l'imputation et de restreindre la plage des valeurs imputées d'une variable d'échelle afin qu'elles soient plausibles. De plus, vous pouvez restreindre l'analyse aux variables avec moins d'un pourcentage maximal de valeurs manquantes.

Analyse des données pour récapitulatif des variables : En cliquant sur Analyse des données , la liste affiche des variables d'analyse et le pourcentage observé manquant, minimum et maximum de chacune. Les récapitulatifs peuvent être basés sur toutes les observations ou limités à une analyse des n premières observations comme spécifié dans la zone de texte Observations. Pour mettre à jour les récapitulatifs de distribution, cliquez sur Réanalyser les données.

Définir les contraintes

  • Rôle. Vous permet de personnaliser l'ensemble des variables à imputer et/ou à traiter comme prédicteurs. Généralement, chaque variable d'analyse est considérée à la fois comme une variable dépendante et comme un prédicteur dans le modèle d'imputation. Le Rôle peut servir à désactiver l'imputation pour les variables que vous souhaitez Utiliser comme prédicteur uniquement ou pour que des variables ne soient pas utilisées comme des prédicteurs (Imputer uniquement) et obtenir ainsi des modèles plus compacts. C'est la seule contrainte qui peut être spécifiée pour les variables catégorielles, ou pour les variables qui sont uniquement utilisées comme prédicteurs.
  • Min et Max. Ces colonnes vous permettent de spécifier les valeurs imputées minimum et maximum autorisées pour les variables d'échelle. Si une valeur imputée dépasse cette plage, la procédure essaie une autre valeur jusqu'à ce qu'elle en trouve une qui soit dans la plage ou que le nombre maximum d'essais soit atteint (Consultez Essais maximum ci-dessous). Ces colonnes ne sont disponibles que si la régression linéaire est sélectionnée comme type de modèle de variable d'échelle dans l'onglet Méthode.
  • Arrondi: Certaines variables peuvent être utilisées comme variables d'échelle, mais elles possèdent des valeurs par nature davantage restreintes. Par exemple, le nombre de personnes dans un ménage doit être un entier, et le montant dépensé lors d'un passage dans une épicerie ne peut contenir de centimes fractionnels. Cette colonne vous permet de spécifier la coupure la plus faible à accepter. Par exemple, pour obtenir des valeurs entières, vous devez spécifier 1 comme la coupure d'arrondissement et pour obtenir les valeurs arrondies au centime le plus proche, vous devez spécifier 0,01. Les valeurs sont généralement arrondies au multiple entier le plus proche de la coupure d'arrondissement. Le tableau suivant montre de quelle manière les valeurs arrondies agissent sur la valeur imputée de 6,64823 (avant arrondissement).
Tableau 1. Résultats d'arrondi
Coupure d'arrondissement Valeur à laquelle 6,64832 est arrondie
10 10
1 7
0.25 6.75
0.1 6.6
0.01 6.65

Exclure les variables avec de grandes quantités de données manquantes : Généralement, les variables d'analyse sont imputées et utilisées comme prédicteurs sans tenir compte du nombre de leurs valeurs manquantes, tant qu'elles ont assez de données pour évaluer un modèle d'imputation. Vous pouvez choisir d'exclure des variables ayant un pourcentage élevé de valeurs manquantes. Par exemple, si vous spécifiez 50 comme Pourcentage maximum manquant, les variables d'analyse qui contiennent plus de 50% de valeurs manquantes ne sont pas imputées et ne sont pas non plus utilisées comme prédicteurs dans les modèles d'imputation.

Essais maximum : Si des valeurs minimum ou maximum sont spécifiées pour les valeurs imputées des variables d'échelle (voir Min et Max ci-dessus), la procédure essaie de rechercher des valeurs jusqu'à ce qu'elle trouve un ensemble de valeurs dans les limites des plages spécifiées. Si un ensemble de valeurs n'est pas obtenu après avoir atteint le nombre d'essais par observation spécifié, la procédure essaie un autre ensemble de paramètres de modèle et répète la procédure d'essais d'observations. Une erreur se produit si un ensemble de valeurs dans la limite des plages n'est pas obtenu en respectant le nombre d'essais d'observations et de paramètres spécifié.

Veuillez noter que l'augmentation de ces valeurs peut augmenter la durée d'exécution. Si la procédure dure longtemps, ou n'est pas capable de trouver des essais appropriés, vérifiez les valeurs minimum et maximum spécifiées pour vous assurer qu'elles sont appropriées.

Pour spécifier les contraintes pour l'imputation multiple

Cette fonction nécessite l'option Valeurs manquantes.

  1. A partir des menus, sélectionnez :

    Analyser > Imputation multiple > Imputer les données manquantes Valeurs ...

  2. Dans la boîte de dialogue Imputer les valeurs de données manquantes, cliquez sur l'onglet Contraintes.