Vérifications de base de validation des données
L'onglet Vérifications de base vous permet de sélectionner les vérifications de base pour les variables d'analyse, les identificateurs d'observations ainsi que les observations complètes.
Variables d'analyse: Si vous avez sélectionné des variables d'analyse dans l'onglet Variables, vous pouvez sélectionner la ou les vérifications suivantes correspondant à leur validité. La case à cocher vous permet d'activer ou de désactiver les vérifications.
- Pourcentage maximal de valeurs manquantes : Répertorie les variables d'analyse dont le pourcentage de valeurs manquantes est supérieur à la valeur indiquée. La valeur indiquée doit être un nombre positif inférieur ou égal à 100.
- Pourcentage maximal d'observations dans une catégorie unique : Lorsque des variables d'analyse sont catégorielles, cette option répertorie alors les variables d'analyse catégorielles dont le pourcentage d'observations représentant une catégorie unique non manquante est supérieur à la valeur indiquée. La valeur indiquée doit être un nombre positif inférieur ou égal à 100. Le pourcentage est basé sur des observations n'ayant pas de valeur manquante de la variable.
- Pourcentage maximal de catégories dont l'effectif est 1 : Lorsque des variables d'analyse sont catégorielles, cette option répertorie alors les variables d'analyse catégorielles dont le pourcentage des catégories des variables contenant une seule observation est supérieur à la valeur indiquée. La valeur indiquée doit être un nombre positif inférieur ou égal à 100.
- Coefficient de variation minimum : Lorsque des variables d'analyse sont mesurées sur une échelle, cette option répertorie les variables d'analyse d'échelle dont la valeur absolue du coefficient de variation est inférieure à la valeur indiquée. Cette option ne s'applique qu'aux variables dont la moyenne n'est pas nulle. La valeur indiquée doit être un nombre non-négatif. Pour désactiver le coefficient de vérification de la variation, tapez 0.
- Ecart type minimum : Lorsque des variables d'analyse sont mesurées sur une échelle, cette option répertorie les variables d'analyse d'échelle dont l'écart type est inférieur à la valeur indiquée. La valeur indiquée doit être un nombre non-négatif. Pour désactiver la vérification de l'écart type, tapez 0.
Identificateurs d'observations : Si vous avez sélectionné des variables d'identificateurs d'observations dans l'onglet Variables, vous pouvez sélectionner la ou les vérifications suivantes correspondant à leur validité.
- Repérer les ID incomplets : Cette option répertorie les observations dont les identificateurs d'observations sont incomplets. Pour une observation donnée, un identificateur est considéré comme incomplet lorsque la valeur de toute variable ID est vide ou manquante.
- Repérer les ID dupliqués : Cette option répertorie les observations dont les identificateurs d'observations sont dupliqués. Les identificateurs incomplets sont exclus de l'ensemble de doublons possibles.
Repérer les observations vides : Cette option répertorie les observations dont toutes les variables sont vides ou nulles. Pour identifier des observations vides, vous pouvez utiliser toutes les variables du fichier (à l'exception des variables ID) ou seulement les variables d'analyse définies sur l'onglet Variables.
Spécification des vérifications de base
- A partir des menus, sélectionnez :
- Dans la boîte de dialogue Valider des données, cliquez sur l'onglet Vérifications de base.