Valeurs manquantes
De nombreux fichiers de données contiennent une certaine quantité de données manquantes. De nombreux facteurs peuvent être à l'origine des données manquantes. Par exemple, il arrive que des répondants ne répondent pas à chaque question, que certaines variables ne soient pas applicables à certaines observations et que des erreurs de codification aboutissent à la suppression de certaines valeurs.
Il existe deux types de valeurs manquantes dans IBM® SPSS® Statistics:
- Manquantes utilisateur. Valeurs définies comme contenant des données manquantes. Des libellés de valeurs peuvent être affectés à ces valeurs pour identifier la raison de l'absence des données (par exemple, le code 99 et le libellé de valeur Sans objet pour la grossesse chez les hommes).
- Manquantes système. Si aucune valeur n'est présente pour une variable numérique, la valeur système manquante lui est affectée. Ceci est indiqué par un point dans la vue de données de l'éditeur de données.
Un ensemble de fonctionnalités permet de compenser les effets des données manquantes et d'analyser le motif de ces dernières. Cette section, cependant, a un objectif beaucoup plus simple: décrire comment les tableaux personnalisés traitent les données manquantes et comment les données manquantes affectent le calcul des statistiques récapitulatives.
Fichier de données d'exemple
Les exemples de cette section utilisent le fichier de données missing_values.sav. Pour plus d'informations, voir la rubrique Exemples de fichiers . Il s'agit d'un fichier extrêmement simple et complètement artificiel, comportant une seule variable et dix observations, conçu pour illustrer les concepts de base des valeurs manquantes.