Examinez les données depuis différents angles à l'aide de rapports de diagnostic. Déterminez l'étendue des données manquantes et toute valeur extrême grâce à une vue d'ensemble cas-par-cas.
Faites appel à un modèle d'imputation multiple afin de comprendre les schémas et de remplacer les valeurs ; vous pouvez ainsi choisir la méthode la plus adaptée. Utilisez notamment des algorithmes de régression linéaire ou de maximisation des attentes.
Affichez les données manquantes pour tous les cas et toutes les variables. Déterminez les différences entre les groupes avec et sans valeurs manquantes. Evaluez dans quelle mesure les données manquantes pour une variable sont liées à celles d’une autre.