A la une

Onglet Variables

La boîte de dialogue de validation des données permet de valider vos données. L'onglet Variables affiche les variables de votre fichier. Commencez par sélectionner les variables que vous souhaitez et par les transférer vers la liste des variables d'analyse.

Contrôles de base

Vous pouvez définir des contrôles de base et les appliquer aux variables et aux cas de votre fichier. Par exemple, vous pouvez vous procurer des rapports qui identifient les variables présentant un pourcentage élevé de valeurs manquantes ou de cas vides.

Règles standard et personnalisées

Appliquez des règles aux variables individuelles qui identifient les valeurs non valides, c'est-à-dire les valeurs manquantes ou celles non comprises dans une plage valide. Vous pouvez aussi créer vos propres règles ou des règles inter-variables ou appliquer des règles prédéfinies.

Recommandations

La préparation des données automatique fournit des recommandations et permet aux utilisateurs de les explorer et de les examiner.

Préparez les données automatiquement et en une seule étape

La préparation manuelle des données est un processus complexe et qui demande beaucoup de temps. Si vous avez besoin rapidement des résultats, la procédure ADP vous permet de détecter et de corriger les erreurs de qualité et d'attribuer les valeurs manquantes en une seule opération performante. La fonction ADP fournit un rapport facile à comprendre, accompagné de recommandations et de visualisations complètes qui vous aident à déterminer les données à utiliser dans votre analyse.

Autres options de préparation des données

Exécute des contrôles de données automatiques et élimine les contrôles manuels, longs et fastidieux, grâce à la procédure de validation des données. Cette procédure vous permet d'appliquer des règles pour exécuter des contrôles des données en fonction du niveau de mesure de chaque variable (catégorique ou continu). Vous pouvez alors déterminer la validité des données et supprimer ou corriger librement les cas suspects avant l'analyse.

Regroupez en catégories ou définissez les césures des variables d'échelle

La procédure de regroupement optimal permet d'utiliser avec plus de précision des algorithmes conçus pour les attributs nominaux (par exemple modèles bayésiens naïfs et modèles logit). Le regroupement optimal permet de regrouper en catégories ou de définir les césures des variables d'échelle.

Choisissez entre trois types de regroupement optimal

Choisissez l'un des trois types suivants de regroupement optimal pour traiter préalablement les données avant de créer un modèle. 1) Non supervisé : Créez des casiers avec des effectifs égaux. 2) Supervisé : Prenez en compte la variable cible pour déterminer les césures. Cette méthode est plus précise que la méthode non supervisée, mais elle exige cependant un traitement plus intensif. 3) Approche hybride : Combine les approche non supervisées et supervisées. Cette méthode est particulièrement pratique si vous avez un grand nombre de valeurs distinctes.

Détails techniques

Logiciels requis

IBM SPSS Data Preparation nécessite une licence IBM SPSS Statistics Base en cours de validité.

  • Prérequis : IBM SPSS Statistics

Configuration matérielle

  • Processeur : 2 GHz ou plus
  • Affichage : 1024 x 768 ou plus
  • Mémoire : 4 Go de RAM obligatoire, 8 Go de RAM ou plus recommandés
  • Espace disque : 2 Go ou plus

Voir le fonctionnement

Acheter maintenant et se lancer