Découvrez à quoi le monde pense. Rejoignez-nous à Think 2018 | 19-22 mars | Las Vegas
Faites un achat dans Place de marché IBM et obtenez une remise de 500 $ USD sur votre prix en préinscription

En vedette

Onglet Variables

Le dialogue de validation des données sert à valider vos données. L'onglet Variables montre les variables de votre fichier. Commencez par sélectionner les variables que vous voulez, puis déplacez-les vers la liste Analysis Variables.

Vérifications de base

Vous pouvez spécifier les vérifications de base à appliquer aux variables et aux cas dans votre fichier. Par exemple, vous pouvez obtenir des rapports qui identifient les variables avec un pourcentage élevé de valeurs manquantes ou de cas vides.

Règles standards et personnalisées

Appliquez des règles à des variables individuelles qui identifient les valeurs invalides – valeurs à l'extérieur d'une gamme valide ou valeurs manquantes. Vous pouvez aussi créer vos propres règles, des règles de variables croisées ou appliquer des règles prédéfinies.

Recommandations

La préparation automatisée des données fournit des recommandations et permet aux utilisateurs de forer pour les examiner.

Préparez les données en une seule étape – automatiquement

La préparation manuelle des données est un processus long et complexe. Quand vous avez besoin de résultats rapidement, la procédure de préparation automatique des données vous aide à détecter et à corriger les erreurs de qualité, et à imputer les valeurs manquantes en une seule étape. Cette procédure fournit un rapport facile à comprendre avec des recommandations et des visualisations qui vous aident à déterminer les bonnes données à utiliser pour votre analyse.

Autres options pour la préparation des données

Faites des vérifications de données automatiques et éliminez les vérifications manuelles fastidieuses en utilisant la procédure de validation des données. Celle-ci vous permet d'appliquer des règles pour faire des vérifications de données en fonction du niveau de mesure de chaque variable (catégorielle ou continue). Ensuite, déterminez la validité des données et supprimez ou corrigez les cas suspects à votre discrétion avant l'analyse.

Faites un classement ou établissez des seuils pour les variables d'échelle

Avec la procédure de classement optimal, vous pouvez utiliser de façon plus précise les algorithmes conçus pour les attributs nominaux (comme les modèles bayésiens naïfs et logit). Le classement optimal vous permet de classer des variables d'échelle ou d'établir des seuils pour ces variables.

Choisissez parmi trois types de classement optimal

Choisissez l'un de ces types de classement optimal pour le prétraitement des données avant l'élaboration du modèle. 1) Sans supervision : créez des classes avec des nombres égaux. 2) Avec supervision : tenez compte de la variable cible pour déterminer les seuils. Cette méthode est plus exacte que la méthode sans supervision; cependant, elle demande aussi plus de calculs. 3) Approche hybride : combine les approches avec et sans supervision. Cette méthode est particulièrement utile si vous avez une grande quantité de valeurs distinctes.

Renseignements techniques

Exigences logicielles

IBM SPSS Data Preparation exige une licence valide d'IBM SPSS Statistics Base.

  • Logiciel préalable : IBM SPSS Statistics

Exigences matérielles

  • Processeur : 2 GHz ou plus rapide
  • Affichage : 1 024 x 768 ou plus élevé
  • Mémoire : 4 Go de mémoire vive requis, 8 Go recommandés
  • Espace disque : 2 Go ou plus

Voir le fonctionnement

Acheter dès maintenant et commencer