Qu'est-ce qu'IBM SPSS Data Preparation ?

IBM® SPSS® Data Preparation met en œuvre des techniques avancées pour rationaliser l'étape de préparation des données, ce qui permet de fournir des résultats d'analyse de données plus rapides et plus précis. Choisissez une procédure automatisée de préparation des données pour des résultats rapides ou sélectionnez d'autres méthodes pour préparer des ensembles de données plus compliqués. Identifiez facilement les cas, les variables et les valeurs de données suspects ou non valides. Visualisez les modèles de données manquantes, résumez les distributions de variables et travaillez plus précisément avec des algorithmes conçus pour des attributs nominaux.

Ce module est inclus dans l'édition SPSS Professional pour les environnements sur site et dans l'édition de base pour les plans d'abonnement.

Gros plans sur les fonctions

Onglet de variables

La boîte de dialogue de validation des données permet de valider vos données. L'onglet de variables affiche les variables de votre fichier. Commencez par sélectionner les variables que vous souhaitez et déplacez-les vers la liste des variables d'analyse.

Vérifications de base

Vous pouvez définir des vérifications de base et les appliquer aux variables et aux cas de votre fichier. Par exemple, vous pouvez vous procurer des rapports qui identifient les variables présentant un pourcentage élevé de valeurs manquantes ou de cas vides.

Règles standard et personnalisées

Appliquez des règles à des variables individuelles qui identifient des valeurs non valides, c'est-à-dire des valeurs en dehors d'une plage valide ou des valeurs manquantes. Vous pouvez aussi créer vos propres règles, établir des règles par recoupement des variables ou appliquer des règles prédéfinies.

Recommandations

La préparation automatique des données (ADP) fournit des recommandations et permet aux utilisateurs de les explorer et de les examiner.

Préparation des données en une seule étape et automatiquement

La préparation manuelle des données est un processus complexe et qui demande beaucoup de temps. Lorsque vous avez besoin de résultats rapidement, la procédure ADP vous aide à détecter et à corriger les erreurs de qualité et à imputer les valeurs manquantes en une seule étape efficace. La fonction ADP fournit un rapport facile à comprendre, accompagné de recommandations et de visualisations complètes qui vous aident à déterminer les données à utiliser dans votre analyse.

Autres options de préparation des données

Exécutez des contrôles de données automatiques et éliminez les contrôles manuels, longs et fastidieux, grâce à la procédure de validation des données. Cette procédure vous permet d'appliquer des règles pour effectuer des vérifications de données en fonction du niveau de mesure de chaque variable, qu'elle soit nominale ou continue. Vous pouvez ensuite déterminer la validité des données et supprimer ou corriger librement les cas suspects avant l'analyse.

Accès à une gamme de fonctions

SPSS Data Preparation comprend des fonctions telles que la validation des données, la préparation automatisée des données, le regroupement optimal et l'identification des cas inhabituels.

Compartimentage ou définition de points de découpage des variables d'échelle

Avec la procédure de compartimentage optimale, vous pouvez utiliser avec plus d'exactitude les algorithmes conçus pour les attributs nominaux, tels que Naive Bayes et les modèles logit. Le compartimentage optimal vous permet de compartimenter ou de définir des points de découpage pour des variables d'échelle.

Choisissez entre trois types de compartimentage optimal

Choisissez l'un de ces types de compartimentage optimal pour le prétraitement des données avant la création du modèle : 1) Méthode non supervisée : crée des compartimentages avec des montants égaux.
2) Méthode supervisée : prend en compte la variable cible pour déterminer les points de découpage. Cette méthode est plus précise que la méthode non supervisée, mais elle est également plus intensive en termes de calcul.
3) Méthode hybride : combine les méthodes non supervisée et supervisée. Cette méthode est particulièrement utile si vous disposez d'une grande quantité de valeurs distinctes.

Images des produits

Informations techniques

Comment acheter SPSS Data Preparation

  • Pour les environnements sur site : Acheter l'édition professionnelle
  • Pour les plans d'abonnement : Acheter l'édition de base

Configuration matérielle requise

  • Processeur : 2 GHz ou plus
  • Affichage : 1024*768 ou plus
  • Mémoire : 4 Go de RAM obligatoires, 8 Go de RAM ou plus recommandés
  • Espace disque : 2 Go au minimum

Next Steps

Essayer gratuitement SPSS Statistics

Acheter maintenant pour démarrer aujourd'hui