Préparation des données pour l'analyse

La définition de la valeur de départ aléatoire vous permet de répliquer la sélection aléatoire des observations dans cette analyse. Si vous ne répliquez pas une analyse, il n'est généralement pas nécessaire de définir la valeur de départ.

  1. Pour définir la valeur de départ aléatoire, dans les menus, sélectionnez:

    Transformer > Générateurs de nombres aléatoires ...

    Figure 1 : Boîte de dialogue Valeur de départ de nombre aléatoire
    Boîte de dialogue Valeur de départ de nombre aléatoire
  2. Sélectionnez Définir le point de départ.
  3. Sélectionnez Valeur fixe et entrez 9191972 comme valeur
  4. Cliquez sur OK.
  5. Pour créer la variable de sélection pour la validation, dans les menus, sélectionnez:

    Transformer > Calculer la variable ...

    Figure 2. Boîte de dialogue Calculer la variable
    Boîte de dialogue Calculer la variable
  6. Entrez training dans la zone de texte Variable cible.
  7. Entrez rv.bernoulli(0.7) dans la zone de texte Expression numérique.

    Cette option permet de définir les valeurs d' apprentissage à générer de manière aléatoire des variables Bernoulli avec le paramètre de probabilité 0.7. Ainsi, 70% des 700 clients précédents seront sélectionnés dans l'échantillon de formation.

    Vous avez uniquement l'intention d'utiliser la formation avec des cas pouvant être utilisés pour créer le modèle, c'est-à-dire des clients précédents. Cependant, il existe 150 cas correspondant à des clients potentiels dans le fichier de données. Afin d'éviter toute confusion, vous devez vous assurer que les observations dont la valeur manquante est default ne sont pas "affectées" aux échantillons d'apprentissage ou de test.

  8. Pour effectuer le calcul uniquement pour les clients précédents, cliquez sur Si.
    Figure 3 Boîte de dialogue Cas d'observations
    Boîte de dialogue Cas d'observations
  9. Sélectionnez Inclure lorsque l'observation remplit la condition :
  10. Entrez MISSING(default) = 0 comme expression conditionnelle.

    Cela permet de s'assurer que la formation est uniquement calculée pour les observations avec des valeurs non manquantes pour default, c'est-à-dire pour les clients ayant précédemment reçu des prêts.

  11. Cliquez sur Continuer.
  12. Cliquez sur OK dans la boîte de dialogue Calculer la variable.

Environ 70% des clients ayant déjà reçu des prêts auront une valeur de formation de 1. Ces clients seront utilisés pour créer le modèle. Les autres clients auxquels des prêts ont été accordés précédemment seront utilisés pour valider les résultats du modèle.

Suivant