Paramètres de corrélation

IBM® SPSS Modeler permet de définir les corrélations à l'aide de libellés descriptives afin de mettre en évidence des relations importantes. La corrélation mesure la force de la relation entre deux champs continus (intervalle numérique). Ses valeurs sont comprises entre –1.0 et 1.0. Les valeurs proches de +1,0 indiquent une association positive forte, de sorte que les valeurs élevées d'un champ sont associées aux valeurs élevées d'un autre champ, et les valeurs faibles du champ aux valeurs faibles de l'autre champ. Les valeurs proches de -1 indiquent une association négative forte, de sorte que les valeurs élevées d'un champ sont associées aux valeurs faibles de l'autre, et inversement. Les valeurs proches de 0,0 indiquent une association faible, de sorte que les valeurs des deux champs sont plus ou moins indépendantes.

A partir de la boîte de dialogue Paramètres de corrélation, vous pouvez contrôler l'affichage des libellés de corrélation, modifier les seuils définissant les catégories et modifier les libellés utilisées pour chaque intervalle. Etant donné que la manière dont vous définissez les valeurs de corrélation dépend essentiellement du type de problème, vous pouvez personnaliser les intervalles et les libellés en fonction de votre situation.

Afficher les libellés de force de corrélation en sortie. Par défaut, cette option est sélectionnée. Désélectionnez-la pour ne pas insérer les libellés descriptifs dans la sortie.

Force de corrélation. Deux options permettent de définir et d'étiqueter la force des corrélations :

  • Définir la force de corrélation par importance (1-p). Applique un libellé aux corrélations en fonction de leur importance, cette dernière étant égale à 1 moins la signification, ou à 1 moins la probabilité que la différence de moyenne ne soit due qu'au hasard. Plus cette valeur est proche de 1, plus la probabilité que les deux champs ne soient pas indépendants (en d'autres termes, qu'une relation existe entre eux) est forte. En général, il est recommandé d'étiqueter les corrélations en fonction de leur importance plutôt qu'en fonction des valeurs absolues, car cela rend compte de la variabilité des données. Par exemple, un coefficient de 0,6 peut s'avérer très significatif dans un le jeu de données et pas du tout dans un autre. Par défaut, les valeurs d'importance comprises entre 0 et 0,9 sont repérées par un libellé Faible, celles entre 0,9 et 0,95 par un libellé Moyen, et celles entre 0,95 et 1 par un libellé Elevé.
  • Définir la force de corrélation par valeur absolue. Applique un libellé aux corrélations en fonction de la valeur absolue du coefficient de corrélation de Pearson, qui, comme indiqué précédemment, est comprise entre -1 et 1. Plus la valeur absolue de cette mesure est proche de 1, plus la corrélation est forte. Par défaut, les corrélations comprises entre 0 et 0,3333 (en valeur absolue) sont repérées par un libellé Faible, celles entre 0,3333 et 0,6666 par un libellé Moyen, et celles entre 0,6666 et 1 par un libellé Elevé. Toutefois, la signification d'une valeur donnée peut difficilement être généralisée d'un ensemble de donnée à un autre. C'est pourquoi, dans la plupart des cas, il est recommandé de définir des corrélations sur la base des probabilités et non des valeurs absolues.