Exemple : Matrice de nuage de points (SPLOM)
Nous allons créer une matrice de diagramme de dispersion de plusieurs variables différentes afin de déterminer s'il existe des relations entre les variables du jeu de données.
Remarque : Cet exemple utilise customer_subset.
- Ajoutez un noeud Représentation graphique et ouvrez-le pour le modifier.
- Dans l'onglet Base, sélectionnez Age en années, Revenu du ménage en milliers et Dette de la carte de crédit en milliers . (Utilisez la combinaison Ctrl+clic pour sélectionner plusieurs champs/variables.)
- Sélectionnez SPLOM.
- Cliquez sur Exécuter.
- Agrandissez la fenêtre de sortie afin de voir la matrice plus distinctement.

Nous pouvons remarquer que :
- Les histogrammes affichés sur la diagonale montrent la répartition de chaque variable dans la SPLOM. L'histogramme de l'âge apparaît dans la cellule en haut à gauche, celui du revenu dans la cellule du centre, et celui de la dettcred dans la cellule en bas à droite. Aucune des variables ne semble être distribuée normalement. Autrement dit, aucun histogramme ne ressemble à une courbe en cloche. Notez en outre que les histogrammes du revenu et de la dettcred sont asymétriques.
- Il ne semble pas y avoir de relation entre l'âge et les autres variables.
- il existe une relation linaire entre le revenu et la dettcred. En effet, la dettcred augmente à mesure que le revenu augmente. Vous pouvez créer des diagrammes de dispersion individuels de ces variables et des autres variables liées pour étudier les relations plus en détails.