Noeud t-SNE

t-SNE (t-Distributed Stochastic Neighbor Embedding) est un outil permettant de visualiser des données en grande dimension. Il convertit les analogies de points de données en probabilités. Les analogies de l'espace initial sont représentées par des probabilités jointes de Gauss et les analogies de l'espace intégré sont représentées par des lois t de Student. Cela rend t-SNE particulièrement sensible à la structure locale et présente d'autres avantages par rapport aux techniques existantes : ¹

Indique la structure à plusieurs échelles sur une seule mappe
Révèle les données stockées dans plusieurs collecteurs ou clusters différents
Réduit l'agglomération de points au centre

Le noeud t-SNE de SPSS Modeler est mis en oeuvre dans Python et nécessite la bibliothèque Python scikit-learn©. Pour plus d'informations sur t-SNE et la bibliothèque scikit-learn, voir :

L'onglet Python sur la Palette de noeuds contient ce noeud et d'autres noeuds Python. Le noeud t-SNE est également disponible dans l'onglet Graphiques.

¹ Références :

van der Maaten, L.J.P.; Hinton, G. "Visualizing High-Dimensional Data using t-SNE." Journal of Machine Learning Research. 9:2579-2605, 2008.

van der Maaten, L.J.P. "t-Distributed Stochastic Neighbor Embedding."

van der Maaten, L.J.P. "Accelerating t-SNE using Tree-Based Algorithms." Journal of Machine Learning Research. 15(Oct):3221-3245, 2014.