Noeuds Python

SPSS Modeler fournit des noeuds pour utiliser des algorithmes natifs Python. L'onglet Python sur la Palette de noeuds contient les noeuds suivants qui vous permettent d'exécuter des algorithmes Python. Ces noeuds sont pris en charge sous Windows 64, Linux64 et Mac.

Le noeud SMOTE (Minority Over-sampling Technique) fournit un algorithme de suréchantillonnage qui traite les jeux de données déséquilibrés. Il fournit également une méthode avancée d'équilibrage des données. Le noeud du processus SMOTE de SPSS Modeler est mis en oeuvre en Python et nécessite la bibliothèque Python imbalanced-learn.

XGBoost Linear© est une implémentation avancée d'un algorithme de boosting de gradient qui utilise un modèle linéaire comme modèle de base. Les algorithmes de boosting forment les classificateurs faibles de manière itérative et les ajoutent ensuite à un classificateur fort final. Le noeud XGBoost Linear de SPSS Modeler est mis en oeuvre dans Python.

XGBoost Tree est une implémentation avancée d'un algorithme de boosting de gradient qui utilise un modèle d'arbre comme modèle de base. Les algorithmes de boosting forment les classificateurs faibles de manière itérative et les ajoutent ensuite à un classificateur fort final. De par sa souplesse, XGBoost Tree fournit un grand nombre de paramètres qui peuvent beaucoup perturber les utilisateurs, c'est pourquoi le noeud XGBoost Tree de SPSS Modeler expose les principales fonctionnalités et les paramètres les plus couramment utilisés. Ce noeud est mis en oeuvre dans Python.

t-SNE (t-Distributed Stochastic Neighbor Embedding) est un outil permettant de visualiser des données en grande dimension. Il convertit les analogies de points de données en probabilités. Ce noeud t-SNE de SPSS Modeler est mis en oeuvre dans Python et nécessite la bibliothèque Python scikit-learn©.

Un modèle Mixture© de Gauss est un modèle probabiliste qui suppose que tous les points de données sont générés à partir d'un mélange d'un nombre fini de distributions de Gauss avec des paramètres inconnus. On peut penser que les modèles de mélange comme généralisant le clustering k moyenne pour incorporer des informations sur la structure de covariance des données ainsi que les centres des distributions de Gauss latentes. Le noeud Gaussian Mixture de SPSS Modeler expose les principales fonctionnalités et les paramètres les plus couramment utilisés de la bibliothèque Gaussian Mixture. Ce noeud est mis en oeuvre dans Python.

L'estimation de densité par noyau (Kernel Density Estimation ou KDE)© utilise les algorithmes Arbre sphérique ou Arbre KD pour des requêtes efficaces et combine des concepts provenant de l'apprentissage non supervisé, de la création de fonctions et de la modélisation de données. Les approches basées sur les éléments voisins comme l'estimation par la méthode du noyau font partie des techniques d'estimation de la densité les plus populaires et les plus utiles. Les noeuds KDE Modeling et KDE Simulation de SPSS Modeler exposent les principales fonctionnalités et les paramètres les plus couramment utilisés de la bibliothèque KDE. Les noeuds sont mis en oeuvre dans Python.

Le noeud Random Forest utilise une implémentation avancée d'un algorithme de bagging employant un modèle d'arbre comme modèle de base. Ce noeud de modélisation Forest de SPSS Modeler est mis en oeuvre dans Python et nécessite la bibliothèque Python scikit-learn©.

Le noeud SVM à classe unique utilise un algorithme d'apprentissage non supervisé dédié principalement à la détection des nouveautés. Il détecte la limite douce d'un ensemble d'échantillons donné, pour ensuite classifier les nouveaux points comme appartenant à cet ensemble ou pas. Ce noeud de modélisation SVM à classe unique de SPSS Modeler est mis en oeuvre dans Python et nécessite la bibliothèque Python scikit-learn.