Nodos Python

SPSS Modeler ofrece nodos para utilizar algoritmos nativos Python. La pestaña Python de la Paleta de nodos contiene los nodos siguientes que puede utilizar para ejecutar algoritmos Python. Estos nodos se soportan en Windows 64, Linux64 y Mac.

El nodo SMOTE (Synthetic Minority Over-sampling Technique) proporciona un algoritmo de sobremuestreo para tratar con conjuntos de datos desequilibrados. Proporciona un método avanzado para equilibrar datos. El nodo de proceso SMOTE en SPSS Modeler se implementa en Python y necesita la biblioteca de Python imbalanced-learn©.

XGBoost Linear© es una implementación avanzada de un algoritmo de aumento de gradiente con un modelo lineal como modelo base. Los algoritmos de aumento conocen de forma iterativa los clasificadores débiles y, a continuación, los añaden a un clasificador fuerte final. El nodo XGBoost Linear en SPSS Modeler se implementa en Python.

XGBoost Tree© es una implementación avanzada de un algoritmo de aumento de gradiente con un modelo de árbol como modelo base. Los algoritmos de aumento conocen de forma iterativa los clasificadores débiles y, a continuación, los añaden a un clasificador fuerte final. XGBoost Tree es muy flexible y proporciona muchos parámetros que pueden ser abrumadores para la mayoría de usuarios, de modo que el nodo XGBoost Tree en SPSS Modeler expone las características principales y los parámetros utilizados comúnmente. El nodo se implementa en Python.

t-SNE (vecino estocástico con t distribuida incorporado) es una herramienta para visualizar datos de alta dimensión. Convierte afinidades de puntos de datos a probabilidades. Este nodo t-SNE en SPSS Modeler se implementa en Python y requiere la biblioteca scikit-learn© Python.

Un modelo de Gaussian Mixture© es un modelo probabilístico que presupone que todos los puntos de datos se generan a partir de una mezcla de un número finito de distribuciones gausianas con parámetros desconocidos. Se puede pensar que los modelos de mezcla son generalizadores de la agrupación en clúster de k-medias para incorporar información sobre la estructura de covarianzas de los datos, así como los centros de valores gausianos latentes. El nodo de mezcla gausiana en SPSS Modeler expone las características principales y los parámetros utilizados con más frecuencia de la biblioteca de la mezcla gausiana. El nodo se implementa en Python.

La estimación de densidad de kernel (KDE)© utiliza los algoritmos del árbol de métrica o del árbol KD para unas consultas eficientes y combina los conceptos de aprendizaje no supervisado, ingeniería de características y modelado de datos. Los enfoques basados en vecinos como, por ejemplo, KDE, son algunas de las técnicas de estimación de densidad más populares y útiles. Los nodos de modelado de KDE y simulación de KDE en SPSS Modeler exponen las características principales y los parámetros utilizados con más frecuencia de la biblioteca KDE. Los nodos se implementan en Python.

El nodo Bosque aleatorio utiliza una implementación avanzada de un algoritmo de agregación autodocimante con un modelo de árbol como modelo base. Este nodo de modelado de bosque aleatorio en SPSS Modeler se implementa en Python y requiere la biblioteca scikit-learn© Python.

El nodo SVM de una clase utiliza un algoritmo de aprendizaje no supervisado. El nodo se puede utilizar para la detección de novedad. Detectará el límite flexible de un conjunto de muestras proporcionado, para clasificar a continuación los puntos nuevos como pertenecientes o no a dicho conjunto. Este nodo de modelado SVM de una clase en SPSS Modeler se implementa en Python y necesita la biblioteca scikit-learn© de Python.