Python-Knoten

SPSS Modeler bietet Knoten zur Verwendung von nativen Python-Algorithmen. Die Registerkarte Python in der Knotenpalette enthält die folgenden Knoten, die Sie zum Ausführen von Python-Algorithmen verwenden können. Die Knoten werden unter Windows (64 Bit), unter Linux (64 Bit) und auf dem Mac unterstützt.

Der Knoten "Synthetic Minority Over-sampling Technique" (SMOTE) stellt einen Oversampling-Algorithmus bereit, um unausgewogene Datasets zu verarbeiten. Er stellt eine erweiterte Methode zur Balancierung von Daten bereit. Der SMOTE-Prozessknoten in SPSS Modeler ist in Python implementiert und erfordert die Python-Bibliothek imbalanced-learn©.

XGBoost Linear© ist eine erweiterte Implementierung eines Gradienten-Boosting-Algorithmus mit einem linearen Modell als Basismodell. Boosting-Algorithmen lernen iterativ schwache Klassifikationsmerkmale und fügen Sie einem endgültigen starken Klassifikationsmerkmal hinzu. Der Knoten "XGBoost Linear" in SPSS Modeler ist in Python implementiert.

XGBoost Tree© ist eine erweiterte Implementierung eines Gradienten-Boosting-Algorithmus mit einem Baummodell als Basismodell. Boosting-Algorithmen lernen iterativ schwache Klassifikationsmerkmale und fügen Sie einem endgültigen starken Klassifikationsmerkmal hinzu. XGBoost Tree ist äußerst flexibel und stellt viele Parameter bereit, die die meisten Benutzer überfordern könnten. Der Knoten "XGBoost Tree" in SPSS Modeler stellt daher nur die zentralen Funktionen und gängigen Parameter dar. Der Knoten ist in Python implementiert.

t-SNE (t-Distributed Stochastic Neighbor Embedding) ist ein Tool zum Visualisieren von hochdimensionalen Daten. Es wandelt Affinitäten von Datenpunkten in Wahrscheinlichkeiten um. Der t-SNE-Knoten in SPSS Modeler ist in Python implementiert und erfordert die Python-Bibliothek scikit-learn©.

Ein gaußsches Mischverteilungsmodell ist ein probabilistisches Modell, das voraussetzt, dass alle Datenpunkte aus einer Mischung einer endlichen Anzahl von gaußschen Verteilungen mit unbekannten Parametern generiert werden. Mischverteilungsmodelle kann man sich als das Verallgemeinern von K-Means-Clustering zum Aufnehmen von Informationen zur Kovarianzstruktur der Daten sowie der Mittelpunkte der latenten gaußschen Verteilungen vorstellen. Der Knoten des gaußschen Mischverteilungsmodells in SPSS Modeler stellt die zentralen Funktionen und häufig verwendeten Parameter der gaußschen Mischverteilungsbibliothek bereit. Der Knoten ist in Python implementiert.

Kernel Density Estimation (KDE) verwendet die Kugelbaum- oder KD-Baumalgorithmen für effiziente Abfragen und kombiniert Konzepte von unbeaufsichtigtem Lernen, Funktionsentwicklung und Datenmodellierung. Auf Nachbarn basierte Ansätze wie KDE sind einige der gängigsten und nützlichsten Dichteschätzungsverfahren. Die KDE-Modellierungs- und KDE-Simulationsknoten in SPSS Modeler stellen die zentralen Funktionen und häufig verwendeten KDE-Bibliotheksparametern bereit. Die Knoten sind in Python implementiert.

Der Random Forest-Knoten verwendet eine erweiterte Implementierung eines Bagging-Algorithmus mit einem Baummodell als Basismodell. Dieser Random Forest-Modellierungsknoten in SPSS Modeler ist in Python implementiert und erfordert die Python-Bibliothek scikit-learn©.

Der Knoten "One-Class SVM" verwendet einen nicht überwachten Lernalgorithmus. Der Knoten kann für die Erkennung von Neuheiten verwendet werden. Er erkennt die flexible Grenze eines angegebenen Stichprobensets und klassifiziert neue Punkte danach, ob sie zu diesem Set gehören. Der Modellierungsknoten "One-Class SVM" in SPSS Modeler ist in Python implementiert und erfordert die Python-Bibliothek scikit-learn©.