Python 节点

SPSS® Modeler 提供了用于使用 Python 本机算法的节点。节点选用板上的 Python 选项卡包含可用于运行 Python 算法的以下节点。这些节点在 Windows 64、Linux64 和 Mac 上受支持。

合成少数类过采样技术 (Synthetic Minority Over-sampling Technique, SMOTE) 节点提供了用于处理不平衡数据集的过采样算法。它提供了用于均衡数据的高级方法。 SPSS Modeler 中的 SMOTE 流程节点在 Python 中实现，并且需要 imbalanced-learn© Python 库。

XGBoost Linear© 是将线性模型用作基本模型的梯度提升算法的高级实现。提升算法以迭代方式学习弱分类器，然后将它们添加到最终的强分类器中。 SPSS Modeler 中的 XGBoost 线性节点是在 Python中实现的。

XGBoost Tree© 是将树模型用作基本模型的梯度提升算法的高级实现。提升算法以迭代方式学习弱分类器，然后将它们添加到最终的强分类器中。 XGBoost Tree 非常灵活，提供了许多对于大多数用户来说可能是压倒性的参数，因此 SPSS Modeler 中的 XGBoost Tree 节点会公开核心功能和常用参数。此节点使用 Python 进行实现。

t-分布随机邻域嵌入 (t-SNE) 是用于可视化高维数据的工具。其将数据点亲缘关系转换为可能性。 SPSS Modeler 中的此 t-SNE 节点是在 Python 中实现的，需要 scikit-learn© Python 库。

Gaussian Mixture© 模型是一个概率模型，其假定从有限数量的高斯分布和未知参数混合中生成所有数据点。可以将混合模型认为是广义 K-Means 聚类以包含有关数据的协方差结构以及潜伏高斯分布的中心的信息。 SPSS Modeler 中的高斯混合节点公开了高斯混合库的核心功能和常用参数。此节点使用 Python 进行实现。

Kernel Density Estimation (KDE)© 使用 Ball Tree 或 KD Tree 算法以进行效率查询，并结合无监督学习、特征工程和数据建模等概念。基于相邻元素的方法（例如，KDE）是最流行且最有用的一些密度估算方法。 SPSS Modeler 中的 KDE 建模和 KDE 模拟节点公开 KDE 库的核心功能和常用参数。节点使用 Python 进行实现。

Hierarchical Density-Based Spatial Clustering (HDBSCAN)© 使用非监督学习来查找数据集的聚类或密集区域。 SPSS Modeler 中的 HDBSCAN 节点公开 HDBSCAN 库的核心功能和常用参数。此节点以 Python 实现，当您一开始不了解数据集的分组时，可以使用此节点将数据集聚类为不同的组。

单类 SVM 节点使用无监督学习算法。此节点可用于新内容检测。它将检测指定样本集的软边界，以便按是否属于该集合对新点进行分类。 SPSS Modeler 中的此单类 SVM 建模节点是在 Python 中实现的，需要 scikit-learn© Python 库。