Python 节点

SPSS® Modeler 提供了用于使用 Python 本机算法的节点。节点选用板上的 Python 选项卡包含您可用于运行 Python 算法的下列节点。这些节点在 Windows 64、Linux64 和 Mac 上受支持。

合成少数类过采样技术 (Synthetic Minority Over-sampling Technique, SMOTE) 节点提供了用于处理不平衡数据集的过采样算法。它提供了用于均衡数据的高级方法。SMOTE 过程节点在 SPSS Modeler 中使用 Python 进行实现并且需要 imbalanced-learn© Python 库。

XGBoost Linear© 是将线性模型用作基本模型的梯度提升算法的高级实现。提升算法以迭代方式学习弱分类器，然后将它们添加到最终的强分类器中。SPSS Modeler 中的 XGBoost Linear 节点使用 Python 进行实现。

XGBoost Tree© 是将树模型用作基本模型的梯度提升算法的高级实现。提升算法以迭代方式学习弱分类器，然后将它们添加到最终的强分类器中。XGBoost Tree 具有很高的灵活性，并提供了很多对于大多数用户来说过于复杂的参数，因此 SPSS Modeler 中的 XGBoost Tree 节点仅显示了核心功能和常用参数。此节点使用 Python 进行实现。

t-分布随机邻域嵌入 (t-SNE) 是用于可视化高维数据的工具。其将数据点亲缘关系转换为可能性。此 t-SNE 节点在 SPSS Modeler 中使用 Python 进行实现并且需要 scikit-learn© Python 库。

Gaussian Mixture© 模型是一个概率模型，其假定从有限数量的高斯分布和未知参数混合中生成所有数据点。可以将混合模型认为是广义 K-Means 聚类以包含有关数据的协方差结构以及潜伏高斯分布的中心的信息。SPSS Modeler 中的 Gaussian Mixture 节点公开 Gaussian Mixture 库的核心特征和常用参数。此节点使用 Python 进行实现。

Kernel Density Estimation (KDE)© 使用 Ball Tree 或 KD Tree 算法以进行效率查询，并结合无监督学习、特征工程和数据建模等概念。基于相邻元素的方法（例如，KDE）是最流行且最有用的一些密度估算方法。SPSS Modeler 中的 KDE 建模和 KDE 模拟节点公开 KDE 库的核心特征和常用参数。节点使用 Python 进行实现。

单类 SVM 节点使用无监督学习算法。此节点可用于新内容检测。它将检测指定样本集的软边界，以便按是否属于该集合对新点进行分类。此单类 SVM 建模节点在 SPSS Modeler 中使用 Python 进行实现并且需要 scikit-learn© Python 库。