Python 节点

SPSS® Modeler 提供了用于使用 Python 本机算法的节点。 节点选用板 上的 Python 选项卡包含可用于运行 Python 算法的以下节点。 这些节点在 Windows 64、Linux64 和 Mac 上受支持。

合成少数类过采样技术 (Synthetic Minority Over-sampling Technique, SMOTE) 节点提供了用于处理不平衡数据集的过采样算法。 它提供了用于均衡数据的高级方法。 SPSS Modeler 中的 SMOTE 流程节点在 Python 中实现,并且需要 imbalanced-learn© Python 库。
XGBoost Linear© 是将线性模型用作基本模型的梯度提升算法的高级实现。 提升算法以迭代方式学习弱分类器,然后将它们添加到最终的强分类器中。 SPSS Modeler 中的 XGBoost 线性节点是在 Python中实现的。
XGBoost Tree© 是将树模型用作基本模型的梯度提升算法的高级实现。 提升算法以迭代方式学习弱分类器,然后将它们添加到最终的强分类器中。 XGBoost Tree 非常灵活,提供了许多对于大多数用户来说可能是压倒性的参数,因此 SPSS Modeler 中的 XGBoost Tree 节点会公开核心功能和常用参数。 此节点使用 Python 进行实现。
t-分布随机邻域嵌入 (t-SNE) 是用于可视化高维数据的工具。 其将数据点亲缘关系转换为可能性。 SPSS Modeler 中的此 t-SNE 节点是在 Python 中实现的,需要 scikit-learn© Python 库。
Gaussian Mixture© 模型是一个概率模型,其假定从有限数量的高斯分布和未知参数混合中生成所有数据点。 可以将混合模型认为是广义 K-Means 聚类以包含有关数据的协方差结构以及潜伏高斯分布的中心的信息。 SPSS Modeler 中的高斯混合节点公开了高斯混合库的核心功能和常用参数。 此节点使用 Python 进行实现。
Kernel Density Estimation (KDE)© 使用 Ball Tree 或 KD Tree 算法以进行效率查询,并结合无监督学习、特征工程和数据建模等概念。 基于相邻元素的方法(例如,KDE)是最流行且最有用的一些密度估算方法。 SPSS Modeler 中的 KDE 建模和 KDE 模拟节点公开 KDE 库的核心功能和常用参数。 节点使用 Python 进行实现。
随机森林节点使用将树模型作为基本模型的组装算法的高级实现。 SPSS Modeler 中的此随机森林建模节点是在 Python 中实现的,需要 scikit-learn© Python 库。
Hierarchical Density-Based Spatial Clustering (HDBSCAN)© 使用非监督学习来查找数据集的聚类或密集区域。 SPSS Modeler 中的 HDBSCAN 节点公开 HDBSCAN 库的核心功能和常用参数。 此节点以 Python 实现,当您一开始不了解数据集的分组时,可以使用此节点将数据集聚类为不同的组。
单类 SVM 节点使用无监督学习算法。 此节点可用于新内容检测。 它将检测指定样本集的软边界,以便按是否属于该集合对新点进行分类。 SPSS Modeler 中的此单类 SVM 建模节点是在 Python 中实现的,需要 scikit-learn© Python 库。