K-Means-AS 节点

K-Means 是最常用的聚类算法之一。 它将数据点聚集成多个预定义聚类。 SPSS Modeler 中的 K-Means-AS 节点在 Spark 中实现。

有关 k-means 算法的更多信息,请参阅 聚类.1

注意:K-Means-AS 节点会自动对分类变量进行单次编码。

1 "聚类 - 基于 RDD 的 API" Apache Spark. MLlib: Main Guide。 2024 年 8 月。