gmm 属性
Gaussian Mixture© 模型是一个概率模型,其假定从有限数量的高斯分布和未知参数混合中生成所有数据点。 可以将混合模型认为是广义 K-Means 聚类以包含有关数据的协方差结构以及潜伏高斯分布的中心的信息。 SPSS Modeler 中的高斯混合节点公开了高斯混合库的核心特征和常用参数。 此节点使用 Python 进行实现。
gmm 个属性 |
数据类型 | 属性描述 |
---|---|---|
custom_fields |
BOOLEAN | 此选项用于告知节点使用在此处指定的字段信息,而不是在任何上游类型节点中给出的字段信息。 选择此选项后,根据需要指定以下字段。 |
inputs |
字段 | 这是输入的字段名称。 |
target |
字段 | 目标的一个字段名称。 |
fast_build |
BOOLEAN | 利用多个 CPU 核心以改善模型构建。 |
use_partition |
BOOLEAN | 设置为 True 或 False 以指定是否使用分区数据。 缺省值为 False 。 |
covariance_type |
string | 指定 Full 、Tied 、Diag 或 Spherical 以设置协方差类型。 |
number_component |
整数 | 指定用于混合组件数量的整数。 最小值为 1 。 缺省值为 2 。 |
component_lable |
BOOLEAN | 指定 True 以将集群标签设置为字符串,或者指定 False 以将集群标签设置为数字。 缺省值为 False 。 |
label_prefix |
string | 如果使用字符串集群标签,那么可指定前缀。 |
enable_random_seed |
BOOLEAN | 如果想要使用随机种子,那么指定 True 。 缺省值为 False 。 |
random_seed |
整数 | 如果使用随机种子,那么指定要用于生成随机样本的整数。 |
tol |
double | 指定收敛阈值。 缺省值为 0.000.1 。 |
max_iter |
整数 | 指定要执行的最大迭代次数。 缺省值为 100 。 |
init_params |
string | 设置要使用的初始化参数。 选项为 Kmeans 或 Random 。 |
warm_start |
BOOLEAN | 指定 True 以使用最新拟合的解作为下一个拟合调用的初始化。 缺省值为 False 。 |