gmm 属性

高斯混合节点图标Gaussian Mixture© 模型是一个概率模型,其假定从有限数量的高斯分布和未知参数混合中生成所有数据点。 可以将混合模型认为是广义 K-Means 聚类以包含有关数据的协方差结构以及潜伏高斯分布的中心的信息。 SPSS Modeler 中的高斯混合节点公开了高斯混合库的核心特征和常用参数。 此节点使用 Python 进行实现。

表 1。 gmm 属性
gmm 个属性 数据类型 属性描述
custom_fields BOOLEAN 此选项用于告知节点使用在此处指定的字段信息,而不是在任何上游类型节点中给出的字段信息。 选择此选项后,根据需要指定以下字段。
inputs 字段 这是输入的字段名称。
target 字段 目标的一个字段名称。
fast_build BOOLEAN 利用多个 CPU 核心以改善模型构建。
use_partition BOOLEAN 设置为 TrueFalse 以指定是否使用分区数据。 缺省值为 False
covariance_type string 指定 FullTiedDiagSpherical 以设置协方差类型。
number_component 整数 指定用于混合组件数量的整数。 最小值为 1。 缺省值为 2
component_lable BOOLEAN 指定 True 以将集群标签设置为字符串,或者指定 False 以将集群标签设置为数字。 缺省值为 False
label_prefix string 如果使用字符串集群标签,那么可指定前缀。
enable_random_seed BOOLEAN 如果想要使用随机种子,那么指定 True。 缺省值为 False
random_seed 整数 如果使用随机种子,那么指定要用于生成随机样本的整数。
tol double 指定收敛阈值。 缺省值为 0.000.1
max_iter 整数 指定要执行的最大迭代次数。 缺省值为 100
init_params string 设置要使用的初始化参数。 选项为 KmeansRandom
warm_start BOOLEAN 指定 True 以使用最新拟合的解作为下一个拟合调用的初始化。 缺省值为 False