K 均值聚类分析有效性
K 平均值聚类分析命令是非常有效的,主要因为它不像许多聚类算法(包括系统聚类命令使用的算法)那样计算所有个案对之间的距离。
为获得最佳有效性,可取一个个案样本并选择迭代和分类方法确定聚类中心。 选择最终聚类中心另存为。 然后恢复整个数据文件并选择仅分类作为方法,并选择读取初始聚类中心来源以使用该样本估计的中心对整个文件分类。 您可以写入和读取文件或数据集。 可以在同一会话中继续使用数据集,但不会将其另存为文件,除非在会话结束之前明确将其保存为文件。 数据集名称必须符合变量命名规则。 请参阅变量名称主题以获取更多信息。