聚类分析

此功能在 SPSS® Statistics Premium Edition 或“直销”选项中可用。

聚类分析是用于揭示数据中的自然分组(或聚类)的探索性工具。例如,它可以根据各种人口统计和购买特征识别不同的客户组。

示例。零售和消费者产品公司定期地对描述客户的购买习惯、性别、年龄、收入水平等的数据应用聚类技术。这些公司为每个消费者群体设计营销和产品开发战略,以增加销售额和建立品牌忠诚度。

聚类分析数据注意事项

数据。此过程既处理连续字段也处理分类字段。每个记录(行)代表要聚类的客户,字段(变量)代表聚类所基于的属性。

记录顺序。 注意,结果可取决于记录顺序。为使顺序的影响降至最低,您可能会考虑随机排序记录。您可能想通过以不同随机顺序排序的记录来多次运行分析,以验证给定解的稳定性。

测量级别。正确指定测量级别是非常重要的,因为它会影响结果计算。

每个字段旁的图标指示当前的测量级别。

表 1. 测量级别图标
  数值(N) 字符串(S) 日期 时间
刻度(连续)
“刻度”图标
n/a
“刻度日期”图标
“刻度时间”图标
有序(O)
“有序”图标
“有序字符串”图标
“有序日期”图标
“有序时间”图标
名义(N)
“名义”图标
“名义字符串”图标
“名义日期”图标
“名义时间”图标

可以在数据编辑器的“变量视图”中更改测量级别(有关详细信息,请参见指定测量级别,或者也可以使用“定义变量属性”对话框为每个字段建议适当的测量级别(有关详细信息,请参见指定测量级别

具有未知测量级别的字段

当数据集中的一个或多个变量(字段)的测量级别未知时,将显示测量级别警告。由于测量级别会影响该过程的计算结果,因此所有变量必须都定义有测量级别。

扫描数据。 读取活动数据集中的数据,并分配缺省测量级别给任何具有当前未知测量级别的字段。如果数据集较大,该过程可能需要一些时间。

手动分配。 打开列出了所有具有未知测量级别的字段的对话框。您可以使用该对话框将测量级别分配给这些字段。您也可以在数据编辑器的变量视图中分配测量级别。

由于测量级别对该过程很重要,因此您无法访问运行该过程的对话框,除非所有字段均定义了测量级别。

获取聚类分析

此功能在 SPSS Statistics Premium Edition 或“直销”选项中可用。

从菜单中选择:

分析 > 直销 > 选择方法

  1. 选择将我的联系人分段到聚类
  2. 选择要用于创建段的分类(名义、有序)字段和连续(刻度)字段。(有关测量级别的更多信息,请参见“数据”部分。)
  3. 单击运行以运行该过程。