使用 SPSS Statistics 直接营销分析获得洞察

使用 RFM 分析客户历史记录

了解如何使用 IBM® SPSS® Statistics 的 Direct Marketing 模块的 RFM 分析流程。通过使用该流程,非技术性用户可以分析他们的客户数据。本文面向开始使用 SPSS Statistics、希望进军预测分析领域并最终在商业环境中进入大数据领域的任何人。

David Gillman, 服务总监, Data Sooner

David Gillman 的照片David Gillman 在商业智能、数据挖掘和预测分析领域工作了 20 年。他拥有应用数学、优化和统计分析的教育背景,专攻这些技术在商用活动上的应用。他在通过应用分析改进经销、制造、零售和食宿行业中各种规模组织的业务运营方面拥有实战经验。



2013 年 3 月 05 日

简介

对客户进行分组是一种自然趋势。公司希望知道哪些客户是他们的最佳客户、哪些客户是最差客户、谁具有潜力、谁是新客户,等等。市场营销和销售部门会定期且经常这么做。他们的目标是扩大有限的工作,以实现最大的回报(在本例中为销售额)。

分类和分组客户可能是人类本性和业务运营的一项自然功能,但做好它是一个研究、讨论和实践主题。内置于 IBM SPSS Statistics 中的向导中的一种分类模型是最新性、频率和货币价值 (RFM) 分类。RFM 是一种基于客户行为来将其分组的久经考验且广泛使用的方法。在按 RFM 分数进行分组时,会对客户列表进行快速扫描,该扫描可表明哪些是最佳客户,哪些是较差或已失去的客户。

RFM 建模不是细分客户的惟一方式,也不一定是最佳方式。但是,它是一种细分客户的好方法,任何人都可以很容易地理解它并迅速将它投入使用。

知道您的客户的分组方式很有用。您可以使用该信息预测客户在不久的将来的行为。监视各个客户的 RFM 分数随时间的变化甚至更有用。使用该知识,您可更改业务流程,从而最大限度地延长客户的生命周期。而且您可以从 SPSS Statistics 的一个易于使用的向导中逐步收集此信息。


RFM 模型

如果您不在市场营销部门,那么您可能没有听说过 RFM 细分。不用担心,它很容易理解:

  • 最新性

    最新性 指一位客户在多久以前下了他的上一个订单。使用这个度量指标是因为,在许多情形中,事实表明,与最近下订单的客户相比,在很久以前下上一个订单的客户再次订购的几率要小得多。

  • 频率

    频率 指一个客户在其一生中向您订购产品的次数。使用这个度量指标是因为,与向您订购多次的客户相比,仅向您订购一次产品的客户再次订购产品的几率要小得多。频率的概念有时稍有不同。审核和检查您的运营情况后,您可能得出一个稍微不同的频率 定义。例如,您可能使用每年的订单数而不是整个生命周期的订单数。另一种变体是在频率计算中仅使用高于一定价值的订单数(消除小订单和一些客户通过下很多小订单带来的影响,这改善了处理、交付和应收款成本)。

  • 货币价值

    货币价值 指客户的价值。大多数 RFM 分析使用了整个客户生命周期中的收入总额或净利润。您使用何种度量指标取决于您公司中的领导人员的观点。也可以采用其他方式来定义货币价值。使用每个订单的净利润可能会改变结果。了解一个客户在不同货币价值指标之间的排名差异是很有用的。

在定义了 R、FM 后,让我们看一下该模型。

将每个类别(R、F 或 M)视为一个基于度量指标值的有序客户列表。将该有序列表划分为相等的部分,通常 3 个或 5 个列表项组成一组,但也可以使用任意数量。例如,最常订购的客户将获 1 分(总共 5 分);仅订购一次的客户将获得 5 分(总共 5 分)。

对其他度量指标使用相同的评分系统。然后每个客户就有了一个由 3 个数组成的分数,比如 114、352 或 445。在默认的 SPSS Statistics 案例中,每个数字越低越好。尽管结果很简单,但许多行业使用 RFM 模型进行了快速且强大的细分。RFM 建模最初来源于直接营销行业(想想邮购目录)。邮购目录的当前等效方式是电子商务。公司使用 RFM 建模来发送有针对性的促销消息,让客户回到其站点上,并通过电子邮件保持知名度。

使用 RFM 的另一个变种的行业是 B2B 经销。这里,一个企业可使用有关客户的知识来确定价格表,从而为更活跃且更有价值的客户提供更多折扣。也可以使用最新性快速了解好的客户何时停止订购,然后准备一条促销消息来吸引他们回来。


使用 RFM 进行历史分析

RFM 模型是一个时间点快照。对比一段时间内的多个模型是一种对客户生命周期进行建模的方式。

通过查看客户在其生命周期内在不同 RFM 类别间的流动方式,可以为市场营销和销售人员提供客户行为的诸多洞察。一些跟踪数据通常是可见的。了解不同类型的客户如何在 RFM 模型中不断移动,这为调整业务流程、制定市场营销信息或将直接销售人员调遣到影响最大的位置提供了基础。

例如,您可能已注意到,一个行业中的新客户最开始的 RFM 分数为 153(如果总分为 5,这表明他们是最新的、不频繁的和具有中等价值的客户)。客户下一步要做的可能是提高 RFM 分数 122:

接下来,您可能会看到一些分化。一些客户的 RFM 分数降低,而另一些客户的分数则升高了。确定这些客户之间的区别有助于设计更有效的促销消息、激励计划或服务计划,让更多客户获得更好的分数。

在每次运行模型时使用一个数据表来记录每个客户的 RFM 分数,这是实现此目的的最简单的方法。


其他细分建模技术

在详细介绍如何使用 SPSS Statistics 向导创建 RFM 模型之前,让我们介绍一下此工具中其他一些细分客户的方式。您可能已想到,有许多对客户进行分组的方法,而且 SPSS Statistics 支持许多用于完成该任务的统计流程。单击 Analyze 菜单,您可看到多个通用的统计分析类别,其中包括一个标为 Classify 的类别(参见 图 1)。

图 1. 展开的 Classify 子菜单
展开的 Classify 子菜单

(查看 图 1 的放大版。)

Classify 子菜单显示了可用的主要算法。在创建客户的自定义细分模型时,这些更高级的选项会很有用。但是,他们的有效使用需要矢量的统计知识水平,而且事实上,在调整它们以满足组织和您拥有的数据的需求时,您需要掌握这个流程。


SPSS Statistics 中的 RFM 分析

我们开始工作吧。在进入 SPSS Statistics 之前,您需要收集数据,可以从交易系统提取数据。您需要的数据类型和查询的低复杂性可能会让您大吃一惊。使用一些返回交易数量、总金额和截至当日的最高价值等的基本查询,收集以下方面的数据:

  • 客户编号或其他惟一标识符;
  • 每位客户的上一次订购日期;
  • 该客户完成的交易数量;以及
  • 该客户带来的总收入。

前面已经提到过,您可以为每位客户的交易数量和总收入使用其他定义。但上面的列表是一个不错的起点。

在收集数据后,这些数据可能类似于 图 2。在此示例中,数据位于一个电子表格中,但也可对它使用其他格式。只需确保 SPSS Statistics 可以读取该文件类型即可。

图 2. 电子表格中的数据文件的示例
电子表格中的数据文件的示例

(查看 图 2 的放大版。)

在收集了数据文件后,就可以开始分析了:

  1. 启动 SPSS Statistics,然后连接到数据文件。

    您会看到熟悉的 Data Editor 窗口中已经填入了客户文件,如 图 3 所示。

    图 3. 数据文件现在已经在 SPSS Statistics Data Editor 窗口中
    数据文件现在已经在 SPSS Statistics Data Editor 窗口中

    (查看 图 3 的放大版。)

  2. 单击 Direct Marketing > Choose Technique

    Direct Marketing 窗口会出现(参见 图 4)。

    图 4. 图 4. Direct Marketing 窗口
    Direct Marketing 窗口
  3. 双击 Help identify my best contacts (RFM Analysis)
  4. RFM Analysis: Data Format 窗口中(参见 图 5),选择 Customer data,然后单击 Continue
    图 5. 数据组织选项
    该图显示了数据组织选项

    此时将会出现包含多个选项卡的 RFM Analysis from Customer Data 窗口,可在其中指定 RFM 建模流程的所有参数。

  5. 单击 Variables 选项卡,如 图 6 所示。

    这个选项卡包含 4 个数据元素,必须定义它们,然后 RFM 建模流程才能工作。您必须告诉 SPSS Statistics,输入数据中的哪个变量(想想电子表格中的列)可转换为上一次交易的日期、交易数量和金额。

    图 6. 定义 RFM 建模的数据元素
    定义 RFM 建模的数据元素
  6. 建立数据变量与建模输入变量的映射关系之后,需要提供一个标识符,以便模型可以为每个客户提供一个分数。对于该示例,需要指定电子表格中的 Customer ID 字段(参见 图 7)。
    图 7. 指定 Customer ID 字段
    指定 Customer ID 字段
  7. 单击 Binning 选项卡,然后选择您希望 RecencyFrequencyMonetary 列表包含的容器数量。

    Binning 指出了您希望每个度量指标有多少个容器或分区。每个度量指标的默认值为 5,这是常用的实际数量。为了简便起见,我将我的示例调整为使用 3(参见 图 8)。

    图 8. 在 Binning 选项卡上选择分区数量
    在 Binning 选项卡上选择您想要的分区数量

    确定您需要的容器数量

    确定您应使用多少个分区可能比较难。如果分区太多(9 个或更多),则需要创建许多的分数,这会导致人们很难理解模型。如果分区太少,那么模型将没有意义。

    常见的做法是使用一个奇数,但我并不了解这样做的合理解释。无论如何,使用一个奇数会创建一个中间类别,可将两头的类别与它进行对比。这种解释不是权威性的,但我通常仍会遵循使用奇数的习惯。

  8. Binning Method 区域中,适当地选择 NestedIndependent

    您选择的选项会调整人们在频率和货币价值分数中的位置。一种方法不一定比另一种方法好。为差异制定一个流程图,并与业务用户和决策者探讨该过程,这是制定决断的最佳方式。在制定了使用方法方面的决策之后,要在以后的建模中坚持使用它,从而使得对不同时刻的对比保持有效。

  9. 单击 Save 选项卡。
  10. 选择在何处写入模型输出(参见 图 9)。在本示例中,使用了默认的 output.sav

    我通常在 Location 区域中选择 Write a new data file,然后单击 Browse 指定一个新文件。此文件的惟一格式为原生的 SPSS Statistics .sav 格式。

    图 9. 保存输出
    该图显示了如何保存输出
  11. 单击 Output 选项卡,如 图 10 所示。

    此选项卡控制了在 SPSS Statistics Viewer 中显示的输出。此选项卡上的选择和更改不会影响您在 Save 选项卡上指定的输出文件。

    图 10. Output 选项卡
    该图显示了 Output 选项卡
  12. 单击 OK 以运行 RFM 模型。

    在运行建模过程后,Data Editor 中的输出数据将类似于 图 11

    图 11. SPSS Statistics Data Editor 窗口中的 output.sav 文件
    SPSS Statistics Data Editor 窗口中的 output.sav 文件

    (查看 图 11 的放大版。)

建模流程完成后,SPSS Statistics Viewer 会显示一些窗口,类似于 图 12图 13图 14。您必须使用 Data Editor 窗口单独访问输出数据文件。

图 12. RFM 建模流程得到的 SPSS Statistics Viewer 屏幕(第 1 个,共 3 个)
RFM 建模流程得到的 SPSS Statistics Viewer 屏幕(第 1 个,共 3 个)

(查看 图 12 的放大版。)

图 13. RFM 建模流程得到的 SPSS Statistics Viewer 屏幕(第 2 个,共 3 个)
RFM 建模流程得到的 SPSS Statistics Viewer 屏幕(第 2 个,共 3 个)

(查看 图 13 的放大版。)

图 14. RFM 建模流程得到的 SPSS Statistics Viewer 屏幕(第 3 个,共 3 个)
RFM 建模流程得到的 SPSS Statistics Viewer 屏幕(第 3 个,共 3 个)

(查看 图 14 的放大版。)

使用查看器窗口中的图表和曲线图向分析师和业务决策者传达该模型呈现的数据。这些窗口还包含每个输入变量指标的均值和标准偏差。您还可以考虑为您的受众创建自己的曲线图和表格。

注意:可以将 output.sav 文件保存为其他格式,然后将它集成到查询和数据库中,以便在不同应用程序中提供客户的 RFM 分数。


频繁地重复

一个 RFM 模型是从今天的角度看,您客户过去的行为的快照。不断运行该模型并使用结果来展示客户在不同类别间的流动,可带来单个结果无法实现的深度。

这么做的最简单的方法就是创建一个简单的数据文件,并按日期存储每个客户的 RFM 分数。使用同样简单的查询,您可以不断拉取各个客户和客户群的 RFM 分数的时序。为了使分析更加准确,您可以定期或者以相等的时间间隔运行 RFM 模型。这样,您将为客户生命周期分析建立一个基础。

您可以使用此数据查看客户的订购行为随时间变化的许多方面。最好的做法是将分析与人口统计学分类相结合,查看不同分组的 RFM 分数如何随时间变化。您可能获得一种洞察是,如何识别表明客户可能停止订购(一些人将此称为流失)的模式。为这些客户提供激励计划或额外的关注,这可能会改变他们即将出现的行为并将他们保留更长时间。


结束语

使用 SPSS Statistics 中的 RFM 建模功能是一种让他人开始执行更多分析的快捷方式。您可以使用 RFM 建模获取您客户的行为的更深入洞察,无论是在零售、电子商务、经销行业还是其他商业行业。慈善机构甚至也可以应用此模型来改善与捐赠者的互动。

相对而言,RFM 分析是一种容易理解的建模流程。业务用户可以很快看到其价值。可以使用它来促进分析在您组织中的更深入的使用。要寻找将数据挖掘和预测分析引入您公司中的更多、有趣的方式,建模流程是一个的不错起点。

参考资料

学习

获得产品和技术

  • 以最适合您的方式 评估 IBM 产品:下载产品试用版、在线试用产品、在云环境中使用产品,或者在 SOA 沙盒 中花几小时学习如何高效地实现面向服务的架构。

讨论

条评论

developerWorks: 登录

标有星(*)号的字段是必填字段。


需要一个 IBM ID?
忘记 IBM ID?


忘记密码?
更改您的密码

单击提交则表示您同意developerWorks 的条款和条件。 查看条款和条件

 


在您首次登录 developerWorks 时,会为您创建一份个人概要。您的个人概要中的信息(您的姓名、国家/地区,以及公司名称)是公开显示的,而且会随着您发布的任何内容一起显示,除非您选择隐藏您的公司名称。您可以随时更新您的 IBM 帐户。

所有提交的信息确保安全。

选择您的昵称



当您初次登录到 developerWorks 时,将会为您创建一份概要信息,您需要指定一个昵称。您的昵称将和您在 developerWorks 发布的内容显示在一起。

昵称长度在 3 至 31 个字符之间。 您的昵称在 developerWorks 社区中必须是唯一的,并且出于隐私保护的原因,不能是您的电子邮件地址。

标有星(*)号的字段是必填字段。

(昵称长度在 3 至 31 个字符之间)

单击提交则表示您同意developerWorks 的条款和条件。 查看条款和条件.

 


所有提交的信息确保安全。


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=10
Zone=Information Management, Industries
ArticleID=860435
ArticleTitle=使用 SPSS Statistics 直接营销分析获得洞察
publish-date=03052013