在批发分销链中的哪一个环节开始执行数据挖掘

在分销链伊始对大数据应用预测分析

大型分销商为预测分析在分销领域的应用开辟了道路,使中等规模的分销商能够充分利用大型企业的成功和失败经验。在本文中,了解如何应用预测分析改善批发分销企业的多个职能部门的业务运营,并了解 IBM 产品集,包括对大数据技术的研究,以及随着技能和数据在未来的增长而对大数据技术的早期应用。

David Gillman, 主管,Services, Data Sooner

David Gillman 在商业智能、数据挖掘和预测分析等领域已有 20 年的工作经验。他的教育背景包括应用数学、优化和统计分析,重点研究这些学科在商业活动的应用。他在对各种规模的分销、制造、零售和酒店企业应用分析以改善业务运营方面拥有实践经验。



2013 年 2 月 19 日

本文重点介绍预测分析及其相关分析流程,您可能已在其他论坛了解了许多这类内容。这些文章也并不只限于枯燥的技术讨论。您可以在 IT 和技术杂志及网站、业务运营和分销行业杂志,甚至在普通的新闻杂志中都可以阅读有关预测分析(对数据挖掘 进行更新和扩展后的术语)。

尽管预测分析在批发分销业并不算主流方法,但是,这种方法的应用会越来越广泛。和许多其他技术一样,这种方法首先在一些大型企业中得到采用,随后遍及到一些中等规模的企业。随着采用的增加,同时也衍生出许多商业和开源工具。这类工具的数量非常庞大,如果不是该领域的专家能手,那么在挑选工具集时很可能会不知所措。

预测分析的定义

首先,让我们来了解一下预测分析的定义不包括 哪些内容:

  • 不是报告功能。从事务数据库提供汇总后的信息是非常有用的功能,但是这不属于预测分析。预测分析使用统计流程为企业用户提供无法通过传统报告收集的信息。
  • 不是在线分析处理 (OLAP)、多维数据集 (data cube) 或内存数据库。尽管非关系数据存储技术的出现推动了信息向企业用户的交付,然而它仍然不是预测分析。这并不是贬低内存数据库和 OLAP 引擎的性能的进步,而是因为仅仅将历史信息放到这些格式中并不会为企业决策者提供更多的洞察力。
  • 不是电子表格。这一点属于待定内容。最流行的电子表格应用程序的确提供了比普通的求最大值 (max)、最小值 (min)、求和 (sum) 和求平均数等计算更丰富的统计功能。(但是,很少有人知道如何使用更加高级的统计功能)。这种电子表格可以执行多种回归分析,对于预测未来趋势很有用。然而,电子表格在可以处理的数据量、处理速度和应用预测的能力(即对新数据进行预测并将预测结果通知给其他方)方面具有很大的局限性。

至于什么是预测分析,则取决于您的交谈对象。我对于它的一般定义是:预测分析 是指使用自动化的统计流程分析数据并将结果汇总为有用信息的过程。有用信息的形式多种多样,但是对于分销商来说,有用信息应当可以由业务决策者操作,或者可以编码为应用程序,从而自动包含到基于企业资源规划 (ERP) 的业务逻辑中。

预测分析非常有用,这是因为在您的 ERP 系统和其他非 ERP 数据库中,每个人都需要理解、分析大量数据并进行处理。订单历史数据、客户关系管理 (CRM) 数据以及采购和库存数据将按照一定的速度进入到 ERP 系统并不断累积,并且这种速度不会超出服务器的处理能力。您将通过报告对这些信息进行汇总,公司主管和业务线 (LOB) 用户将经常查看这些报告。然而,这些历史信息本身并不能提供可预测的或规范性建议。而这正是预测分析学发挥其作用的地方。

大型分销商使用的概念、技术和工具可以成功地应用到中等规模分销商的运营和数据中。让我们了解一下您通过预测分析可以在 ERP 应用程序的哪些位置利用数据。然后,了解一些用于执行和部署预测分析和大数据技术的工具,以及如何对非结构化或半结构化数据使用大数据技术的工具和概念。


预测分析在分销领域中的示例

在互联网上快速搜索相关的术语,您会发现在不同职能部门应用预测分析的许多示例。下面是一些我比较喜欢的示例。

采购

预测分析在采购优化方面的应用已经有很长的历史了。中等规模的分销商通常安装一些系统来观察各种产品的库存和订单历史记录,从而提供建议的采购量和采购时间表。这样做的实际效果就是降低库存水平。

季节性波动通常是造成存货过多的一个隐性原因。预测分析可以显示季节性波动趋势。更令人印象深刻的是,一些分销商使用预测分析来识别连续的季节性波动。例如,节日装饰品分销商通过预测分析流程可以发现,人造圣诞树和装饰灯的销售显示出相同的季节性趋势,但是销售高峰与销售连续期之间间隔 5 天。

金融

客户信用一直都是一个不易处理的领域。当您的公司在构建历史数据时,您可以向您的 CRM 和应收帐款 (AR) 文件应用预测分析来监视个别客户和客户群。通常,对于公司的新客户,将根据外部代理的客户报告提高该客户的信用。该报告很少有人浏览,除非客户在逾期未完成支付或信贷总额增加时 AR 出现问题。预测分析模型可以查看走势变坏的客户的历史记录并找出警示迹象。一些分销商在预测模型中结合了 AR 和 CRM 文件,并发现客户回电延迟是一个重要的警示信号。

市场营销

将客户分组是大多数企业进行规划和定位的常见手段。虽然启发式的客户分组非常易于实现,但是应用预测分析技术可以创建一种更加优化的划分系统。这种分组模型将应用于潜在客户和新客户。具体使用办法包括将新客户的订单模式与同一分组中长期表现良好的客户的模式进行快速匹配。

在分销领域中,客户分组模型的另一个出色应用是用于客户生命周期管理。了解客户如何经过不同的阶段才成为您的客户,这将有助于您的公司制定计划和激励措施来保留这些客户。

销售

在市场营销中使用预测分析的一些概念也可以直接应用于销售部门。了解客户生命周期有助于销售人员找出分销商在哪些领域正在逐渐失去业务。

预测分析在销售部门还有许多其他的潜在应用。我最喜欢的一个应用就是交叉销售模型,这是一个自动化或半自动化系统,可以显示出客户最有可能购买但还未购买的产品。增加订单额是分销商直接提高利润的最佳方法之一。真正的预测分析不仅仅是显示某个部门用于交叉销售的热门产品 (top product)。客户通常已经购买了这些产品。最佳交叉销售模型几乎可以充当个人购物助手,推荐一些具有正向关联但并不明显的产品。

交叉销售模型还可以帮助将低价值客户转换为高价值客户。想象一下,该模型可以使销售人员增加某个客户一次性购买的商品数量。这种方法非常微妙且效果很好。


IBM 工具和软件解决方案

如上所述,有许多工具可以帮助您完成部分或全部任务。这样的产品有数百种,包括旧的、新的、商用的和开源的产品。如果您正在寻找基于 IBM 的产品,那么您可以找到一个很清晰的进展路线,指导您如何在将数据挖掘(当前)最终应用到业务数据的过程中完成测试、生产直至实施大数据技术。

IBM® SPSS® Statistics 是开始应用预测分析的一个基础软件包。有许多课程(您甚至还记得自己上大学时的统计课)都可以帮助您完成数据分析流程。在这一过程中,您将向 SPSS 添加其他模块。使用 SPSS Statistics 的目的是获得基本的统计知识并能够将这些知识应用到数据中。我敢向您保证,即使这只是一项非常基本的工作,您和您的公司仍然会通过洞察所发现的分析模式和趋势获益良多。

在公司内部展示了使用统计分析的实用程序,帮助公司获得洞察力后,您将看到绝对投资回报 (ROI),并轻松地将管理水平提升到更高的级别 —— 使用 IBM SPSS Modeler。此时,您将能够真正对生产环境中的数据应用预测分析。

SPSS Modeler 针对结构化数据提供了两个版本:专业版 (Professional) 和服务器版 (Server)。对于中等规模的公司,您几乎必然会使用专业版作为入门,然后在将预测模型部署到自动处理任务时再使用服务器版(参见 参考资料,了解更多信息)。

在这个过程中,您还将看到数据仓库的好处。没有什么(比如坏数据)可以减慢预测分析流程(或者导致错误模型)。使用清洁后的数据源(即数据仓库或数据集市)将使数据挖掘项目前进一大步。IBM 提供了一系列数据仓库包,全部属于 IBM InfoSphere® 产品线。根据您的公司所从事的领域,可以选择使用若干不同的仓库包。了解针对 Customer Insight、Market and Campaign Insight 和 Supply Chain Insight 的 InfoSphere 仓库包。

上面介绍的过程将可以满足财富 500 强公司的预测分析需求。继续阅读本文,了解预测分析的未来展望。


大数据技术

大数据 是指对非结构化和半结构化数据的分析。在一般的讨论中,该术语通常是指文本分析,包括浏览 Twitter、Facebook 和其他社交媒体网站来收集信息。这类数据并不适合传统的事务数据模型,因此难以对其进行处理。

对于分销商来说,非结构化数据还会以其他的形式出现。考虑产品上面的射频 ID 标记和它们在仓库内部、周围以及达到客户处的移动记录。如果您的公司运营着自己的送货车队,汽车传感器则可以提供另一个有价值的信息源来帮助优化送货流程。

对这些海量的非结构化数据进行分析就是大数据技术要解决的问题。

IBM 为大数据解决方案提供了一个清晰的路径。在 InfoSphere 产品系列内包含 BigInsights 产品线。该产品线构建在几个开源产品基础上,包括用于数据存储的 Apache Hadoop 和一些管理及查询语言,旨在处理海量的非结构化数据。

您可以免费下载并安装 IBM InfoSphere BigInsights 基础版(参见 参考资料)。在数据量和希望使用的分析类型方面,有多个选项可供选择。

下一个要使用的软件是 IBM InfoSphere BigInsights 企业版。此时,您可以使用所有附带的工具来提取信息。您可以自己决定将它部署到哪个位置。

在设计时,BigInsights 的基础技术的目标是在商用硬件上运行(对于某些控制节点有一些例外)。并不是所有人都要使用大量的硬件,因此 IBM 还支持在 IBM 云中托管 BigInsights。您可以配置需要使用的存储和处理节点的数量,并按小时为所使用的处理能力付费。


结束语

预测分析将为您的分销部门带来全新的变化。通过遍历成功案例,您几乎可以在所有部门中看到实际效益。许多时候,应用预测分析可以实现数千个或数百万个微小的递增式改进。每项改进几乎都难以察觉,但是当涉及到数千名客户或数百万项交易时,公司所获得的利益将非常可观。

您的企业必然会在未来产生大量的数据,因此需要执行大量的分析。现在就开始掌握这些工具的技能和知识是在企业中保持与时俱进的最佳方式。现在就开始涉足预测分析意味着您将使您的企业保持领先地位,但这是建立在企业外部人员的经验之上。

参考资料

学习

获得产品和技术

讨论

条评论

developerWorks: 登录

标有星(*)号的字段是必填字段。


需要一个 IBM ID?
忘记 IBM ID?


忘记密码?
更改您的密码

单击提交则表示您同意developerWorks 的条款和条件。 查看条款和条件

 


在您首次登录 developerWorks 时,会为您创建一份个人概要。您的个人概要中的信息(您的姓名、国家/地区,以及公司名称)是公开显示的,而且会随着您发布的任何内容一起显示,除非您选择隐藏您的公司名称。您可以随时更新您的 IBM 帐户。

所有提交的信息确保安全。

选择您的昵称



当您初次登录到 developerWorks 时,将会为您创建一份概要信息,您需要指定一个昵称。您的昵称将和您在 developerWorks 发布的内容显示在一起。

昵称长度在 3 至 31 个字符之间。 您的昵称在 developerWorks 社区中必须是唯一的,并且出于隐私保护的原因,不能是您的电子邮件地址。

标有星(*)号的字段是必填字段。

(昵称长度在 3 至 31 个字符之间)

单击提交则表示您同意developerWorks 的条款和条件。 查看条款和条件.

 


所有提交的信息确保安全。


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=10
Zone=Information Management
ArticleID=858500
ArticleTitle=在批发分销链中的哪一个环节开始执行数据挖掘
publish-date=02192013