利用预测性分析,加快数据分析,做出更好的决策。

定义

什么是预测性分析?

预测性分析是高级分析的一个分支,将历史数据和统计建模、数据挖掘技术以及机器学习结合使用,来预测未来的结果。企业可采用预测性分析,找出数据中的模式,以发现风险和机遇。

预测性分析通常与大数据和数据科学关联在一起。目前的企业漫游在数据海洋之中,这些数据位于各种事务数据库、设备日志文件、图像、视频、传感器或其他数据源中。 要从此数据中获得洞察,数据科学家会使用深度学习和机器学习算法,找到模式并预测未来事件。这些包括线性和非线性回归、神经网络、支持向量机器和决策树。通过预测性分析所学到的信息之后可在规范性分析中进一步加以利用,以基于预测性洞察来驱动操作。

IBM 提供一组软件工具,帮助您更轻松快速地构建可扩展的预测模型。 这些工具还可在 IBM Cloud Pak® for Data 上运行,后者是容器化的数据和 AI 平台,支持随处构建和运行模型,无论是在任何云环境还是本地环境。

优点

用于构建预测模型的灵活平台

可扩展性

自动执行数据科学和数据工程任务。 在多个企业应用之间无缝训练、测试和部署模型。 在混合多云环境中扩展常见数据科学功能。

速度

利用预先构建的应用和预先训练的模型。 借助一流的 IBM 和开源软件,帮助数据科学和业务团队开展协作,简化模型构建过程。

简单性

使用中央平台管理整个数据科学生命周期。 标准化开发和部署过程。 为整个组织的数据监管和安全创建单一框架。

来自 IBM 的预测性分析工具

数据科学平台

IBM Watson® Studio 通过提供可使用开源或可视化建模随处准备数据和构建模型的工具,帮助实施 AI。

统计分析软件

IBM® SPSS® Statistics 旨在使用特别分析、假设测试、地理空间分析和预测性分析,解决业务和研究问题。

可视化建模工具

IBM SPSS Modeler 解决方案可帮助立即使用数据资产和现代应用以及完整算法和模型。

决策优化解决方案

IBM Decision Optimization 通过提供规范性分析功能,丰富来自机器学习模型的预测性洞察,从而优化结果。

预测性分析示例

探索行业用例

银行业务

金融服务使用机器学习和定量工具,预测信用风险,检测欺诈。

医疗保健

医疗保健领域的预测性分析用于检测和管理慢性病患者的治疗。

人力资源 (HR)

HR 团队使用预测性分析来发现并聘用员工,确定劳动力市场,预测员工的绩效水平。

市场营销与销售

预测性分析可用于整个客户生命周期和交叉销售战略中的市场营销活动。

零售业

零售商使用预测性分析来确定产品推荐,预测销售,分析市场和管理季节性库存。

供应链

企业使用预测性分析来提高库存管理效率,帮助满足需求,同时最大程度降低库存水平。

深入了解预测性分析

模型类型及更多信息

预测建模的类型

数据科学和分析团队利用三种类型的预测模型: 预测性建模、描述性建模和决策建模。

预测性建模
预测性建模使用统计信息来预测结果。 目标是评估不同样本中类似单元表现出类似性能的可能性。 预测性建模可用于预测客户的行为,比如信用风险。

描述性建模
描述性建模描述特定数据集中的关系,主要用于客户细分目的,对客户或潜在客户进行分组。 这种类型的建模侧重于发现客户与产品之间的不同关系,例如按产品喜好和生命阶段发现关系。

决策建模
决策建模描述决策中各元素(如数据、决策和预测结果)之间的关系,以预测结果。 此类型可用于最大化某些结果,同时最小化其他结果。

热门预测性分析模型

预测性分析模型旨在评估历史数据,发现模式,观察趋势,并使用这些信息来预测未来趋势。 热门预测性分析模型包括分类、聚类、预测、离群值和时间序列,下面将详细描述这些模型。

分类模型
分类模型归入受监督机器学习模型类别。 它们根据历史数据的结论将数据归入类别中。 此模型通常用于回答二元输出的问题,例如回答 yes 或 no 或者 true 或 false。 分类模型的类型包括逻辑回归、决策树、随机森林、神经网络和朴素贝叶斯。

聚类模型
聚类模型归入无监督学习的类别。 它们根据相似属性对数据进行分组。 例如,电子商务站点可使用该模型,基于共同特征将客户分入类似的组,并为每个组制定市场营销战略。 常见的聚类算法包括 k-均值聚类、平均移位聚类、具有噪声基于密度的应用空间聚类 (DBSCAN)、使用高斯混合模型 (GMM) 的期望值最大化 (EM) 聚类以及分层聚类。

预测模型
预测模型使用度量值预测,根据历史数据的趋势估计新数据的数值。 例如,呼叫中心可使用该模型来预测每小时将接听多少次来电。 时间序列和计量经济学模型都是预测模型的示例。

离群值模型
离群值模型处理数据集中的异常数据条目。 例如,保险公司可将其用于欺诈检测,以在交易列表中标记异常数据。一些受欢迎的离群值检测方式包括极值分析、概率性和统计性建模、线性回归、基于临近环境建模,以及信息理论建模。

时间序列模型
时间序列模型采用以时间为输入参数的数据点序列。 它可以采用去年的数据,计算一个数值指标,并使用该指标来预测三到六周的数据。 例如,该模型可由医院用于根据过去六周中出现的患者人数来预测急救房间容量。

预测性分析过程

预测性分析从业务目标开始,例如减少浪费,节省时间或削减成本。 该过程使用模型,借助海量数据集生成支持该目标的结果。

例如,用于预测销售收入的预测性分析过程就遵循这些基本步骤。

  1. 从各种来源导入数据。 这些数据源包括产品销售、营销预算以及国家 GDP。
  2. 通过除去离群值(比如数据峰值、缺失的数据)并进行汇总,对数据进行清理。 单张表可用于汇总不同类型的数据,如产品销售、市场营销预算以及国家 GDP。
  3. 开发基于预测模型的确保适当拟合。 例如,神经网络可用于构建和训练预测模型,以进行收入预测。
  4. 将该模型部署到生产环境中,然后可通过其他应用进行访问。

实施预测性分析计划

使用预测性分析是分析过程中的一个关键里程碑 - 这就是典型的统计分析与人工智能 (AI) 新世界的交汇点。 当今前所未有的直观工具、全新的预测性技术和混合云部署模型的融合,让预测性分析和建模比以往任何时候都更容易获得。 第一次,各种规模的组织都可以拥有工具,将预测性分析融入业务流程中,大规模地利用 AI。

发展企业数据科学计划可带来显着的竞争优势。 发展过程中的典型步骤如下:

第 1 阶段: 入门

当企业开始建立数据科学能力时,通常会从专门的项目开始,例如开发模型以回答特定问题,或支持研究项目。 借助诸如 IBM Watson Studio Desktop 之类的解决方案,数据科学家可以在自己的计算机或笔记本电脑上以 24x7 方式工作,并在需要时与更广泛的团队同步。

第 2 阶段: 提高采用率

随着数据科学在整个企业得到广泛采用,不同部门需要部署各自的模型,将其连接到数据源,并将其融入生产应用中。 IBM Watson Studio 和 IBM Watson Machine Learning 使部门数据科学和 IT 团队能够更轻松地在这个生命周期开展协作。

第 3 阶段: 企业规模的采用

一旦 AI 融入业务关键流程中,组织就需要构建一个中心平台,用于管理和治理模型和数据。 IBM Cloud Pak for Data 可提供全面的多云平台所需的基础架构和工具,充当单一控制点。

获取实践经验

代码模式和教程

创建和部署评分模型以预测心率衰竭

使用 IoT 传感器数据预测设备故障

分析开放式医疗数据集以获取洞察

形成和优化用于预测性分析的原始数据

入门

开启预测性分析之旅