包含云朵、饼图、象征符号图形的拼贴插图
什么是数据可视化?

数据可视化是指通过使用常见图形(例如图表、图线、信息图表,甚至还有动画)来表示数据。这些可视化的信息显示能够以易于理解的方式传达复杂的数据关系和数据驱动的洞察分析。

数据可视化可用于多种目的 – 请务必注意,它不仅仅供数据团队使用。管理层也可以利用数据可视化来传达组织结构和层级,而数据分析人员和数据科学家则利用它来发现并解释各种模式和趋势。《哈佛商业评论》将数据可视化的主要用途分为四个类别:激发想法、说明想法、可视化发现和日常数据可视化。下面我们将深入探讨这些数据可视化用途类别:

激发想法

数据可视化常用于激发团队的想法。在项目起步时的头脑风暴或设计思维会议中,人们常常利用数据可视化来帮助收集不同的观点,并突出集体的共同关注点。虽然这些可视化呈现方式通常不够光鲜精致,但它们有助于在项目中奠定基础,确保团队在他们希望为关键利益相关者解决的问题上保持一致。

说明想法

用于说明想法的数据可视化有助于传达想法(例如计策或流程),常用于学习环境(例如教程、认证课程、卓越中心),但也可以用于表示组织结构或流程,促进负责特定任务的相应人员之间的沟通。项目经理常常使用甘特图和瀑布图来说明工作流数据建模人员还会使用抽象方法来表示和帮助理解企业信息系统中的数据流,让开发人员、业务分析人员、数据架构师等人员更容易理解数据库或数据仓库中的各种关系。

可视化发现

可视化发现和日常数据可视化与数据团队配合更加密切。可视化发现可以帮助数据分析人员、数据科学家和其他数据专业人员识别存在于数据集中的模式和趋势,而日常数据可视化可以在发现新的洞察后为后续讲述提供支持。

数据可视化

数据可视化是数据科学过程中的关键步骤,可帮助团队和个人更有效地向同事和决策者传达数据。管理报告系统的团队通常会利用定义的模板视图来监控性能。但是,数据可视化不仅限于性能仪表板。例如,在进行文本挖掘时,分析人员可能会使用词云来捕获这些非结构化数据中的重要概念、趋势和隐藏关系。或者,他们可能会利用图形结构来说明知识图谱中实体之间的关系。您可以用多种方式表示不同类型的数据,而且请务必记住,这套技能组合不应该仅限于您的核心分析团队。

数据可视化的类型

最早的数据可视化形式可以追溯到公元前 17 世纪的古埃及人,主要用于辅助导航。随着时间的推移,人们将数据可视化用于更广泛的应用领域,例如经济、社会与健康学科。其中或许最值得关注的是,Edward Tufte 出版了《The Visual Display of Quantitative Information》,该书说明了个人可以利用数据可视化以更有效的方式呈现数据。他的书经受住了时间的考验,尤其是在众多公司纷纷转而使用仪表板来实时报告其绩效指标时。仪表板是有效的数据可视化工具,它们可用于跟踪并以可视化方式呈现来自多个数据源的数据,从而提供针对团队或相邻团队的特定行为对绩效影响的可见性。仪表板包含了常用的数据可视化技术,例如:

  • 表格:由行和列组成,用于比较变量。表格能够以结构化的方式显示大量信息,但对于仅关注总体趋势的用户来说,可能会造成信息过载。
  • 饼图和堆叠条形图:这些图表分为多个部分,代表了整体中的各个部分。它们提供了一种简单的方法来组织数据和比较不同组成部分的大小。
  • 折线图和面积图:这些数据可视化形式通过绘制一系列随时间推移出现的数据点来显示一个或多个数量的变化,并且经常用于预测分析。折线图利用线条来展示这些变化,而面积图则用线段连接数据点,将多个变量堆叠在一起并通过颜色加以区分。
  • 直方图:这种图表使用条形图(条形之间没有空格)来绘制数字分布情况,表示特定范围内的数据量。通过这种可视化方式,最终用户可以轻松识别给定数据集内的异常值。
  • 散点图:这种数据可视化方式有助于揭示两个变量之间的关系,常用于回归数据分析。然而,它们有时会与气泡图混淆,后者通过 x 轴、y 轴和气泡的大小来显示三个变量。
  • 热图:这种图形表示方式有助于按位置直观显示行为数据,适用于地图上甚至网页上的位置。
  • 树状图:将分层数据显示为一组嵌套图形(通常为矩形)。树状图非常适合通过面积大小比较不同类别之间的比例。
开源数据可视化工具

数据可视化工具的获取途径从未如此便捷。D3.js 等开源库为分析人员提供了一种以交互方式实现数据可视化的方法,让他们能够利用新数据来吸引更广泛的受众。最流行的开源数据可视化库包括:

  • D3.js:它是一个前端 JavaScript 库,用于在 Web 浏览器中生成动态的交互式数据可视化。D3.js 使用 HTML、CSS 和 SVG 来创建可在任何浏览器上查看的数据可视化表示,还提供了交互和动画功能。
  • ECharts:一个强大的图表和数据可视化库,可轻松为产品、研究论文、演示文稿等添加直观、交互性强且高度可定制的图表。Echarts 基于 JavaScript 和 ZRender(一个轻量级的画布库)。
  • Vega:Vega 将自己定义为“可视化语法”,支持自定义跨多个可从 Web 访问的大型数据集的可视化。
  • deck.gl:它是 Uber 开源数据可视化框架套件的组成部分。deck.gl 是一个框架,用于对大数据进行探索性数据分析,可帮助在 Web 上构建 GPU 驱动的高性能可视化。
数据可视化最佳实践

有如此多的数据可视化工具随时可供使用,随之而来的是,无效的信息可视化也有所增加。视觉传达应该简单且经过深思熟虑,确保您的数据可视化可以帮助目标受众得出您预期的洞察或结论。以下最佳实践有助于确保数据可视化的实用性和明确性:

设置上下文:请务必提供一般背景信息,让受众了解特定数据点的重要性。
例如,如果电子邮件打开率表现不佳,那么我们可能需要说明一家公司的打开率与整个行业相比如何,以证明该公司在该营销渠道存在问题。要想推动相关行动,受众需要了解当前绩效与目标、基准或其他关键绩效指标 (KPI) 等有形指标的比较情况。

了解您的受众:想想您的可视化是为谁设计的,然后确保您的数据可视化符合他们的需求。那个人想要实现什么目标?他们关心什么样的问题?您的可视化能否解决他们关心的问题?您希望自己提供的数据能够激励相关人员在其角色范围内采取行动。如果您不确定可视化是否清晰明确,请将其呈现给目标受众中的一两个人以获得反馈,以便在大型演示之前进行更多编辑。

选择有效的视觉效果:特定的视觉效果是为特定类型的数据集设计的。
例如,散点图可以很好地显示两个变量之间的关系,而折线图则可以很好地显示时间序列数据。确保视觉效果确实有助于观众理解您的主要观点。图表和数据的不一致可能会适得其反,使您的受众更加困惑,而不是提供清晰的信息。

保持简单:借助数据可视化工具,您可以在可视化内容中轻松添加各种信息。但是,可以这样做并不意味着应该这样做!
在数据可视化中,您需要非常慎重地考虑添加的其他信息,以便让用户集中注意力。例如,您是否需要在条形图中的每个条形上添加数据标签?也许您只需要添加一两个标签来帮助说明您的观点。您是否需要使用多种颜色来传达自己的想法?您使用的颜色是否容易被广泛的受众理解(例如考虑到色盲受众)?设计您的数据可视化时,请通过消除可能会分散目标受众注意力的信息来发挥最大影响力。

相关解决方案
Planning Analytics

融入 AI 的整合计划解决方案,帮助您超越手动制定计划的限制。

深入了解 Planning Analytics
IBM Watson Studio

构建、运行和管理 AI 模型。使用开源代码或可视化建模在任何云上准备数据并构建模型。预测并优化您的结果。

深入了解 IBM Watson Studio
数据和分析咨询

释放企业数据的价值,建立洞察驱动型组织,借助 IBM 咨询实现业务优势。

数据和分析咨询
Cognos Analytics

值得信赖的 Watson 辅助系统,帮您实现更明智的分析和自信决策。

深入了解 Cognos Analytics
IBM SPSS Statistics

IBM SPSS Statistics 是一个功能强大的统计软件平台。它可提供用户友好型界面和一组出色的功能,以便贵组织能快速从数据中提取可操作的洞察信息。

深入了解 IBM® SPSS Statistics
采取后续步骤

使用灵活且融入 AI 的预测功能,并实时分析假设情景。IBM Planning Analytics 是一种整合的业务规划解决方案,可将原始数据转化为切实可行的洞察分析。根据需要在本地或云端部署。

深入了解 Planning Analytics 预约实时演示