数据流图使用图形符号来说明数据从进入系统到离开系统的路径、流程和存储库。这一可视化模型可帮助专业人员确定如何提高现有系统和流程的效率和有效性,并创建新的系统和流程。
例如,保险索赔流程的数据流图 (DFD) 将直观地展示索赔的流程:
分析师可以检查 DFD 来揭示流程中的瓶颈,检测可能发生欺诈的领域,帮助利益相关者了解流程并改进设计。
20 世纪 70 年代,软件工程师 Larry Constantine 和 Ed Yourdon 在他们的著作《Structured Design》中引入了数据流图。他们没有关注软件过程,而是根据数据在软件系统内的移动方式来制定 DFD。
计算机科学家 Tom DeMarco、Chris Gane 和 Trish Sarson 开发了至今仍在使用的标准化数据流符号和符号,从而帮助普及了 DFD。
最初,数据流图主要用于软件工程。在发现它们在理解和改进业务流程和工作流方面的价值后,业务专业人员开始使用它们。
自 20 世纪 90 年代统一建模语言 (UML) 推出以来,软件程序员不再仅仅依赖数据流图进行软件工程。UML 图提供了复杂的面向对象系统中精密、详细的结构和行为视图。
如今,DFD 主要用作 UML 图和流程图的补充工具,在软件开发期间提供高级系统概览。
数据流图很重要,因为借助它可以更轻松地理解经过复杂系统或流程的信息流。通过将整个系统的组件可视化,DFD 可以帮助用户:
DFD 有 4 个主要组件:
这些是 DFD 中数据流的起点和终点。外部实体放置在 DFD 的边缘,以表示整个系统或流程的信息输入和输出。
外部实体可以是个人、组织或系统。例如,在对购买和接收销售收据的流程进行建模时,客户可能是 DFD 中的外部实体。外部实体也被称为终止符、行动者、源和汇。
流程是更改或转换数据的活动。这些活动可能包括计算、排序、验证、重定向或推进该数据流分段所需的任何其他转型。例如,信用卡付款验证是在客户的购买 DFD 中发生的一个过程。
数据流是信息在外部实体、进程和数据存储之间移动时所采用的路线。例如,在电子商务 DFD 中,将输入登录凭据的用户与身份验证网关连接起来的路径将是数据流。
圆形、椭圆、箭头和矩形等标准化符号和记号用于直观地表示 DFD 组件。如今,数据流图模板中使用了两种常见的记号集:Yourdon 和 Coad 方法以及 Gane 和 Sarson 方法。这两个系统都以创造它们的计算机科学家的名字命名。
这些方法在表示流程和数据存储时使用的符号不同,但其他方面是相同的。
DFD 有可以为系统或流程提供不同视角的两种类型:逻辑 DFD 和物理 DFD。
逻辑 DFD 提供执行业务或系统流程所需的数据流的高级视图,而不考虑技术或实施细节。其关注点是所需的数据以及这些数据如何在流程中移动以完成业务目标。
逻辑 DFD 可以代表业务活动,例如仓库的订单履行、客户在线购买或医疗设施的患者接收。
物理 DFD 可以可视化系统或流程的实施,包括所需的软件、硬件和文件。物理 DFD 侧重于系统或流程的底层技术、程序和运营。
物理 DFD 通常用于表示复杂的系统和工作流程,例如供应链软件如何维护仓库库存,或者电子健康记录如何在医院系统中安全移动。
有时使用多个 DFD 级别创建数据流图,以渐进显示有关系统或流程的更多详细信息。这种分层方法从简单的高级视图开始,随着较低级别的 DFD 深入流程和子流程,开始变得更加复杂。
0 级 DFD 也称为“上下文图”,是一种将整个系统作为单个过程可视化的高级视图。这是最简单、最基本的级别。它应该对任何查看它的人来说都是容易理解的,无论技术技能或工作角色如何。
1 级 DFD 更详细地探索高级流程的组件。上下文级 DFD 中的单一过程被分解为子过程,从而提供有关功能和数据流路径的更多信息。
第 2 级通过添加新的子流程及其与数据流和数据存储的交互和关系提供了更精细的细节。这一级别提供了系统或流程内部运营的高度复杂的视图。
由于 DFD 的设计目标是易于获取和理解,因此超出第 2 级的复杂性是不寻常的。但是,高度复杂的系统可能需要 3 级 DFD 的详细细节,它映射了数据过程或系统的各个方面。
大多数数据流图都遵循相同的基本规则:
了解开放湖仓一体方法如何提供可信数据以及加快分析和 AI 项目执行。
深入了解数据领导者指南,了解如何构建数据驱动型组织和推动业务优势。
了解为什么 AI 驱动的数据智能和数据集成对于推动结构化和非结构化数据的准备工作和加速实现 AI 成果至关重要。
获得关于不断演变的 ABI 解决方案格局的独特洞察分析,重点介绍适用于数据和分析领导者的主要发现、假设和建议。
简化数据访问并实现数据治理自动化。了解将湖仓一体战略集成到数据架构中的强大功能,包括优化工作负载的成本、扩展 AI 和分析,以及随时随地使用所有数据。
深入了解 IBM Research 如何定期整合到 IBM Cloud Pak for Data 的新功能中。