辅以专家洞察分析的最新科技新闻
通过 Think 时事通讯,了解有关 AI、自动化、数据等方面最重要且最有趣的行业趋势。请参阅 IBM 隐私声明。
数据建模是创建整个或部分信息系统的可视化表示的过程,表示数据点和结构之间的连接。
数据建模的目标是说明系统中使用和存储的数据类型以及这些数据类型之间的关系。它还描述了数据可以如何分组和组织,以及其格式和属性。
数据模型围绕业务需求建立。规则与需求通过业务利益相关者的反馈进行预先定义,以便将其融入新系统的设计或现有系统的迭代优化中。
可以在各种抽象级别上对数据进行建模。该流程始于向项目利益相关者及终端用户收集业务需求信息。随后,这些业务规则将被转化为数据结构,从而形成具体的数据库设计方案。数据模型好比路线图、建筑蓝图或任何能深化设计理解的规范化图表。
数据建模采用标准化的模式和正式的技术。这种方法提供了一种通用、一致且可预测的方式来定义和管理整个组织甚至更广范围内的数据资源。
理想情况下,数据模型是活文档,会随着业务需求的变化而演进。它们在支持业务流程以及规划 IT 架构和策略方面发挥着重要作用。数据模型可以与供应商、合作伙伴或行业同行共享。
通过 Think 时事通讯,了解有关 AI、自动化、数据等方面最重要且最有趣的行业趋势。请参阅 IBM 隐私声明。
如同任何设计流程一样,数据库和信息系统设计从高抽象层级开始,然后变得更加具体和明确。数据模型通常可分为三类,它们根据抽象程度的不同而有所区别。该过程将从概念模型开始,进展到逻辑模型,最后以物理模型结束。每种类型的数据模型将在后续章节中更详细地讨论:
它们也被称为领域模型,提供系统将包含什么、如何组织以及涉及哪些业务规则的 高层次视图。概念模型是作为收集初始项目需求过程的一部分创建的。
通常,它们包括实体类(定义对业务而言在数据模型中需要表示的重要事物类型)、其特征和约束,以及它们之间的关系。它们还包含相关的安全性和数据完整性要求。这些元素共同定义了数据在模型中的结构化和治理方式。任何标记通常都很简单。
它们 提供数据在数据库内如何物理存储的模式。因此,它们的抽象程度最低。 它们提供可实施为关系数据库的最终设计,包括展示实体之间关系的关联表。该设计还指定了用于维护这些关系的主键和外键。 物理数据模型可以包含数据库管理系统 (DBMS) 特有的属性,包括性能调优。
作为一门学科,数据建模要求利益相关者以高度精细化的方式审视数据处理与存储机制。不同的数据建模技术遵循特定规范,这些规范界定了数据表征的符号体系、模型布局的逻辑结构,以及业务需求的传达方式。所有方法均提供规范化的工作流,这些流程包含以迭代方式执行的任务序列。这些工作流通常是这样的:
数据建模随数据库管理系统的发展而演进,随着业务数据存储需求的增长,模型类型的复杂性也在增加。以下是几种模型类型:
关系数据库通常采用结构化查询语言 (SQL) 进行数据管理。这些数据库在维护数据完整性和最小化冗余方面表现出色。它们常用于销售点系统以及其他类型的事务处理。
两种常见的维度数据模型是星型模式,其中数据被组织成事实(可度量项)和维度(参考信息)。在此模型中,每个事实被其相关维度以星状模式包围。另一种是雪花模式,它类似于星型模式,但包含其他层级的关联维度,使得分支结构更加复杂。
数据建模使开发者、数据架构师、业务分析师和其他利益相关者能够更轻松地查看和理解数据库或数据仓库中数据之间的关系。此外,它还可以:
当前,众多商用及开源计算机辅助软件工程 (CASE) 解决方案已获广泛应用,涵盖多种数据建模、图表生成及可视化工具。部分示例如下:
使用数据科学工具和解决方案,利用数据、算法、机器学习和 AI 技术发现模式,并构建预测。
推出 Cognos Analytics 12.0,人工智能驱动洞察分析可以更好地做出决策。
通过 IBM Consulting 发掘企业数据的价值,建立以洞察分析为导向的组织,实现业务优势。