数据建模是为整个或部分信息系统创建可视化表示形式的过程,用于表明数据点和结构之间的联系。 其目的在于说明系统中使用和存储的数据类型、这些数据类型之间的关系、数据的分组和组织方式及其格式和属性。
数据模型是根据业务需求构建的。 规则和需求是通过业务利益相关方的反馈预先加以定义的,因此可纳入到新系统的设计之中,或者在现有系统迭代时进行调整。
可以在不同的抽象层次上对数据进行建模。 该过程首先会从利益相关方和最终用户那里收集业务需求相关信息。 然后再将这些业务规则转换为数据结构,制定出具体的数据库设计。 数据模型就好比是路线图、架构师的蓝图,或任何有助于更深入理解设计内容的正式图表。
数据建模采用标准化模式和正规方法。 这为定义和管理整个组织乃至组织之外的数据资源提供了一种通用、一致且可预测的方式。
理想情况下,数据模型是随着业务需求的变化而不断演变的文档。 在支持业务流程和规划 IT 架构及战略方面,它们发挥着重要的作用。 数据模型可以与供应商、合作伙伴和/或业内同行共享。
像任何设计过程一样,数据库和信息系统设计从一个很高的抽象层次开始,然后逐渐变得越来越具体且明确。 数据模型一般可以分为三类,具体因抽象程度而异。 该过程将从概念模型开始,然后发展到逻辑模型,最终是物理模型。 下面将更详细地讨论数据模型的各种类型:
作为一门学科,在数据建模过程中,会邀请利益相关方十分细致地评估数据处理和存储。 数据建模技术具有不同的约定,这些约定规定了使用哪些符号来表示数据、模型的布局方式以及业务需求的表达方式。 所有方法都提供了正式的工作流,其中包括以迭代方式执行的一系列任务。 这些工作流通常如下所示:
数据建模与数据库管理系统一同演变,随着企业数据存储需求的不断增长,模型类型也日渐复杂。 以下是几种模型类型:
关系数据库经常使用结构化查询语言 (SQL) 进行数据管理。 这些数据库可以很好地维护数据完整性,并最大限度地减少冗余。 它们通常用于销售终端系统以及其他类型的交易处理。
两种流行的维度数据模型都是星型模式,其中数据被组织成事实(可测量项目)和维度(参考信息),每个事实都被其关联的维度以星形模式所环绕。 另一种是雪花模式,它类似于星型模式,但包括关联维度的附加层,使得分支模式更加复杂。
通过数据建模,开发人员、数据架构师、业务分析师和其他利益相关方可以更轻松地查看和理解数据库或数据仓库中数据之间的关系。 此外,它还可以:
如今,许多商业和开源计算机辅助软件工程 (CASE) 解决方案都得到了广泛应用,包括多种数据建模、图表和可视化工具。 以下是一些示例:
为高性能分析和 AI 构建的完全管理的弹性云数据仓库
混合云以及 开放。 永续。 您的数字化转型平台和合作伙伴。
AI 驱动的混合云软件。