记录系统与可信数据源:有何区别?

一个档案储藏室,架子上的文件夹里装满了大量的纸质文件和记录簿

作者

Matthew Kosinski

Staff Editor

IBM Think

记录系统与可信数据源

在企业数据架构中,记录系统与可信数据源是互补但不同的数据来源。记录系统是特定业务领域或业务流程的权威数据源。可信数据源则负责聚合与整合组织内来自多个记录系统的数据。

其区别更多在于功能层面而非技术层面。它们并非不同类型的信息系统,而是在组织中扮演不同角色的信息系统。

  • 记录系统的主要功能是通过采集特定领域的业务数据来支持业务运营。例如,客户关系管理工具通常作为企业客户数据的记录系统,存储姓名、联系方式等信息。

  • 可信数据源的核心功能则是关联不同系统的数据要素,形成对客户、产品或流程等数据对象的完整视图。相关方常借助这一全景视图进行数据分析与决策。例如,数据仓库可汇集来自客户关系管理、企业资源规划、库存管理系统等多款业务应用的数据,使业务分析师能识别更宏观的趋势,例如哪些产品类型更受不同客户群体青睐。

换言之,记录系统与可信数据源解决不同的痛点:

  • 记录系统为各业务领域创建权威数据存储,避免团队成员、业务单元及应用维护重复且不一致的数据集;

  • 可信数据源则有助于打破数据孤岛,使企业能够跨领域获取数据对象的完整视图。

根据企业需求与数据架构,记录系统与可信数据源可呈现多种形态:专业软件、基础数据库、云文件系统或其他存储系统。大多数企业会同时维护记录系统与可信数据源,因为二者各司其职。

您的团队能否及时捕获下一个零日?

加入安全领导者的行列,订阅 Think 时事通讯,获取有关 AI、网络安全、数据和自动化的精选资讯。快速访问专家教程和阅读解释器,我们会将这些内容直接发送到您的收件箱。请参阅 IBM 隐私声明

您的订阅将以英语提供。每份时事通讯都包含取消订阅链接。您可以在此处管理订阅或取消订阅。更多相关信息,请参阅我们的 IBM 隐私声明

https://www.ibm.com/cn-zh/privacy

记录系统详解

记录系统是原始业务数据的权威来源。它可以存储客户、员工、产品、供应商或其他与日常业务流程相关的资产及实体的数据。

记录系统的关键功能

采集数据以支持业务运营

记录系统是核心业务数据最初生成并持续维护的存储载体。每个记录系统通常专注于采集特定业务领域或流程的数据。

例如,许多企业使用人力资源信息系统管理员工档案。这些档案通常首先在该系统中创建,而非从外部导入。若其他系统需要调用员工数据,必须从人力资源信息系统获取。

部分记录系统支持实时数据采集,另一些则采用批量更新模式。

确保数据准确性

作为权威数据源,记录系统具有双重意义:

  1. 记录系统是向其他系统输送数据的源头。相关方可能通过数据仓库或数据湖仓等门户访问数据,但流入这些门户的数据最终都源自对应的记录系统;

  2. 当出现数据疑问或矛盾时,以记录系统的版本为准。

为每类数据设立指定的权威来源,有助于保障数据一致性。所有使用者基于同一数据集开展工作,避免了因使用私有数据集可能导致的数据孤岛、信息碎片、错误频发及可视化缺口等问题。

基于对数据质量的严格要求,许多记录系统内置了自动化数据校验流程。例如,客户关系管理系统会校验归类为电话号码的数据项,确保其符合 XXX-XXX-XXXX 的标准格式。

记录系统通常还将写权限限制在特定人员或系统范围内,通过防止恶意篡改或操作疏忽来维护数据完整性。

支持数据治理

凭借其可靠数据存储的特性,记录系统常在数据治理与合规工作中发挥关键作用。它们能确保数据仅被合规人员基于正当理由读写,同时维护审计追踪与访问记录,以辅助合规验证与违规修正。

记录系统示例

记录系统可以是简单的 SQL 数据库或云文件存储系统。但企业通常采用专业化应用软件,因为这类工具具备确保数据准确性与一致性的内置功能。

常见的记录系统包括:客户关系管理数据库、人力资本管理软件、企业资源规划系统、制造执行系统配置管理数据库以及项目管理平台。

可信数据源详解

可信数据源是一种通过聚合或整合企业数据架构中多源数据流,构建跨领域数据对象完整视图的信息系统。

这里的数据对象指数据所描述的客体——客户、产品、流程或其他实体与资产。

可信数据源的关键功能

创建数据对象的整体视图

记录系统擅长维护精确的数据存储,但每个记录系统仅限单一领域范围。因此,没有任何单个记录系统能呈现跨领域数据对象的全貌。

可信数据源通过汇集多系统数据,进行调和与关联分析,最终生成企业数据的整体视图,从而有效解决这一问题。

以一个客户为例。企业的客户关系管理系统记录了姓名及对应客户经理等标识性数据;财务软件追踪该客户的所有发票与付款记录;工单系统则统计客户所需的支持时长及问题类型。

每个独立的记录系统——无论是客户关系管理软件、财务软件还是工单系统——都只能呈现客户画像的单一侧面。而可信数据源将这些记录系统作为来源,聚合所有数据形成统一的客户档案,其中包含身份信息、财务数据与支持需求。

支持数据分析和数据驱动的业务决策

通过构建数据对象的全景视图,可信数据源有助于打破数据孤岛,使分析师、业务用户及相关方能够基于企业数据做出明智决策、预测与规划。

例如,当融合了客户关系管理、财务与支持数据的完整客户档案形成后,数据分析师便能准确回答“该客户是否具有盈利性?”这类问题。

需要注意的是,并非所有可信数据源都充当分析门户或平台。

可信数据源示例

与记录系统类似,可信数据源是特定信息系统扮演的角色,而非独立的技术类别。因此,可信数据源可呈现多种形态,常见的包括:

  • 数据仓库与数据集市:将多源数据汇集至专为查询分析优化的中央存储库;

数据湖仓:融合数据湖的灵活存储能力与数据仓库的高性能分析特性。

无论采取何种形态,大多数可信数据源都遵循通用的构建流程:

  1. 识别需要整合的相关记录系统;

  2. 建立主数据管理规则,规范数据结构、调和方式与关联逻辑;
     

  3. 通过提取-加载-转换流程或虚拟化技术,将记录系统集成至统一存储库。

可信信息源与单一可信信息源

单一可信数据源与可信数据源概念基本一致:都是通过整合全企业业务数据、形成数据对象全景视图的可靠信息源。

但“单一”二字强调了一种特定的数据架构设计理念——主张所有相关方与应用都应参照唯一可信数据源。

部分企业可能根据需求与架构设置多个可信数据源,而采用单一可信数据源的企业则致力于将分散的数据源统一为企业级集中化、经过调和的整体数据视图。

示意图展示记录系统与可信数据源之间的关系:中心圆圈标有“集成/MDM层”,左侧连接三个圆圈,分别标记为“人力资源信息系统(记录系统)”、“客户关系管理系统(记录系统)”和“企业资源规划系统(记录系统)”;右侧连接一个圆圈,标记为“可信数据源(例如:数据仓库或湖仓一体)”。每个圆圈与中心之间都用虚线连接。 记录系统的数据通常会先经过一个集成层,然后输入到可信数据源中。

总结:记录系统与可信数据源的
核心差异

用途

- 记录系统在单一领域内采集原始业务数据。

- 可信数据源跨领域调和与关联业务数据。

结构

- 记录系统是针对一个特定领域的全面、权威的数据库。

- 可信数据源是多领域数据的统一视图。

数据来源

- 记录系统在源头直接采集并生成数据。

- 可信数据源聚合并整合来自其他系统的数据。

关联关系

- 记录系统为可信数据源提供数据。

- 可信数据源从记录系统提取数据。

为何区分两者很重要?

尽管两者高度相似且互为补充,但由于承担的角色和需求不同,记录系统与可信数据源在数据架构中被视为不同的组成部分。

记录系统负责在特定领域内创建数据并确保其完整性。可信数据源则负责保障跨领域数据的一致性。一个记录系统并不需要掌握每个数据对象的全貌,它只需记录其领域内的相关数据。然而,其他用户和系统可能需要整体视图——这正是可信数据源发挥作用的地方。