在过去的十年中,混合云、人工智能、物联网 (IoT) 和边缘计算的进步推动了大数据的指数级增长。这种激增产生了日益复杂的数据环境,大量数据分散在相异的业务部门中。
根据 IBM 商业价值研究院 (IBV) 2025 年研究报告,50% 的 CEO 指出其企业因近期技术投资节奏过快导致技术体系脱节。 这使得数据整合与治理成为突破数据孤岛、安全风险及决策瓶颈的关键所在。
数据结构提供端到端的集成数据管理方案,其技术支撑体系包括:机器学习 (ML)、动态元数据管理、应用程序接口 (API) 和其他智能技术。
它不是一款软件,而是一种设计方法,可以跨组织的内部和多云环境,从数据湖、数据仓库、SQL 数据库和其他来源创建统一的数据视图。通过这种方法,组织不必将分布式数据移动到单个位置或数据存储,也不必采取完全去中心化的方法。
这些核心功能不仅解决了数据孤岛和不断增长的数据量问题,还为业务用户提供了简单的自助服务数据访问。结果是形成了一个实时数据和高质量历史数据网络,加快了企业的数字化转型和商业智能 (BI) 计划,而自动化管理则确保了数据战略的安全性和合规性。
对许多组织而言,结构化、半结构化和非结构化数据的爆发式增长,已让传统数据管理方法不堪重负。而数据仓库、数据湖及混合云环境的激增,进一步加剧了这一挑战。
这些存储系统通常作为大量数据的低成本解决方案。然而,他们往往缺乏适当的元数据管理,导致数据难以定位、解释和有效使用。
数据孤岛进一步加剧了这种复杂性。传统上,企业可能为人力资源、供应链和客户信息设立独立的数据平台,尽管数据类型和需求存在重叠,这些平台仍各自孤立运作。
这些挑战导致暗数据(即被忽视、视为不可靠且最终未被使用的信息)大量堆积。事实上,约 60% 的企业数据从未被分析利用。1
企业采用数据结构应对上述挑战。该现代化架构统一数据、自动化治理流程并实现大规模自助式数据访问。通过连接异构系统间的数据,数据结构使决策者能够发现以往隐藏的关联,并从原本会被弃置的数据中获取更具价值的业务成果。
除数据民主化与决策优化优势外,数据结构方案对企业 AI 工作流同样至关重要。IBM 商业价值研究院 (IBV) 2024 年研究显示:67% 的首席财务官 (CFO) 表示其高管团队拥有快速把握新技术机遇所需的数据。但只有 29% 的技术领导者强烈认同其数据具备必要的质量、可访问性和安全性,能够高效扩展生成式 AI。
借助 data fabric 架构,组织可以更轻松地构建可信的数据基础架构,以便将数据交付到其 AI 系统,并自动应用治理和隐私要求。
与单个数据存储系统不同,data fabric 架构可以在数据环境中创建流动性,抵消数据重力问题,即随着越来越多的新数据到来,数据移动变得越来越困难的问题。data fabric 架构消除了数据移动、转换和整合所需的技术复杂性,使所有数据都可以在整个企业内使用。
但是 data fabric 架构如何实现这一目标呢?
data fabric 架构使用一系列数据服务。为了了解其工作原理,深入了解三个基本组成部分会有所帮助:数据虚拟化、联合主动元数据和机器学习。
联合活动元数据使数据更易于发现和使用。与静态且手动整理的被动元数据不同,联合主动元数据使用语义知识图谱和 AI/ML 技术来持续分析元数据、检测模式并统一不同系统和格式的数据。
这些系统能自动对数据进行标记、画像分析和 分类。同时基于元数据变更触发告警或执行预设操作,使数据生态具备自我运维弹性与自主管理能力。
虽然 Data Fabric 架构因业务需求而异,但它们具有共同的特性。根据 Forrester 的企业 Data Fabric 架构促成 DataOps 报告,data fabric 架构通常由六个基本组件组成:2
除优化全局数据管理与访问外,数据结构还带来核心商业收益:
跨多个平台自动化数据治理、集成及其他数据服务,可简化数据管理和分析。企业可以通过突破流程瓶颈来提高生产力,让业务用户能够更快地做出决策,并减轻技术团队的工作量。
此外,智能整合能力可以帮助优化性能,同时最大限度地减少存储空间和成本。
data fabric 架构促进了自助服务应用程序的发展,将数据访问范围扩大到技术团队之外。它们为用户提供了组织数据的统一视图,无论数据位于何处或之前有多么孤立,都可以建立连接。
可访问、可见的数据使数据编目和治理实施变得更加容易。扩大数据访问权限通常还会带来更多的治理护栏和数据安全方法,例如数据屏蔽和敏感数据加密。
数据结构架构具有模块化特性,可扩展性强。它们既可水平扩展(以容纳不断增长的数据量),也可垂直扩展(以提升处理能力和性能)。
通过直观的图形界面创建和管理智能流数据管道,促进跨混合和多云环境的无缝数据集成。
设计数据架构,以加速生成式 AI 的数据准备,并为数据团队释放 无与伦比的生产力。
通过 IBM Consulting 发掘企业数据的价值,建立以洞察分析为导向的组织,实现业务优势。
1 “暗数据现状”,Splunk,2019 年
2 “Forrester Wave™:2022 年第 2 季度企业 Data Fabric:15 家最重要的提供商以及它们的排名情况”,Forrester,2020 年。