碎片化的数据使人们难以访问、治理和使用——这是高管层面临的三大数据相关挑战之一。1它导致数据孤岛、指标不一致、多个真相来源以及对人工数据流程的依赖。这些挑战延伸到业务规划和决策中,阻碍运营效率、生产力和创新项目。
特别是企业级的检索增强生成 (RAG),需要大量专有信息的数据集来提供上下文答案。但当数据团队不得不在不同位置和存储库之间处理数据时,这些举措很快就会失去动力。
对许多组织而言,避免数据碎片化并不容易。企业管理的数据量正在爆炸式增长,其中大部分是非结构化数据。2025 年的研究发现,仅有 26% 的首席数据官确信其组织能够以产生业务价值的方式使用非结构化数据。2
在现有旧版系统的基础上持续增加新的软件即服务 (SaaS) 工具、云平台和业务应用程序,也会让本已复杂的环境变得更加复杂(这种现象通常被称为 SaaS 蔓延)。
为了实现统一的数据,组织可以利用多种策略,包括数据集成、整合、数据治理和数据编织架构。但应对数据碎片化还需要思维方式的转变——调整文化和工作方式,以支持将数据作为战略资产。
数据碎片化有两种类型。本页面关注的是组织数据在系统和环境中不受控制地扩散。不过,该术语也可以指一种有目的的数据库管理系统 (DBMS) 和文件系统性能优化策略。
当数据碎片化时,很难维持一个可靠、统一且不同部门和系统能够一致参考的数据视图——这通常被称为单一可信信息源 (SSOT)。
没有 SSOT,就会出现数据差异,团队会失去对集中式报告的信任,转而依赖自己的数据集和分析。这种碎片化的决策会导致整个业务的不一致和不协调。
通过 Think 时事通讯,了解有关 AI、自动化、数据等方面最重要且最有趣的行业趋势。请参阅 IBM 隐私声明。
企业 AI 正变得越来越可实现,但大多数企业数据环境仍然过于碎片化,无法大规模支持 AI。例如,2025 年的数据显示,几乎所有受访组织都计划在未来一年内部署高级人工智能,但 58% 的组织承认它们没有明确的数据基础。3
没有能够同时提供结构化和非结构化数据访问权限的统一环境,组织将难以以竞争所需的速度和规模将 AI 项目投入生产。
原因如下:
归根结底,企业 AI 的强度和实用性取决于其背后的数据:72% 的首席执行官甚至表示,专有数据是释放生成式 AI 价值的关键。4
在一段解释数据统一为何重要的视频中,IBM watsonx.data 产品管理副总裁 Edward Calvesbert 进一步强调了 专有数据对 AI 的关键性:
“您组织的数据,就是您的金矿。这是您拥有而竞争对手没有的东西。因此,当组织在思考如何获得更可靠、更准确的 AI 时,一切始于拥有可供 AI 使用的数据。”
数据碎片化往往是快速数字化转型的表象:当今的组织在日益分散和混乱的 IT 资产中存储和创建数据。导致数据碎片化的具体原因包括:
各个业务部门使用不同的电子表格、工具、仪表盘和平台并不罕见。但孤立的系统无法轻易地就自身的数据进行通信,尤其是在混合使用遗留工具和现代工具的情况下。
这种脱节之所以特别成问题,是因为其中许多系统往往在处理相关或重叠的数据——每个系统都在孤立地管理数据,彼此不知晓。这种分离造成了深度的数据孤岛,导致无意的数据囤积、不一致和冗余。
在实践中,统一企业数据并不意味着组织必须将所有信息完整地聚合到一个存储空间中。
由于混合多云环境的复杂性、数据量的不断增长,以及对合规、安全和治理的考量,这种方法并不现实。相反,统一的目标应该是在正确的时间将正确的数据连接到正确的人。
解决数据碎片化的一些策略包括:
有了正确的数据战略和工具来减少数据碎片化,组织可以开始体验到巨大的优势。首先,它们将看到 AI 部署的加速和决策的改善。然后从长远来看,它们将拥有一个持续支持并推动企业转型的民主化数据生态系统。
设计数据战略,消除数据孤岛、降低复杂性并提高数据质量,以获得卓越的客户和员工体验。
watsonx.data 支持您通过开放、混合和已治理数据,利用您的所有数据(无论位于何处)来扩展分析和 AI。
通过 IBM® Consulting 发掘企业数据的价值,建立以洞察分析为导向的组织,实现业务优势。
1, 4《CMO 革命: AI 赋能, 实现五大增长突破》,IBM 商业价值研究院,2025 年 6 月。
2《2025 年首席数据官研究:AI 的乘数效应》,IBM 商业价值研究院,2025 年 11 月 12 日。
3《借助 AI 走得更远、更快》,IBM 商业价值研究院,2025 年 12 月 9 日。
5《2030 年的企业》,IBM 商业价值研究院,2026 年 1 月 16 日。