云数据整合是指在至少一个数据源或平台基于云的情况下,跨系统合并与协调数据的实践及相关技术。
通过 Think 时事通讯,了解有关 AI、自动化、数据等方面最重要且最有趣的行业趋势。请参阅 IBM 隐私声明。
将企业数据存储在云中具有显著优势,最突出的是消除了存储硬性限制,并能轻松存储海量大数据。其他常见优势包括成本效益、可扩展性及业务连续性的提升。
基于这些优势,各组织迅速将数据迁移至云端(同时也将数据保留在本地以满足性能或合规要求)。有预测显示,到 2028 年,企业在云存储方面的支出将达到 1280 亿美元。1另有估计认为,2024 年至 2029 年间,全球存储的数据量将翻倍。2
如今,作为组织最关键资产之一的企业云数据,正日益以各种结构化和非结构化格式分布在混合云和多云环境中。
这种分散的数据导致了数据格局碎片化,信息被隔离在不同团队、平台和环境之间,给团队使用数据带来了挑战。与此同时,应用程序、物联网 (IoT) 设备及交易数据生成的数据量在云端和本地系统中持续增长。
云数据整合能有效应对这一复杂性。它整合并协调了云端与本地环境中的数据。这种统一视图使得云数据可用于分析和决策,变得易于访问和使用。在快速创新与数据日益碎片化的时代,这一功能至关重要。
数据碎片化会扼杀创新,导致决策迟缓、不一致或不准确,限制了组织创新、适应及实现运营效率的能力。事实上,根据 IBM 商业价值研究院的数据,68% 接受调查的 CEO 表示,整合式的企业级数据架构对于促进跨职能协作和推动创新至关重要。3
人工智能 (AI) 计划尤其依赖于统一、可信且一致的数据。若缺乏强大的数据整合战略,组织可能难以大规模应用 AI。
云数据整合遵循典型的数据整合步骤,但在操作顺序和技术细节上可能有所不同,特别是在如何设计数据管道以协调跨分布式云和混合环境的数据移动与处理方面。
如同传统数据整合一样,云数据整合提供了一系列广泛优势,包括:
实施云数据整合的组织可能面临一系列技术和运营挑战,涵盖治理、性能、实时处理和部署模式等方面。
实时或近实时的数据整合对企业日益关键。即时决策、AI 工作负载和其他时效性操作需要持续不断的新鲜数据流。然而,实时数据整合在技术上具有挑战性,尤其是在需要低延迟处理的海量数据场景下。分布式云架构可能会增加额外的延迟和网络可靠性问题。
支持事件驱动架构 (EDA) 的云数据整合解决方案使系统能够实时通信和交换数据。在云原生环境中,EDA 的日益普及代表了从传统的批处理导向架构向更具动态性、响应性架构的重大转变,这种新架构在事件(数据记录)发生时即对其进行处理。
许多企业在云端之外还有受监管的本地工作负载(例如,存储在 Oracle Database、IBM Db2 或 SQL Server 中的数据集)。在这些场景中,完全基于云的数据整合部署并不实际,因为本地系统与云平台之间可能会发生互操作性挑战。
混合部署通过在数据已驻留的位置处理数据,并在同一环境(无论是云端还是本地)中运行数据管道,有助于应对这些挑战。这些功能有助于降低整合传统系统与云原生系统的复杂性。它们还能证明其成本效益,有助于减少工具泛滥。
混合数据整合部署使用远程引擎执行,这是一种将设计时与运行时解耦的云原生管道开发模式。管道集中设计,并在目标环境中运行——包括云到云、云到本地以及本地到云的工作负载。这种灵活性带来了多重好处,包括减少数据移动、降低出口成本和最大限度减少网络延迟。
利用 AI 来加速、简化和优化数据整合流程有许多应用场景。例如,机器学习辅助的模式映射、用于数据转换的自然语言处理 (NLP) 接口、用于创建合成数据的生成式 AI,以及用于改进数据复制的 AI 驱动技术。4
智能体式 AI 也是一种新兴的现代数据整合能力,它允许数据团队使用自然语言表达整合需求。基于这些输入,智能体可以自主提出整合设计方案,并随着数据环境和业务需求的变化,持续协助优化工作流程。
这些智能体式功能有助于数据工程师更快速地设计和执行数据管道,并减少耗时的重复性工作,如手动数据录入和数据迁移。它们还可以减少非技术用户的等待时间,这些用户通常无法在没有数据工程团队帮助的情况下访问数据。
设计数据战略,消除数据孤岛、降低复杂性并提高数据质量,以获得卓越的客户和员工体验。
watsonx.data 支持您通过开放、混合和已治理数据,利用您的所有数据(无论位于何处)来扩展分析和 AI。
通过 IBM® Consulting 发掘企业数据的价值,建立以洞察分析为导向的组织,实现业务优势。
1 Omdia:AWS 在 2023 年主导了 570 亿美元的全球云存储服务市场,Omdia by Informa TechTarget,2024 年 6 月 17 日。
2 全球数据存储空间预测,2025-2029,IDC,2025 年 6 月。
3 推动业务增长的五大思维转变,IBM 商业价值研究院,2025 年 7 月 9 日。
4 多云环境中的 AI 驱动数据整合,《国际全球创新与解决方案杂志》(IJGIS),2025 年 1 月 31 日。