作为数据领导者,您知道从数据中获取价值归根结底是在正确的时间提供正确的数据,无论数据位于何处。这种能力有赖于将现代数据架构作为数据战略的一部分。
适用的数据架构能够将业务需求转化为数据和系统要求,并管理整个组织的数据保护和数据流。请记住,这并不是一个放之四海而皆准的配方。这种框架应由业务需求驱动,并支持短期和长期目标。“单一的结构化静态架构的时代已经一去不复返,”IBM Expert Labs 数据精英架构师 Paul Christensen 说道。“当今的业务由动态和静态数据、多形式数据以及不同质量和可信度的数据驱动。”
由于数据比以往更多地分布在本地和云端,数据架构解决方案对于满足业务的特殊需求、应用数据分析以及大规模使用数据和 AI 而言都至关重要。对于当今的大多数组织而言,现代数据架构不仅是一种选择,更是迫切的必需品。
如何找到并确定这些特殊需求,以便选择恰当的技术?数据拓扑可帮助您对真实场景进行分类和管理,以构建考虑用户、使用情况、约束条件和数据流的新式数据架构,并可高度灵活地满足未来需求。
了解 watsonx
注册获取 AI 更新
云现代化的兴起不一定会降低复杂性或成本、消除数据孤岛或进行治理和合规管理。事实上,研究表明,68% 的数据仍未得到使用。¹
采用 Data Fabric 这种简化数据访问和促进自助数据消费的架构方法,以便制定更好的决策。Data Fabric 包含适当的控制措施,以支持组织内所需的数据流、流程和数据使用者。这种现代数据架构通过智能和自动化功能为各种数据管道和云环境的端到端集成铺平了道路。
Data Fabric 的基础是联合活动元数据,通常称为描述数据的数据。数据库或数据源和目标也是关键组件。这些数据源需要根据其支持任何所需工作负载的能力进行选择,无论是事务、操作还是混合事务和分析处理,并涉及人工智能、商业智能、报告或高级分析。
“客户可能会有多达九种不同的数据库类型,每种类型均包含大量实例。Data Fabric 为客户试图管理的数据孤岛和数据碎片带来了秩序,”IBM 数据库产品系列产品负责人 Edward Calvesbert 说道。
通过虚拟化层,Data Fabric 汇集了多个来源的实时数据,包括现有系统、数据库、数据湖、数据仓库、边缘和内存存储库。这些数据源可以运行事务、操作或分析工作负载,并存储结构化和非结构化数据类型。这种编排可集中覆盖数据环境的所有方面。
借助这些端到端功能,Data Fabric 可协助确保各种来源的数据均可成功实现组合、访问和治理,以便业务用户、数据科学家、数据工程师和数据分析师可以让数据发挥作用。该架构还通过提供已治理数据集来助力企业 AI 应用程序,从而支持在 AI 等领域进行规模化创新。
我们已经讨论了 Data Fabric。那数据网格呢?这是另一种在数据驱动架构中简化企业范围数据使用的方法。
Data Fabric 和数据网格都是数据架构概念。二者都遵循用例驱动设计,旨在解决数据蔓延、数据治理和数据可用性方面的挑战。Data Fabric 和数据网格方法也都依赖于持续的数据发现和自助服务数据知识目录。好消息是,这些数据架构概念是互补的。
区别在哪里呢?数据网格架构属于领域特定且与技术无关,专为分析用例而设计。相比之下,Data Fabric 专为运营用例和分析用例而设计。虽然 Data Fabric 提供了所有数据资产的统一视图,但实际数据存储可以是分散的、集中的或二者兼具。同样,Data Fabric 架构支持从联合式到分布式等多种组织架构。最后,Data Fabric 架构使用人工智能和机器学习技术来自动化数据发现,数据分类和策略实施。
1 重新思考数据:让更多业务数据发挥作用 - 从边缘到云端(PDF,ibm.com 外部链接)。Seagate Technology,2020 年 7 月。
2 “数据完整性趋势:2021 年首席数据官观点”(ibm.com 外部链接)。Corinium,2021 年 6 月 18 日。