什么是数据云?

2025 年 1 月 13 日

6 分钟

作者

Mesh Flinders

Author, IBM Think

Ian Smalley

Senior Editorial Strategist

什么是数据云?

数据云是一种数据管理系统,可统一各种数据源,以便组织能够更有效地使用它们。

大多数现代企业都依赖于大型、复杂的 IT 基础设施,这些基础设施将云服务提供商 (CSP) 与本地资源(如服务器和软件)混合在一起。数据云有助于统一这些不同的来源,提高数据管理效率,增强数据完整性并消除孤岛(用户难以访问的孤立数据集合)。
nbsp

如果部署得当,数据云可以帮助医疗保健、金融服务、市场营销、航空航天等行业的企业加速数字化转型并从新技术中获得能力提升。

高速公路鸟瞰图

在云端保持清醒头脑 


获取每周 Think 时事通讯,了解有关在 AI 时代优化多云设置的专家指导。

数据云组件

数据云由三个核心部分组成:数据源、数据架构和数据平台(称为云数据平台)。下面我们逐一介绍这些组成部分及其功能。

数据源

数据源是原始形式的数据集合。一些常见的客户数据源示例包括交易、电子邮件地址、社交媒体帖文和个人身份信息 (PII)(例如,姓名、年龄和实际位置)。数据云必须安全地收集、整合、转换、存储和管理来自各种来源的数据,才能发挥作用。

数据架构

数据架构,也称为数据仓库架构,是指数据存储库的设计,描述组织如何管理数据,涵盖收集、转换、分发和使用。企业根据其业务需求使用各种数据架构和数据模型,包括数据仓库数据湖数据管道数据网格等。

在数据云中,数据架构包括特定协议,旨在提高云生态系统中的数据收集和处理效率。例如,许多现代数据云使用机器学习 (ML) 来更高效地处理数据。

ML 有助于实现以下功能:预测性分析以及使用云架构自动制定决策,从而避免在本地构建和管理必要 IT 架构的成本。对于许多企业来说,ML 是使数据云成为高度可扩展解决方案的功能之一。

数据平台

数据平台是支持数据收集、存储、分析和治理的技术解决方案。在云环境中,数据平台被称为云数据平台,专用于帮助摄取数据并将其从本地存储空间迁移到云。

现代云数据平台可帮助组织治理和分析云或多云架构中的数据,从而优化结构化和非结构化数据集

IBM Think 2024

IBM Think 2024 主题演讲

了解如何利用 AI 和混合云扩展您的业务。

数据云的主要优势

数据云可以在诸多方面帮助组织,包括发掘新的客户洞察分析和自动执行以往需要人工输入的任务。企业级数据云部署的主要优势如下:

加强控制

数据云使 IT 领导者能够通过单一且统一的平台,而非众多孤立、互连的系统来管理和处理数据。例如,在企业用户之间分配数据权限时,数据云管理员可以使用单一控制点而非多个位置来控制策略,从而改善数据治理并提高安全性。

提高灵活性

使用数据云,可在物理工作空间之外控制和共享数据,这是远程员工队伍的重要组成部分。而且,用户还可以从世界任何地方安全地访问关键数据,而不会增加安全风险。

他们还可以在数据湖和数据仓库等常用系统之间无缝移动数据,以实现安全高效的处理,并且可以访问热门的数据云供应商的产品,例如 Salesforce 数据云、Amazon Web Services (AWS)、Microsoft Azure 和 Google Cloud Platform (GCP),以高度可扩展的软件即服务 (SaaS) 模式获得最新的数据云解决方案。

提高性能

数据云依靠现代数据共享协议来改进云存储解决方案之间的数据交换,并优化依赖数据运行的应用程序的性能。数据云可使用应用程序编程接口 (API) 将外部应用程序与数据库相连接,从而帮助应用程序处理数据,无论其类型、格式或结构如何。

数据云解决方案可以轻松处理应用程序所依赖的不同类型的业务数据,例如,交易和分析数据,甚至包括图像和视频等非结构化数据。数据云指标可帮助 IT 管理人员监控数据云解决方案的有效性,并发掘进一步提高效率和节约成本的机会。

增强安全性

现代数据云解决方案配备了强大的安全技术,有助于保护组织,避免代价高昂的网络攻击数据泄露。去年的一份报告表明,数据泄露的平均成本为 488 万美元,比上一年增长 10%,是迄今为止的最高金额。

数据云解决方案通过自动执行许多安全任务来简化数据保护,这些任务过去需要人工输入,例如,遵守监管和治理规则。

无缝协作

数据云可优化用户对各种数据的访问并简化业务流程,使整个企业的员工都能通过单一仪表板安全可靠地访问其所需的信息,从而高效开展协作。

借助强大的现代数据云解决方案,员工可以访问结构化和非结构化数据集,并应用高级分析来发现有价值的洞察分析。

运营数据云的挑战

尽管运营数据云可提供很多好处,但组织也面临一些挑战。具体来说,寻求将大量数据从本地环境迁移到云的组织面临三个常见障碍:数据摄取、数据完整性以及运营数据云的员工的技能提升。

摄取

将大型、多样化的数据集移动到云端,通常意味着从格式可能不同的来源移动数据,并且需要在不同的环境中进行安全传输和管理,此过程称为数据摄取

在数据摄取过程中,收集来自不同来源的各种数据文件并将其导入数据库中进行清理和存储,以供组织访问。

如果来自不同来源的数据在传输到新的存储环境(例如数据湖或仓库)之前需要清理或标准化,则可能会导致流程延迟甚至错误。

完整性

为了维护数据完整性(即数据的准确性、一致性和完整性),企业必须在数据传输全程保持极高精度。而在面对多套法规时维持数据完整性,堪称“风险高发领域”。

将数据移动到云时,组织必须遵守因地区不同而异的数据隐私法规。组织拥有和运营的基础设施在本地存储的数据受一套合规法律的管辖,而当这些数据存储在云中时,则可能受另一套合规法律的管辖。

元数据(有关数据集来源的信息)特别容易受到不法分子的攻击,因为它通常包含敏感的 PII,例如,与数据相关的个人的姓名、IP 地址和物理位置。

技能提升

将数据从本地存储迁移到云需要云计算方面的数据管理专业知识,这迫使企业招聘新人才或重新培训现有 IT 团队(提升技能),而二者都是成本高昂且资源密集型的提议。

IT 团队在数据云环境中工作所需要掌握的新技能主要包括:处理数据治理和安全、掌握数据建模和工作流、以及学习采集数据并将其整合至云存储环境的具体方法。

数据云用例

从构建新的创新应用程序到改善客户体验,数据云可帮助组织找到管理和使用其最宝贵数据的新方法。以下是当今数据云的一些最常见、最有效的用例。

云应用程序开发

云计算是现代应用程序开发的核心,它使开发人员能够通过编写代码、部署和管理数据库以及测试应用程序功能来简化其开发生命周期,上述操作均可在云端进行。

数据云可简化开发人员与数据集的交互方式,并将其轻松整合至正在构建的应用程序中。数据云利用边缘计算物联网 (IoT) 功能,使应用程序更接近数据源,从而确保传输大量实时数据流(又称“数据流”)的应用程序(如 Twitch 和 TikTok)能够正常运行。

高级分析

现代数据云可存储结构化数据和非结构化数据,使用户能够轻松、安全地分析这两组数据,以实现各种分析目的。例如,分析师可以利用数据云更好地了解客户关系管理 (CRM) 和客户数据,并创建客户档案以解决业务问题,这一过程被称为“身份解析”。

数据云还广泛用于情感分析和客户数据平台的创建,以分析大量文本数据来确定其表达的是正面情感还是负面情感。

人工智能 (AI)

希望将人工智能 (AI) 用于业务目的的组织依赖数据云来提供集中、高度可扩展的数据存储解决方案,以便在训练 AI 模型时处理海量数据。在现代数据云中,可以安全地存储文本、图像、音频、视频、感官和其他类型的数据,并从安全位置轻松访问这些数据。

市场营销领域的数据云(又称“营销云”)有助于将预测性分析、自然语言处理 (NLP) 和图像识别等尖端 AI 功能编入高级应用程序。例如,Salesforce 的 Agentforce 是一项 AI 解决方案,可在多个业务职能中执行数据驱动的操作。1

业务连续性和灾难恢复

现代数据云在业务连续性灾难恢复 (BCDR) 流程中发挥着重要作用,可帮助企业在灾难发生后恢复正常运营。

在数据云出现之前,数据必须在不同平台的存储空间之间移动,随着公司需要存储的数据量越来越大,这个过程变得越来越困难。

数据云可以在一个互联的基础设施中托管任务关键型工作负载,提供快速、安全的访问以及一套功能强大的安全和恢复选项。

相关解决方案

IBM Cloud 免费套餐

创建免费 IBM Cloud 帐户并访问 40 多种始终免费的产品,包括 IBM Watson API。

创建帐户
IBM Cloud

IBM Cloud 是专为受监管行业设计的企业云平台,提供 AI 就绪、安全的混合解决方案。

深入了解云解决方案
云咨询服务

利用 IBM 的云咨询服务发掘新功能并提升业务敏捷性。了解如何通过混合云战略和专家合作共同制定解决方案、加快数字化转型并优化性能。

云服务
采取后续步骤

利用 IBM 安全可扩展平台释放 AI 和混合云的全部潜力。首先深入了解我们的 AI 就绪解决方案,或创建免费帐户,以访问始终免费的产品和服务。

深入了解 IBM® Cloud AI 解决方案 创建免费的 IBM Cloud 账户
脚注

1 Salesforce 的 Agentforce 对企业数据的影响,《福布斯》,2024 年 9 月 3 日。