释放数据并发掘新锐业务洞察

IBM Cloud® Object Storage 支持组织构建集中式数据存储库,利用经济有效且可扩展的存储,进而能够从任何来源收集和存储几乎无限数量的任何类型的数据。数据保持其本机格式,无需移入和移出 IBM Cloud Object Storage。基于 IBM Cloud Object Storage 的数据湖是用于分析的持久数据存储库。
IBM Cloud Object Storage 与 IBM Analytics Engine、IBM Watson® Studio、IBM Cloud SQL Query 和其他 IBM Cloud 服务集成,提供自助式数据分析和商业智能解决方案,其可扩展性、安全性和成本效率已远远高于传统解决方案。

常见用例

将数据从 HDFS 集群移至 IBM Cloud Object Storage

通过高效地将大量数据从 Hadoop 迁移到 IBM Cloud Object Storage,释放昂贵的 Hadoop 集群上的空间。

就地查询数据

作为活动工作空间用于广泛的数据分析用例,并具有就地查询功能,让您能够直接在静态数据上运行分析。

直接对存储在对象存储设备中的数据执行 Apache Spark 分析

用作低成本的可扩展持久存储层,以便通过以优化方式连接到 Apache Spark 进行分析。

存储 AI 训练模型的数据

加速必要的机器学习和深度学习工作流程,将 AI 融入到业务当中。构建并训练 AI 模型,同时在一体化环境中准备并分析数据。

构建和分析 IoT 管道

以低成本存储大量的 IoT 数据,并允许分析框架直接访问数据。可以轻松设置和管理数据管道,以生成分析就绪数据。

客户成功案例:斯科讷大学医院

IBM Cloud Object Storage 因其可靠、经济实惠、全球可用的特性,且更重要的是提供近乎无限容量,让斯科讷大学医院能够尽可能收集和保留尽可能多的手术信息。

主要功能

轻松地将数据从 HDFS 集群移动到 IBM Cloud Object Storage

通过使用 IBM Big Relicate 将 Hadoop 数据集群之间的数据高效移动到 IBM Cloud Object Storage 上,释放昂贵的 Hadoop 集群上的空间,提供可保证数据一致性的连续复制。您还可以使用 IBM Cloud Object Storage Distributed Copy (DistCp),这是一个开源工具,用于将大量数据从 Hadoop 迁移到 IBM Cloud Object Storage。

就地查询数据

IBM Cloud SQL Query 是一种完全管理的服务,支持开发者使用 ANSI SQL 语句来分析和变换多个文件中存储的各种格式的数据。该服务可以查询 IBM Cloud Object Storage 中存储的 CSV、Parquet、JSON 和 ORC 文件,而无需提前移动或变换数据。IBM Cloud SQL Query 使用了 Apache Spark,这是一种开源、快速、可扩展、内存中的数据处理引擎,针对低延迟的数据特别分析进行了优化。

执行 Apache Spark 分析

IBM Cloud Object Storage 为 Apache Spark 服务提供优化的连接,可存储多个来源的数据,并快速获取洞察。通过结合使用 IBM Cloud Object Storage 和 Spark 分析,使计算层和存储层完全分离,从而允许用户将数据存储在对象存储层中,并在用户需要时启动计算节点集群。对于此模型,计算和存储可以独立扩展(和购买),这样一来,在没有作业运行时,计算成本就可降至零。洞察保留在 IBM Cloud Object Storage 中,并且可以重新采集数据以便未来进行分析。

存储 Watson 机器学习和深度学习工作流程的数据

IBM Watson Studio 是基于最佳开放源码和 IBM 工具而构建的混合云平台,用于分析数据并使用它来构建和部署 AI 模型。IBM Cloud Object Storage 与 IBM Watson Studio 在 IBM Cloud 上集成。在 IBM Watson Studio 中创建机器学习项目时,会自动创建 IBM Cloud Object Storage 实例,进而加速处理训练和部署机器学习以及深度学习模型所需的数据。

执行智能数据发现和治理

一旦您的数据位于 IBM Cloud Object Storage 中,就可以使用 Watson Knowledge Catalog 进行管理,使用数据概要文件来细分和保护数据,从而能够更好地管理数据。通过实施元数据目录,IBM Watson Knowledge Catalog 可大致了解数据及其适用的数据策略,然后实施这些策略。IBM Watson Knowledge Catalog 包括智能数据发现,它与 IBM Watson Studio 相集成,支持从在企业内“查找”信息无缝过渡到“使用”信息。

轻松构建和分析 IoT 数据管道

对象存储旨在以低成本存储大量的 IoT 数据,并允许分析框架直接访问数据。IBM Cloud 提供基于 Apache Kafka 和 Apache Spark 的服务,分别包括 IBM Events Streams 和 Spark 即服务。可以轻松设置并管理从 IBM Event Streams 到对象存储的数据管道,进而生成分析就绪数据,IBM Watson 可使用 Spark 即服务直接分析这些数据。此外,IBM Watson IoT Platform 可用于捕获 IoT 设备数据,并将其发送到 IBM Event Streams。

成功案例

经济有效、安全可靠且始终可用的数据

简单的数据收集和采集

IBM 提供多种方式将您的数据传输到 IBM Cloud Object Storage 中,包括本机集成的 Aspera® 高速数据传输功能,用于通过网络快速传输数据。此外,利用诸如 IBM Event Streams 之类的服务可以轻松地实时采集数据。IBM Big Replicate 可以高效地将 Hadoop 数据集群之间的数据移动到 IBM Cloud Object Storage 上,提供持续复制,同时还可以使用开源工具 IBM Cloud Object Storage Distributed Copy (DistCp) 将大量数据从 Hadoop 迁移到 IBM Cloud Object Storage 上。

经济有效且灵活多变

通过使用 IBM Cloud Object Storage,组织可以构建集中式数据存储库,利用经济有效且可扩展的存储,进而能够从任何来源收集和存储几乎无限数量的任何类型的数据。数据以本机格式存储,不需要预先变换。

随时可用

IBM Cloud Object Storage 可帮助组织内的数据科学家、业务分析员和应用开发人员轻松访问数据,具有的可用性几乎无与伦比。它旨在提供 99.999999999% 的耐久性*,并且使用专利技术来确保可用性,其中数据经过加密,并在多个 IBM 数据中心设施内的多个设备间进行分发。

*基于 IBM 对客户数据的内部分析。各个客户的结果会有所不同。

高度安全性

IBM Cloud Object Storage 使用自动服务器端加密来保护数据,并提供使用 IBM Key Protect 密钥管理系统所管理密钥的加密选项,或者使用您管理的密钥进行加密。通过与 IBM Identity and Access Management 集成,可确保按用户角色进行细粒度访问控制,具体可深入至数据存储区级别。

Next Steps

* IBM 云计算服务由 IBM 美国公司在中国境外提供给客户使用,某项具体服务的可用性将受限于您所在国家法律、法规的监管要求。

IBM 专家为您服务(工作日9:00-17:00)