集成 Hadoop 大数据

IBM BigIntegrate 是一个大数据集成解决方案,可提供出色的连接、快速的转换,以及可在 Apache Hadoop 集群的数据节点上执行的可靠且易用的数据传递功能。IBM BigIntegrate 提供灵活且可扩展的平台来抽取、转换和集成 Hadoop 数据。

BigIntegrate 和 IBM BigQuality 隶属于专门为在 Hadoop 集群上运行而构建的 IBM InfoSphere® Information Server 产品家族,它们为 Hadoop 数据提供了端到端的集成和治理功能。

优势

提供 Hadoop 大数据集成

提供可在 Hadoop 集群中本地运行的大规模可扩展、无共享的内存数据集成引擎,帮助将企业大数据分析功能引入数据湖。

支持数据概要分析

交付丰富的数据概要分析功能集,用于了解迁移到 Hadoop 中的资产。

改进大数据导航功能

使用元数据管理来帮助了解数据湖中的大量信息。

实施大数据治理

几乎可在任何集成点提供与大数据相关的治理功能,如影响分析和数据沿袭,从而在不牺牲组织洞察的情况下启用可扩展分析。

使用实时分析

利用实时分析处理改造大数据项目。与 IBM Streams 集成。使用标准数据集成约定来收集数据,并将数据传递至强大的大数据分析工具。

功能

用户界面现代化与整合

IBM InfoSphere DataStage® Flow Designer 作为 IBM InfoSphere Information Server 产品家族中的一个重要集成工具,提供了自动模式传播功能,突出显示了编译错误,带有输入提示搜索并与任何现有的 DataStage 作业兼容。

改进了数据湖上的管理和运行时

通过改进的高可用性、更高的容器估算精度以及用于更快无间断执行的队列管理等措施,以安全永续的方式运行 Information Server on Hadoop。

可连接众多数据源的连接器

功能丰富的选用板包含可连接大量数据源的连接器,这些数据源包括在分布式、IBM z/OS® 和文件类型系统等平台上运行的主要传统数据库。BigIntegrate 支持常见的大数据企业存储应用,包括基于 Oracle、Salesforce、SAP、Hadoop 和其他分布式大数据仓储框架而构建的应用。简单的拖放式用户界面更便于获取数据源。

更易于集成 Hadoop 大数据

支持应用开发者更轻松地管理和无缝集成 Hadoop 分布式大数据源。提供一个功能齐全的可扩展 Hadoop 集成平台,用于发现、查找、转换和集成大数据,而不论它位于何处或数据类型如何。更快、更轻松地应用治理规则,支持可扩展分析,如影响分析和数据沿袭,而不会牺牲组织洞察。

数据仓储转换

将传统数据仓库工具与当前的大数据分布式存储方法和技术相结合。使用 BigIntegrate 的独特功能,挖掘 Hadoop 数据存储集群、流计算技术、数据探索、高级分析和 IBM Watson® 认知计算的全部潜力。更高效、更迅速地向企业应用用户提供大数据洞察力。

IBM BigQuality 的强大功能

通过结合使用 IBM BigIntegrate 与 IBM BigQuality,充分利用 Hadoop 大数据的规模和容量,在整个大数据生态系统中实现信息赋能。持续清理和监控数据质量,将集成的 Hadoop 大数据转换为广泛企业应用可使用的可信信息。

您可能还对以下内容感兴趣

IBM InfoSphere Information Server for Data Integration

有助于理解、清理、转换、监控和交付可信且上下文丰富的信息。

IBM InfoSphere DataStage

高度可扩展的数据集成工具,用于设计、开发和运行在本地和云端移动和转换数据的作业。

IBM InfoSphere Information Server Enterprise Edition

获得端到端信息集成功能,帮助您理解、治理、创建、维护、转换和交付高质量数据。

请联系 IBM 获取定价

Chat Now