Call Out

提高 Hadoop 数据质量

IBM BigQuality 是一种数据质量解决方案,提供一系列丰富的数据概要分析、清理和监视功能,可在 Apache Hadoop 集群的数据节点上执行。IBM BigQuality 通过管理和监控数据,对 Hadoop 数据应用数据质量规则,帮助确保信息质量,快速适应战略性的业务变化。

BigQuality 和 IBM BigIntegrate 属于 IBM InfoSphere® Information Server 产品系列,专门设计在 Hadoop 集群上运行,提供端到端的 Hadoop 数据集成和治理功能。

优势

提供强大的数据功能

提供大规模可扩展、无共享、内存中的数据集成和质量平台。在 Hadoop 集群中本机运行,为数据湖提供强大功能。

启用深度数据概要分析

交付一系列丰富的数据概要分析功能,用于深入了解移动到 Hadoop 分布式数据存储集群中的资产。

支持数据隐私

通过确定个人可识别信息 (PII)、敏感信息和其他类型的数据的存储位置,提供有关数据隐私、数据掩盖和测试数据管理计划方面的支持。

加速实现价值

通过使用三十六个预先定义的现成数据类别(包括信用卡、纳税人 ID 和美国电话号码等),标识列中包含的数据类型,从而加速实现价值。

提供强大的数据工具

支持直接在 Hadoop 集群中运行数据调查、标准化、匹配、存活性以及地址验证。提供 USAC 和 AVI 地址清理和验证。

功能

具有拖放功能的易用 GUI

为便于使用而设计的图形界面帮助组织快速转换整个企业中的信息。与 IBM BigIntegrate 结合使用,创建功能丰富的应用选用板,其中包含连接器,用于连接范围广泛的数据源,包括所有主要的传统数据库和平台 - 分布式、IBM z/OS®、各种文件类型、Oracle、Salesforce.com、SAP、Hadoop,等等。开发人员可通过简单的拖放功能处理这些数据源。

通过内置转换功能,加快开发速度

IBM BigQuality 是高度可扩展的数据质量解决方案,旨在帮助提高性能。通过特定接口以及 IBM BigIntegrate 的内置支持,轻松实现与常见数据源的本机连接。内置数以百计的转换函数,帮助加快开发进度。通过使用和复用强大的现成数据质量和集成功能,减少定制编码所需的时间。

全面和可定制的数据清理

批量和实时使用全面且可定制的数据清理功能,自动进行源数据调查和数据分类。这种自动化功能使数据管理团队能够有效管理数据资产,并使用可信的数据更快地响应业务目标。自动化功能可按需扩展,帮助您更好地处理目前发送到 Hadoop 的数量激增的数据。

自动化的调查和分类,旨在改进治理

随着数据提供者和使用者群体不断扩大,数据敏感度的不确定性以及确保数量快速增长的数据遵守强制法规要求的难度也越来越高。IBM BigQuality 可帮助调查各种数据源(包括 Hadoop),并根据预定义策略,确保正确放置和使用数据。IBM BigQuality 根据可定制的业务规则来规范和匹配记录。

改进数据仓储

利用 IBM BigIntegrate 的强大功能进行部署,创建功能齐全的集成数据解决方案,可为任何组织部署大数据和分析功能。将传统的数据仓库工具与最新的大数据方法和技术相结合,包括 Hadoop、流计算、数据探索、高级分析、企业集成和 IBM Watson® 认知计算。

Hadoop 本机数据集成

与 IBM BigIntegrate 配合使用,支持组织集成和转换任何 Hadoop 数据。利用现有和新的数据源,开展大数据计划。利用可扩展的企业级监控、清理和其他丰富而强大的数据质量功能,提高数据质量。持续将 Hadoop 数据转换为可信的受管信息。

您可能还对以下内容感兴趣

IBM InfoSphere Information Server for Data Quality

提供丰富的功能,帮助组织持续清理数据并监控数据质量,将数据转换为可信赖的信息。

IBM InfoSphere QualityStage®

帮助创建和维护企业数据实体(如客户、位置、供应商和产品)的准确视图。

IBM InfoSphere DataStage®

高度可扩展的数据集成工具,用于设计、开发和运行在本地和云端移动和转换数据的作业。

请联系 IBM 获取定价

Chat Now