IBM InfoSphere QualityStageは、データ品質と情報ガバナンスの取り組み支援を目的として設計されており、データの調査、クレンジング、管理を可能にして、お客様、ベンダー、ロケーション、製品などの主要エンティティにおける視点の一貫性維持に役立ちます。このソリューションは、ビッグデータ、ビジネス・インテリジェンス、データ・ウェアハウジング、アプリケーション移行、およびマスター・データ管理といった各種プロジェクトに高品質のデータを提供するのに役立ちます。IBM System zでも使用できます。
データのプロファイリング、標準化、確率的マッチング、エンリッチメントなどの機能を提供します
完全な情報統合プラットフォームの一部としてデータ品質機能を提供します
組織間で機能を使用できるようにして、情報ガバナンス・ポリシーをサポートします
データの統合、品質、可用性をデータレイク環境に組み込んで、解明プロセスを加速し、インサイト活用の道を開きます。
モダナイゼーション手法の中でも特に効果的な一例として、EDWデータとETLワークロードをApache Hadoopデータレイクにオフロードすることが挙げられます。
データを詳細にプロファイリング・分析することで、テーブルとファイルの内容、品質、構造を理解します。例として、列分析、データ分類、データ品質スコア、関係分析、複数列主キー分析、重複分析が挙げられます。
データの変換中、およびデータ・ウェアハウス、データレイク、またはアプリケーションにデータを読み込む前に、データ品質ルールを実行することで、「不良」データの取り込みを防止します。標準装備されている200以上のルールを使用して、データを適任者に転送し、確実に修正を加えて信頼できるデータにします。
個人を特定できる情報(PII)、機密データ、およびその他のクラスのデータが保存される場所を特定します。また、クレジットカード、納税者番号、米国の電話番号など、標準装備されている250以上のデータ・クラスを使用して、列に含まれるデータ型も識別します。有効な値のリスト、正規表現(regex)、Javaクラスの3種類のデータ・クラスを作成およびカスタマイズできます。
さまざまなソースから収集された全データをターゲット環境の共通形式または標準に合成します。重複を削除し、複数のシステムを統合ビューにまとめて、信頼できる正確なデータを作成します。
データ・ルール別健全性概要レポートを利用すると、情報ガバナンスにリンクされていないルールも表示されます。この仕組みには、例外を管理するためにデータ・ルールを有効にするケースに対応する目的があります。
柔軟な導入オプションとサブスクリプション価格で、プライベートクラウドまたはパブリッククラウドに移行できます。オンプレミスの容量を拡張したり、クラウドに直接移行したりできます。価値実現までの時間短縮、管理コストの削減、サブスクリプション料金体系のリスク軽減に役立ちます。
特定の列への用語割り当てと提案に列名とデータ・クラスを使用して、機械学習によるメタデータ分類プロセス(自動タグ付け)を加速します。
統一された環境でデータをクレンジングし、データ品質を監視します。
Hadoopのビッグデータ・ストレージ・クラスターに、データ品質、プロファイリング、クレンジング、モニタリング用の豊富な機能一式を提供します。
ガバナンス・プラットフォームと統合されたエンタープライズ・データ・カタログで、データ・シチズンがビジネスにすぐに使えるデータを迅速に発見、キュレート、分類、管理、分析、共有するのに役立ちます。
データ統合に関するGartnerマジック・クアドラントのリーダーとしての過去10年にわたるIBMの軌跡をご覧ください。
最新リリースがデジタル・トランスフォーメーションに向けて信頼できる分析基盤を作成するための要素をどのように提供するかをご覧ください。
この世界的住所検証ソリューションは、IBMのプラットフォーム内専用AVインターフェイスと簡単に統合し、アクセス可能です。