データ・ファブリックとは
データ・ファブリックがどのように分散環境全体で、動的でインテリジェントなデータ・オーケストレーションを可能にし、データ消費者が使用できるようにするのかを説明します。
世界のAI導入実態調査レポート2022
机の上で作業しているコンピューター・プログラマーの高いアングルからのビュー
データ・ファブリックとは

データ・ファブリックとは、インテリジェントな自動システムを使用して、さまざまなデータ・パイプラインやクラウド環境のエンドツーエンドの統合を促進するアーキテクチャーです。 過去10年間で、ハイブリッドクラウド人工知能、モノのインターネット(IoT)、およびエッジコンピューティングにおけるさまざまな発展により、ビッグデータが指数関数的に成長し、企業によるデータ管理がますます複雑化してきています。 その結果、このようなビッグデータの成長により、データ・サイロ、セキュリティー・リスク、意思決定を妨げるさまざまなボトルネックなどの大きな課題が出現してきたため、データ環境の統合とガバナンスは、ますます優先度が高くなっています。 データ管理チームはデータ・ファブリック・ソリューションを使用してこれらの課題に正面から取り組んでいます。 データ・ファブリック・ソリューションを活用して、異種のデータ・システムを統合し、ガバナンスを組み込み、セキュリティとプライバシーの対策を強化し、働く人、特にビジネス・ユーザーがより容易にデータにアクセスできるようにしています。

データ・ファブリックを介したこうしたデータ統合の取り組みによって、より包括的なデータ中心の意思決定が可能になります。 歴史的に見て、企業では、個々の業務に合わせて異なるデータ・プラットフォームが使用されてきた可能性があります。 例えば、人事データ用のプラットフォーム、サプライチェーン・データ用のプラットフォーム、顧客データ用のプラットフォームが1つの企業内に存在し、これらのプラットフォームでは、異なる、別個の環境にデータが保存され、重複するデータが複数の環境で保存されてきた可能性もあります。 しかし、データ・ファブリックの導入により、以前には存在しなかったデータ間のつながりを明らかにして、データをよりまとまりのある状態で表示し、意思決定者が顧客のライフサイクルをより深く把握できるようにできます。 顧客、製品、プロセスの理解におけるこのような溝を埋めることにより、データ・ファブリックは、ビジネス全体でデジタル・トランスフォーメーションと自動化のイニシアチブを加速します。

データ・ファブリックとデータの仮想化

データの仮想化は、データ・ファブリック・アプローチを可能にするテクノロジーの1つです。 データ仮想化ツールは、標準ETL(抽出、変換、ロード)プロセスを使用してさまざまなオンプレミスやクラウドのソースからデータを物理的に移動するのではなく、さまざまなソースに接続し、必要なメタデータのみを統合して、仮想データ層を作成します。 これにより、ユーザーはリアルタイムでソース・データを活用できます。


データ・ファブリック・アーキテクチャー

データ・サービスとAPIを活用することで、データ・ファブリックは、レガシー・システム、データレイクデータウェアハウスSQLデータベース、アプリケーションのデータをまとめて、業績の総合的なビューを提供します。 個々のデータ・ストレージ・システムとは異なり、データ・ファブリックでは、複数のデータ環境間でデータの流動性を高めて、データ重力の問題、つまりデータのサイズが大きくなるにつれて、そのデータを移動するのが困難になるという考え方に対処することを目指しています。 データ・ファブリックは、データの移動、変換、統合にかかわる技術的な複雑さを取り除き、すべてのデータを企業全体で使用できるようにします。

データ・ファブリック・アーキテクチャーは、複数のプラットフォーム上のデータをそのデータを必要とするアプリケーションと緩く結合します。 マルチクラウド環境内のデータ・ファブリック・アーキテクチャーの例を以下に示します。ここでは、AWSのような1つのクラウドでデータの取り込みが管理され、Azureのような別のプラットフォームでデータの変換と消費を監視します。 次に、分析サービスを提供するIBM Cloud Pak®のような第3のベンダーが使用される場合があります。 データ・ファブリック・アーキテクチャーは、これらの環境をつなぎ合わせて、データの統合ビューを作り出します。

とはいえ、これはほんの一例です。 それぞれの企業には、異なるニーズがあるため、単一のデータ・ファブリックのデータ・アーキテクチャーによってすべての企業のニーズを満たすことはできません。 多くのクラウド・プロバイダーと多彩なデータ・インフラストラクチャー実装が存在するため、企業には十分な選択肢が提供されます。 ただし、このタイプのデータ・フレームワークを使用する企業のアーキテクチャーには、データ・ファブリック特有の特徴が見られます。 さら具体的に述べると、これらは6つの基本的なコンポーネントで構成されています。これについては、Forrester社 (ibm.com外部へのリンク)のレポート「エンタープライズ・データ・ファブリックがDataOpsを可能にする」で説明されています。 これらの6つの層には以下が含まれています。

  1. データ管理層:この層は、データ・ガバナンスとデータのセキュリティーを担当します。
  2. データ取り込み層:この層ではクラウドのデータのつなぎ合わせが開始され、構造化データと非構造化データの関係が特定されます。
  3. データ処理層:この層ではデータを精製することで、関連性のあるデータのみが表示されて、データ抽出が可能となります。
  4. データ・オーケストレーション層:この必要不可欠な層では、データの変換、統合、クレンジングなど、データ・ファブリックにとって最も重要なジョブのいくつかが行われ、その結、企業全体のチームがデータを使えるようになります。
  5. データ・ディスカバリー層:この層では、異なるデータ・ソースを統合するための新しい機会が表示されます。 例えば、ここでサプライ・チェーン・データ・マートとカスタマー・リレーションシップ管理データ・システムにあるデータをつなげる方法を見つけ出して、製品オファリングを顧客に提供する新しい機会や、顧客満足度を向上させるための新しいやり方を実現できるかもしれません。
  6. データ・アクセス層:この層では、特定のチームに政府の規制を遵守するのに必要な適切な許可を確実に付与しながら、データの消費を可能にします。 また、この層では、ダッシュボードやその他のデータ可視化ツールを使用して関連性のあるデータを表示できます。 

データ・ファブリック・アーキテクチャーのメリット

Gartner社(ibm.com外部へのリンク)の報告によると、データ・ファブリック・プロバイダーが市場でより多くの企業へデータデータ・ファブリックの導入進めるにつれて、特に効率性に改善がみられ、「統合設計にかかる時間を30%、実装にかかる時間を30%、また保守にかかる時間を70%短縮できる」ようになりました。 データ・ファブリックによって全体的な生産性を向上できるのは明らかですが、以下のようなメリットから、導入する企業にとってビジネス価値があることも実証されました。

  • インテリジェントな統合:データ・ファブリックではセマンティック・ナレッジ・グラフ、メタデータ管理、機械学習を使用してさまざまなデータ・タイプとエンドポイント全体でデータを統合します。 これは、データ管理チームが関連性のあるデータ・セットをクラスター化し、新しいデータ・ソースを企業のデータ・エコシステムに組み込むのに役立ちます。 この機能は、データ・ワークロード管理の様々な側面を自動化して前述の効率性の向上の獲得につながるだけではなく、データ・システム全体に広がるサイロの解消、データ・ガバナンス手法の一元化、全体的なデータ品質の向上に役立ちます。
  • データの民主化:データ・ファブリック・アーキテクチャーは、セルフサービス・アプリケーションを促進して、データ・エンジニア、開発者、データ分析チームなどのようによりテクニカルな人材以外でもユーザーがデータにアクセスできるようにします。 データのボトルネックの削減によって、ビジネス・ユーザーがより迅速に意思決定を行えるようにし、また技術ユーザーを解放することで、技術ユーザーがそのスキル・セットをより有効に使用できるタスクを優先できるようにして、生産性の向上をもたらします。
  • より優れたデータ保護:データ・アクセスの拡大は、データ・セキュリティーとプライバシー対策について妥協するということではありません。 実際にあ、より多くのデータ・ガバナンスのためのガードレールがアクセス制御機能の周辺に設置されることを意味し、特定のデータが特定の役割の人にだけ利用可能になる状態を確保します。 データ・ファブリック・アーキテクチャーはまた、テクニカル・チームやセキュリティー・チームが機密データやプロプラエタリー・データにデータのマスキングや暗号化の機能を実装できるようにして、データ共有やシステム違反のリスクを軽減します。 

データ・ファブリックのユースケース

データ・ファブリックは導入の観点から見るとまだ初期の段階にありますが、そのデータ統合能力は企業のデータ・ディスカバリーに役立ち、多様なユースケースに採用されています。 データ・ファブリックが処理できるユースケースは他のデータ製品とそれほど異なるわけではありませんが、データ・サイロの解除に関して処理できる範囲と規模については、データ・ファブリックは突出しています。 さまざまなデータ・ソース全体を統合することにより、企業と企業のデータサイエンティストは、顧客の全体的なビューを作成できます。このビューは、特に銀行業界のお客様にとって大変役立ちます。 データ・ファブリックは、具体的には以下のような目的で使用されています。

  • 顧客プロファイル、
  • 不正行為の検出、
  • 予防保全分析、
  • 職場復帰リスク・モデルなど。

関連ソリューション

IBM Cloud Pak for Data

IBM Cloud Pak for Dataは、オープンで拡張可能なデータ・プラットフォームで、データ・ファブリックを提供し、任員のクラウド上ですべてのデータを、AI用と分析用に使用できるようにします。


IBM Watson® Studio

AIモデルを構築、実行、管理します。 オープンソース・コードまたはビジュアル・モデリングを使用して、データを準備し、任意のクラウドでモデルを構築します。 結果を予測して最適化します。


IBM® Db2® on Cloud

堅固なパフォーマンスを実現するために構成され、最適化されたフルマネージドのSQLクラウド・データベース、Db2 on Cloudをご覧ください。



次のステップ

データ・ファブリックとIBM Cloud Pak for Data

IBM Cloud Pak® for Dataは、マイクロサービス、主要なデータ、AI機能を活用して、分散システム全体でデータのインテリジェントな統合を可能にし、企業にビジネス・パフォーマンスの全体像を提供します。 これにより、エンタープライズ・データの収集、編成、洞察が迅速になり、企業は大規模な意思決定を行うことができます。 データ管理チームはまた、競争力のあるIBMのセキュリティー・フレームワークを使用することでデータの安全性を信頼できるため、規制ポリシーを確実に順守し、コンプライアンスのリスクを低減できます。