データ・ファブリックは、組織全体でデータ・アクセスを民主化するために設計された最新のデータ・アーキテクチャーです。インテリジェントで自動化されたシステムを使用して、大規模にサイロを取り除き、データ資産を管理し、データ管理を最適化します。
過去10年間、ハイブリッドクラウド、人工知能、モノのインターネット(IoT)、エッジコンピューティングの進歩により、ビッグデータが指数関数的に増加しました。この急増により、膨大な量のデータが異種の事業単位に散在し、ますます複雑なデータ環境が構築されています。
IBM Institute for Business Value(IBV)が2025年に行った調査によると、CEOの50%が、最近の投資のペースにより組織内のテクノロジーが分断されていると述べています。その結果、データサイロ、セキュリティリスク、意思決定のボトルネックなどの課題を克服するために、データの統合とガバナンスが重要になりました。
データ・ファブリックは、機械学習(ML)、アクティブ・メタデータ、アプリケーション・プログラミング・インターフェース(API)、およびその他のテクノロジによってサポートされる、統合されたエンド・ツー・エンドのデータ管理を提供します。
これはソフトウェアではなく、データレイク、 データウェアハウス、SQL Database、およびその他のソースから、組織のオンプレミスおよびマルチクラウド環境全体のデータの統合ビューを作成する、設計上のアプローチです。このアプローチでは、組織は分散したデータを単一の場所やデータ・ストアに移動する必要はなく、完全に分散化されたアプローチを取る必要もありません。
これらのコア機能は、データ・サイロと増大するデータ量に対処するだけでなく、ビジネス・ユーザー向けのシンプルなセルフサービス・データ・アクセスも可能にします。その結果、リアルタイム・データと高品質の履歴データのネットワークが実現し、企業全体のデジタル・トランスフォーメーションとBusiness Intelligence(BI)イニシアチブが加速されるとともに、自動化されたガバナンスによって安全でコンプライアンスに準拠したデータストラテジーが確保されます。
多くの組織では、(構造化データ、半構造化データ、および非構造化データを含む)爆発的なデータ増加により、従来のデータ管理アプローチでは手に負えなくなっています。この課題は、データウェアハウス、データレイク、ハイブリッドクラウド環境の急拡大によってさらに深刻化します。
これらのストレージ・システムは通常、大量のデータ向けの低コストのソリューションとして活用されます。しかし、多くの場合、適切なメタデータ管理が欠如しており、データの検索、解釈、および効率的な使用が困難になっています。
サイロ化されたデータにより、この複雑さはさらに増します。これまで、企業には人事、サプライチェーン、顧客情報用に個別のデータ・プラットフォームがあり、データの種類やニーズが重複しているにもかかわらず、それぞれが独立して運用されていることがありました。
これらの課題は、ダーク・データ、つまり放置され、信頼できないとみなされ、最終的には使われない情報が大量に蓄積される事態を招きます。実際、企業データの60%は分析されていないと推定されています。1
企業はこうした課題に対処するために、データ・ファブリックを利用しています。最新のアーキテクチャは、データを統合し、ガバナンスを自動化し、セルフサービス・データ・アクセスを大規模に実現します。データ・ファブリックは、異種のシステム間でデータを接続することで、意思決定者がこれまで隠されていた接点を発見し、他の方法では使用されなかったデータからより価値のあるビジネス成果を導き出せるようにします。
データ・ファブリック・ソリューションは、民主化や意思決定の利点だけでなく、エンタープライズAIワークフローにおいて不可欠であることも証明されています。IBM IBVが2024年に行った調査によると、CFOの67%が、自社の経営幹部が新しいテクノロジーを迅速に活用するために必要なデータを保有していると回答しています。しかし、テクノロジー・リーダーのうち、自社のデータが生成AIを効率的に拡張するために必要な品質、アクセス性、セキュリティを備えていると強く同意しているのはわずか29%です。
データ・ファブリックを使用することで、組織は、ガバナンスとプライバシーの要件が自動的に適用された状態で、AIシステムにデータを配信するための信頼できるデータ・インフラストラクチャーをより簡単に構築できます。
IBMニュースレター
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
データ・ファブリックでは、データ統合プロセスによって、異種のデータ・ソースからのデータが統合され、一貫した構造に変換されて、分析や意思決定に利用できるようになります。この接続処理は、バッチ処理、リアルタイム・データ統合、変更データ・キャプチャ(CDC)などのさまざまな統合方式によって行われます。スマートな統合プロセスにより、ストレージ・コストを最小限に抑えながら性能を最大化できます。
データ・ファブリックは、大規模なデータ・ガバナンスとデータ・セキュリティ・ポリシーを作成および適用するための統一された方法を提供します。たとえば、データアクセス制御は、ユーザー・グループやデータ分類などのメタデータを介して、機密データに簡単かつ自動的にリンクできます。データファブリックは、こうした信頼性が高く保護されたビジネス対応データを通じて、組織がAIを運用化できるようにサポートします。
データ・ファブリックは、データ消費のためのセルフサービス・マーケットプレイスとして機能します。データ・プロファイリングやメタデータ管理などの主要なガバナンス機能により、データ・エンジニア、データ・サイエンティスト、およびビジネス・ユーザーは、高品質なデータを迅速に検出し、アクセスし、共同作業を行うことができます。ユーザーはデータ資産を検索し、タグと注釈を付け、コメントを追加できます。成果として、IT部門への依存が大幅に減少します。
データ・ファブリックには、データ・ファブリックのライフサイクル全体にわたるエンド・ツー・エンドの管理も含まれます。このアプローチでは、機械学習オペレーション(MLOps)とAIを活用することで、データ・パイプラインなどのデータ・ファブリック・アーキテクチャーのさまざまなコンポーネントの作成、構築、テスト、展開、最適化および監視のための統合されたエクスペリエンスを実現します。
個々のデータ・ストレージ・システムとは異なり、データ・ファブリックはデータ環境全体に流動性を生み出し、データ・グラビティ―の問題(新しいデータの量が増えるにつれてデータの移動が困難になるという考え方)に対抗します。データ・ファブリックは、データの移動、トランスフォーメーション、統合に必要となる技術的な複雑さを解消し、すべてのデータを企業全体で利用できるようにします。
しかし、データ・ファブリックはどのようにしてこれを実現するのでしょうか。
データ・ファブリックは、一連のデータサービスを使用します。その仕組みを理解するにあたり、3つの基本的なコンポーネントであるデータ仮想化、フェデレーテッド・アクティブ・メタデータ、機械学習について調査することが有用です。
フェデレーテッド・アクティブ・メタデータにより、データがより見つけやすく、使いやすくなります。静的かつ手動でキュレートされるパッシブ・メタデータとは異なり、フェデレーテッド・アクティブ・メタデータは、セマンティック・ナレッジ・グラフとAI/MLテクノロジーを使用して、さまざまなシステムや形式のメタデータを継続的に分析し、パターンを検知し、データを統合します。
これらのシステムは、データのタグ付け、プロファイリング、分類を自動的に行うことができます。また、メタデータの変更に基づいてアラートやアクションをトリガーできるため、データ・エコシステムのレジリエンスと自己管理性が向上します。
データ・ファブリックアーキテクチャーはビジネスニーズによって異なりますが、主要な機能については共通しています。Forrester社のEnterprise Data Fabric Enables DataOpsレポートによると、データ・ファブリックは通常、次の6つの基本コンポーネントで構成されます。2
データ・ファブリックには、全体的なデータ管理とアクセスの向上に加えて、次のようなビジネス上のメリットもあります。
複数のプラットフォームにわたるデータ・ガバナンス、統合およびその他のデータ・サービスを自動化することで、データ管理と分析が合理化されます。ボトルネックを減らすことで、企業は生産性を向上させ、ビジネス・ユーザーがより迅速に意思決定を行えるようにし、技術チームのワークロードを軽減できます。
さらに、インテリジェントな統合機能により、ストレージとコストを最小限に抑えながら性能を最適化できます。
データ・ファブリック・アーキテクチャーはセルフサービス・アプリを推進し、技術チームの枠を超えてデータ・アクセスを拡大します。ユーザーに組織データの統一されたビューを提供し、データの場所や、過去にサイロ化されていた程度に関係なく、接続を作成します。
アクセス可能で可視化されたデータは、データのカタログ化とガバナンスの実施を非常に容易にします。データ・アクセスが拡大した結果、多くの場合、ガバナンスのガードレールが強化され、機密データのマスキングや暗号化など、データ・セキュリティーのアプローチも強化されます。
データ・ファブリック・アーキテクチャーはモジュール式で、拡張性を備えています。また、水平方向(増え続けるデータ量に対応するため)と垂直方向(プロセスと性能の強化)の両方で拡張できます。
直感的なグラフィカル・インターフェースでスマートなストリーミング・データ・パイプラインを作成、管理できるため、ハイブリッド環境やマルチクラウド環境でのシームレスなデータ統合を促進します。
データ・アーキテクチャーの設計で生成AIのデータ・レディネスを早期化し、データ・チームの比類なき生産性を解き放ちます。
IBMコンサルティングと連携することで、企業データの価値を引き出し、ビジネス上の優位性をもたらす洞察を活用した組織を構築します。
1 “The State of Dark Data,” Splunk, 2019
2 “The Forrester Wave™: Enterprise Data Fabric, Q2 2022: The 15 Providers That Matter Most and How They Stack Up,” Forrester, 2020.