データ・ファブリックに関するIBMアーキテクチャー・ガイド

概要

データ・ファブリックは、データ形式、データ・ソース、データの場所、データの使用方法に関係なく、組織全体でデータの使用を拡大することを目的としたアーキテクチャー・パターンです。データ・アクセスから消費まで、データ・ファブリックがカバーするデータ・ライフサイクルのさまざまな側面には、データ検出、データ・ガバナンス、データ品質、データ分類、ビジネス・コンテキストの関連付け、データ・リネージュ、セルフサービス、および適切なデータを適切な場所と時間に利用できるようにするためのデータ運用化が含まれます。クリックすると、追加のガイダンスが表示されます。

データ・ファブリックの参照アーキテクチャーは、企業がデータ・ファブリックのさまざまなコンポーネントをそれぞれの環境で実装するのに役立つガイダンスとして使用できるテンプレートです。データ・ファブリックの参照アーキテクチャーには、メタ・データのインポート、メタ・データのエンリッチメント、メタ・データのカタログ化、データ・キュレーション、トランスフォーメーション、データ消費という 5 つの主要なモジュールがあります。これらのモジュールは、前述のデータ・ファブリックのメリットを実現するための鍵となります。

参照アーキテクチャーには、5 つのモジュールの目的の実現に役立つ、主要なコンポーネント、必要な手順、および各モジュールのアーキテクチャーの決定事項が含まれています。また、コンポーネントと手順を実装するためにIBMテクノロジー環境で利用可能なさまざまなテクノロジー・オプションについても網羅しています。データ消費モジュールの場合、各消費ユースケースの詳細はそれぞれのユースケースの参照アーキテクチャーで扱われることを前提として、一般的な消費パターンをカバーしています。

また、全体的なデータおよびAI参照アーキテクチャーも注目してください。

IBM Z®の概要

IBM z Systems Data Fabric参照アーキテクチャーは、より広範なIBM Data and Analytics Data Fabricアーキテクチャー・パターンに特化したもので、データ形式、データ・ソース、データの場所、データの使用方法に関係なく、組織全体でデータの使用を拡大することを目的としています。データ・アクセスから消費まで、データ・ファブリックがカバーするデータ/ライフサイクルのさまざまな側面には、データ検出、データ・ガバナンス、データ品質、データ分類、ビジネス/コンテキストの関連付け、データ・リネージュ、セルフサービス、および適切なデータを適切な場所と時間に利用できるようにするためのデータ運用化があります。追加のガイダンスを参照してください。

IBM Z® Systemsに関するより広範なデータ・ファブリックのアーキテクチャー・パターンに特化して、次の2つの側面について詳しく切間井します。

• IBM Z Systems上の各種データ・ソース（VSAM、IMS、DB2など）に対するガバナンスとアクセスに対処
• Linux® on IBM ZまたはLinuxONE（MongoDB、...）
• IBM Z SystemsおよびLinux on IBM Z/LinuxONEへの全社的なデータ・ファブリック・アーキテクチャーのコンポーネントの実装このソリューションには、zSystems / LinuxONEおよび外部システム上で実行されるコンポーネントが含まれています。

データ・ファブリックの参照アーキテクチャーは、企業がデータ・ファブリックのさまざまなコンポーネントをそれぞれの環境で実装するのに役立つガイダンスとして使用できるテンプレートです。データ・ファブリック参照アーキテクチャーには、メタ・データのインポート、メタ・データのエンリッチメント、メタ・データのカタログ化、データ・キュレーションとトランスフォーメーション、データ消費の5つの主要モジュールがあります。これらのモジュールは、前述のデータ・ファブリックのメリットを実現するための鍵ろなります。

参照アーキテクチャーには、5 つのモジュールの目的の実現に役立つ、主要なコンポーネント、必要な手順、および各モジュールのアーキテクチャーの決定事項が含まれています。また、コンポーネントと手順を実装するためにIBMテクノロジー環境で利用可能なさまざまなテクノロジー・オプションについても網羅しています。データ消費モジュールの場合、各消費ユースケースの詳細はそれぞれのユースケースの参照アーキテクチャーで扱われることを前提として、一般的な消費パターンをカバーしています。

IBM Zアーキテクチャー向けのアプリケーションのモダナイゼーションでは、IBM ZおよびLinuxONE上の記録システム（SoR）データへの最新の容易なアクセスを実現するためのアーキテクチャー・パターン、およびデータ連携を中心に据えた各種パターンについてさらに詳しく説明します。これは、アプリケーションが直接アクセス、レプリケーション、キャッシュ、または企業全体のデータ資産を組み合わせるデータ仮想化の概念を通じて記録システム（SOR）データを共有するため、データ駆動型のビジネス価値に関する知見を得る上で不可欠です。

また、データ、分析、およびAI参照アーキテクチャー全体も注目に値します。

名前

課題または問題点

前提

動機付け

データの場所、グラビティー、主権

AD01

可用性と規制要件をサポートするには、適切な制御とデータ・アクセス方法を導入する必要があります。

データの移動と複製を最小限に抑えると同時に、分析（深層分析、意思決定の最適化、AIワークロードを含む）のための効果的でレジリエントかつ柔軟なプラットフォームを提供する必要があります。

選択された実装方法は、コスト、レイテンシー要件をサポートするための実行可能性、規制遵守、および全体的な顧客満足度に直接影響します。

可用性と規制要件をサポートするには、適切な制御とデータ・アクセス方法を導入する必要があります。

データの移動と複製を最小限に抑えると同時に、分析（深層分析、意思決定の最適化、AIワークロードを含む）のための効果的でレジリエントかつ柔軟なプラットフォームを提供する必要があります。

選択した実装方法は、コスト、レイテンシー要件をサポートするための実行可能性、規制遵守、全体的な顧客満足度に直接影響します。

データの保管場所、ワークロード、レイテンシー、規制上の考慮事項に基づいて、データを移動するかアクセスするかをジャストインタイムで決定します。

ナレッジ・カタログの組織と関係

AD02

組織は、さまざまなタイプの要件に応じて、複数のカタログの存在をサポートする必要がある場合があります。たとえば、カタログを仮想的に接続する必要があるハイブリッド・マルチクラウド・エコシステムの存在などです。それ以上のカタログ構造は、プロジェクト、LOB、企業の考慮事項に基づく場合があります。また、組織内で実験/サンドボックス、開発インスタンスが必要になることもあります。

カタログのインスタンス化は、管理や走査が過度に複雑にならず、組織のニーズをサポートする方法で実装する必要があります。

カタログの選択は、組織が企業エコシステム、場合によってはビジネス・パートナー・エコシステム全体でデータを活用する能力に影します。

データ資産と関係（メタデータの取得と強化を含む）

AD03

データ資産はかつてないほどの速度で作成、消費されています。組織は、データ資産とその関連メタデータの取得およびカタログ化をサポートするために、手動のプロセスや緩く自動化されたプロセスに頼れなくなくなりました。

自動化は、さまざまなデータ資産に対して作成されたメタデータをタイムリーに取得し、強化するための鍵となります。

自動化がなければ、組織は使用可能な最新のデータ資産のカタログを維持できなくなり、データ駆動型組織へとさらに進化を遂げるためにデータ資産を活用する組織の能力が抑制されてしまいます。

現在のワークロードに基づいて、非機能要件を考慮した適切な変換とキュレーションの方法を確保する

AD04

組織は、変換とキュレーション処理を必要とする小規模、中規模、大規模、超大規模のワークロードに対して、さまざまなタイプのの実装（リアルタイム、準リアルタイム（ストリーミング）、バッチ（極小/小/大規模））が必要になります。

適切なデータ・サイエンス、分析、レポート機能の正確性を維持するためには、実装パスに関係なく、データの変換とキュレーションにおいて一貫性を保つ必要があります。

データ変換とキュレーションの適切な方法を選択することで、組織は、信頼できるAI、Customer 360、知見の開発など、さまざまなユースケースで目標を達成できるようになります。

参考情報

データ・ファブリック・アーキテクチャーとは

データ・ファブリック・アーキテクチャーの6つの主要機能については、このブログ記事をご覧ください。

データと分析のデータ・ファブリック