データマートとは
データマートの内容について、およびデータマートがどのように企業内でのチーム効率の向上、コストの削減、よりスマートなビジネス上の戦術的意思決定の推進に役立つのかについてご説明します
青と黒の背景
データマートとは

データマートは、特定の業務、部門、サブジェクト・エリアに特化した データウェアハウス の一部です。 データマートにより、特定のデータが特定のグループのユーザーによって使用できるようになります。この結果、これらのユーザーは、データウェアハウス全体を検索して時間を無駄にすることなしに、重要な洞察に素早くアクセスできるようになります。 例えば、多くの企業が、財務、営業、マーケティングなどの企業内の特定の部門に合わせたデータマートを保有しています。

データマート、データウェアハウス、データレイク

データマート、データウェアハウス、データレイクは、重要な中央データ・リポジトリーですが、それぞれ組織内の異なるニーズに対応します。

 データウェアハウス は、複数のソースのデータを、単一の一貫性のある中央データ・ストアに集約して、データ・マイニング、人工知能(AI)、機械学習をサポートするために使用されます。この方法は、より多くの高度な分析やビジネスのインテリジェンスの確保に役立ちます。 この戦略的なデータ収集プロセスにより、 データウェアハウス・ソリューション はさまざまなソースから収集したデータを統合して、1つの統一された形式で使用できるようにします。 

前述のように、データマートはデータウェアハウスの特化版であり、ここには組織内の1つのチームまたは特定のユーザー・グループにとって重要な、あるいはこれらの人々が必要とする、ごく一部のデータが収集されています。 データマートは、複数のテクノロジーやツールによる物理データベースの設計・構築、データの投入、複雑なアクセスと管理のプロトコルの設定から成る複雑な手順によって、既存のデータウェアハウス(または他のデータ・ソース)から作成されます。

これは手のかかるプロセスですが、ビジネス・ユーザーがより広範なデータウェアハウスのデータ・セットを使用した場合に比べ、より迅速で、より焦点を絞った洞察を見つけるのに役立ちます。 例えば、既存のウェアハウスからデータマートを作成することで、通常他の部門から独立した形で活動するマーケティング・チームが恩恵を受ける可能性があります。 この結果、マーケティング・チームは企業内のすべてのデータにアクセスする必要がなくなります。

データレイクもまた、データのリポジトリーです。 データレイクでは、複数のソースから提供された非構造化データすなわち生データが大規模に保管されます。ただし情報はまだ、分析用に処理されていません。 データを生のフォーマットで保存できるため、データレイクはデータウェアハウスよりアクセスしやすく、また費用対効果も優れています。 取り込む前にデータをクリーニングしたり処理する必要はありません。

例えば、政府は、テクノロジーを使用して交通行動、電力使用、水路に関するデータを追跡し、データレイクに保存する一方で、このデータを利用してより高効率のサービスを提供することで「よりスマートな都市」を作り出す方法を考えることができます。

データマートのメリット

データマートは、比較的狭い分野のデータを提供して、特定のグループのニーズを満たすよう設計されています。 データマートには数百万にのぼるレコードが含まれる場合もありますが、その目的はビジネス・ユーザーに最も関連性の高いデータを最短時間で提供することです。 

より小さく、焦点を絞って設計されたデータマートには、エンド・ユーザーにとって以下のようないくつかのメリットがあります。

  • コスト効率: 適用範囲、統合、 ETL(抽出、変換、ロード)するプロセスなど、データマートをセットアップする際に考慮すべき要素が多数あります。 しかし、通常データマートには、データウェアハウスに比べてほんの少ししかコストはかかりません。

  • 簡単なデータ・アクセス: データマートには少量のデータしか含まれていないため、ユーザーは、データウェアハウスのより広範なデータ・セットを扱うときより少ない労力で必要なデータを素早く取得できます。

  • 洞察をより素早く入手: データウェアハウスから得られる洞察は、企業全体のビジネスに影響を与える、企業レベルの戦略的意思決定をサポートします。 一方、データマートは部門レベルの意思決定の指針となるビジネスのインテリジェンスや分析を促進します。 チームは、チーム固有の目的を念頭に置いて、関連性の高いデータを活用して洞察を獲得できます。 チームがより短時間で価値のあるデータを特定・抽出できるようになるため、企業はビジネス・プロセスを加速し、生産性を高めることができます。

  • よりシンプルなデータ管理: データウェアハウスには、複数の業務に関する豊富なビジネス情報が収納されています。 他方、データマートでは単一の業務に関する、100 GB以下のデータが収容されていることが多く、不要なものが少なく、管理も容易です。

  • より簡単で迅速な実装: 社内と社内の両方に存在する多くのソースからデータを収集することになるため、特に大規模な企業でのデータウェアハウスの実装には、かなりの実装時間が必要です。 他方、データマートには少量のデータしか必要とされないため、実装はより効率的に、より短時間で完了させることができます。
データマートの種類

データウェアハウスおよびそれぞれのシステムのデータ・ソースとの関係により、データマートには3種類あります。

  • 従属型データマート とは、エンタープライズ・データウェアハウス内のパーティション化されたセグメントです。 このトップダウン手法では、まずすべてのビジネス・データを1カ所に保存することから計画が開始されます。 新たに作成されたデータマートでは、分析用として必要になるたびに定義済みの基本データのサブセットが抽出されます。

  • 独立型データマート は、データウェアハウスに依存しないスタンドアロン・システムとして動作します。 アナリストは、社内または社外のソースから特定の分野またはビジネス・プロセスに関するデータを抽出および処理した後、チームで必要になるまで、このデータをデータマート・リポジトリーに保存しておくことができます。

  • ハイブリッド型データマート では、既存のデータウェアハウスのデータと他の使用可能なソースのデータが結合されます。 この統合手法では、トップダウン手法のスピードとユーザー・フレンドリーなインターフェースを活用できるのに加えて、独立手法のエンタープライズ・レベルでの統合が可能です。
データマートの構造

データマートは、アクセス、編成、理解を容易にするために、トランザクション・データを行と列で保存する、サブジェクト指向の リレーショナル・データベース です。 ここには履歴データが含まれるため、この構造では、アナリストによるデータ傾向の判断が容易になります。 標準的なデータ・フィールドには、番号順、時間値、1つ以上のオブジェクトへの参照などがあります。

企業では、分析タスクを行うためにデータベースを使用する人々のニーズに対応するために、青図面として多次元スキーマ内でデータマートを編成します。 スキーマにはスター、スノーフレーク、ボールトという、3つの主な種類があります。

スター
 

スター・スキーマとは、多次元データベース内に星形に配列された表の論理構造です。 この青図面では、特定のビジネス・イベントまたはプロセスに関連付けられたメトリック・セットである、1つのファクト表がスターの中央に置かれ、その周りを数個の関連するディメンション表が囲んでいます。

ディメンション表間には従属関係がないため、スター・スキーマではクエリーを記述する際に必要な結合の数は少なくて済みます。 この構造によって照会が容易になるため、スター・スキーマは、大量のデータ・セットにアクセスし、操作する必要のあるアナリストにとっては非常に効率的です。

スノーフレーク
 

スノーフレーク・スキーマは、スター・スキーマの論理拡張であり、青図面にディメンション表が追加されます。 ディメンション表は、データ保全性を保護し、データ冗長性を最小限に抑えるために正規化されます。

この方法ではディメンション表を保存するスペースが少なくて済みますが、構造が複雑なため、管理が困難になる場合があります。 スノーフレーク・スキーマを使用する主なメリットは、ディスク容量が少なくて済むことですが、追加の表によってパフォーマンスに悪影響が及ぶ可能性があることに注意する必要があります。

ボールト
 

データ・ボールトとは、ITの専門家によるアジャイルなエンタープライズ・データウェアハウスの設計を可能にする最新のデータベース・モデリング手法です。 この手法では、階層化構造が構築されます。この手法は、他のスキーマ・モデルを使用した際に発生する俊敏性、柔軟性、拡張性に関する課題に対処するために開発されました。

データ・ボールトにより、スター・スキーマでは必要な、追加された新しいデータ・ソースのクレンジングおよび合理化の作業を排除できます。これによって、既存のスキーマに混乱が起きることはありません。

データマートの利用者と使用方法

データマートは、部門レベルのビジネスの重要な意思決定の指針となります。 例えば、マーケティング・チームはデータマートを使用して消費者の行動を分析し、営業担当者はデータマートを使用して四半期ごとの売上レポートをまとめることができます。 これらのタスクは、それぞれの部門内で発生するため、各チームがすべての企業データにアクセスする必要はありません。

一般にデータマートは、それを使用する各業務部門によって作成・管理されます。 データマートの設計プロセスは通常、次の手順で構成されます。

  1. 基本的な要件の文書化 :これにより、データマートのビジネス上と技術上の必要性を理解できます。

  2. データソースの特定 :作成しようとするデータマートの情報の入手先です。

  3. データ・サブセットの決定:データ・サブセットに含める情報を、あるトピックに関するすべての情報にするのか、より細かいレベルの具体的な分野の情報にするのかを定義します。

  4. データマートの論理レイアウトの設計 :より大規模なデータウェアハウスと相関関係のあるスキーマを選択します。

基盤が完了したら、QlikやSiSenseなどのスペシャリスト向けのビジネス・インテリジェンス・ツールを使用してデータマートから大きな価値を獲得できます。 これらのソリューションには、データから洞察を容易に引き出せるようにするダッシュボードと可視化機能が搭載されており、ひいては企業のためになるよりスマートな意思決定を実現できます。

データマートとクラウド・アーキテクチャー

データマートが企業に高い効率性や柔軟性というメリットを提供する一方で、止めようのないデータ量の増加は、引き続きオンプレミス・ソリューションを使用する企業に問題をもたらしています。

 データウェアハウスのクラウドへの移行が進むにつれ、データマートもこれに続くでしょう。 複数のデータ・リソースを統合して、すべてのデータマートを格納する単一のリポジトリーに入れることにより、企業はコストを削減すると同時に、すべての部門が必要なデータにリアルタイムで自由にアクセスできるようにすることができます。

また、クラウドベースのプラットフォームを導入すると、大量のデータ・セットを容易に作成、共有、保管して、より効率的で効果的なデータ・アクセスおよびデータ分析の実現に向けた道を開くことができます。 クラウド・システムは、持続可能なビジネスの成長という目標を実現するために構築されます。今日、多くの Software-as-a Service(SaaS) プロバイダーは、データ照会時の拡張性を向上させるために、データ・ストレージをコンピュートから分離しようとしています。

関連ソリューション
Db2 Warehouse on Cloud

高性能な分析とAIのために開発されたフルマネージドの柔軟なクラウド・データウェアハウスの機能についてご説明します。

Db2 Warehouse on Cloudの詳細はこちら
InfoSphere Master Data Management

IBM InfoSphere Master Data Managementが、企業全体を網羅した信頼できるマスター・データを提供することで、ビジネス・ユーザーとITユーザーによるコラボレーションとイノベーションをどのように支援できるかをご覧ください。

InfoSphere Master Data Managementの詳細はこちら
参考情報 データとAIの課題に対処するために適切なエンタープライズ・データウェアハウスを見つける

AIがもたらす多くの問題は、エンタープライズ・データウェアハウスやデータマートで解決できる可能性があります。 このようなソリューションがもたらすトータルの価値を評価する方法についてご説明します。

データレイクとデータウェアハウスの違いについて

Ventana Research社のアナリスト、David Menninger氏による、データマートの構築時の重要な考慮事項となる、データレイクとデータウェアハウスの相違点と類似点についての説明をご覧ください。

次のステップ

IBM Db2 Warehouse on Cloudは、ストレージとコンピューティングの独立した拡張性を提供する、柔軟なクラウド・データウェアハウスです。 小規模なデータマートでは、高性能な分析を実現するための弾力的なデータウェアハウスである、Flex One機能を活用できます。 このシステムは、複数のクラウド・プロバイダー上でデプロイ可能です(最小ストレージ・サイズは40 GB)。

IBM Db2 Warehouse on Cloudの詳細はこちら