データマートは、特定の業務、部門、サブジェクト・エリアに特化した データウェアハウス の一部です。 データマートにより、特定のデータが特定のグループのユーザーによって使用できるようになります。この結果、これらのユーザーは、データウェアハウス全体を検索して時間を無駄にすることなしに、重要な洞察に素早くアクセスできるようになります。 例えば、多くの企業が、財務、営業、マーケティングなどの企業内の特定の部門に合わせたデータマートを保有しています。
データマート、データウェアハウス、データレイクは、重要な中央データ・リポジトリーですが、それぞれ組織内の異なるニーズに対応します。
データウェアハウス は、複数のソースのデータを、単一の一貫性のある中央データ・ストアに集約して、データ・マイニング、人工知能(AI)、機械学習をサポートするために使用されます。この方法は、より多くの高度な分析やビジネスのインテリジェンスの確保に役立ちます。 この戦略的なデータ収集プロセスにより、 データウェアハウス・ソリューション はさまざまなソースから収集したデータを統合して、1つの統一された形式で使用できるようにします。
前述のように、データマートはデータウェアハウスの特化版であり、ここには組織内の1つのチームまたは特定のユーザー・グループにとって重要な、あるいはこれらの人々が必要とする、ごく一部のデータが収集されています。 データマートは、複数のテクノロジーやツールによる物理データベースの設計・構築、データの投入、複雑なアクセスと管理のプロトコルの設定から成る複雑な手順によって、既存のデータウェアハウス(または他のデータ・ソース)から作成されます。
これは手のかかるプロセスですが、ビジネス・ユーザーがより広範なデータウェアハウスのデータ・セットを使用した場合に比べ、より迅速で、より焦点を絞った洞察を見つけるのに役立ちます。 例えば、既存のウェアハウスからデータマートを作成することで、通常他の部門から独立した形で活動するマーケティング・チームが恩恵を受ける可能性があります。 この結果、マーケティング・チームは企業内のすべてのデータにアクセスする必要がなくなります。
データレイクもまた、データのリポジトリーです。 データレイクでは、複数のソースから提供された非構造化データすなわち生データが大規模に保管されます。ただし情報はまだ、分析用に処理されていません。 データを生のフォーマットで保存できるため、データレイクはデータウェアハウスよりアクセスしやすく、また費用対効果も優れています。 取り込む前にデータをクリーニングしたり処理する必要はありません。
例えば、政府は、テクノロジーを使用して交通行動、電力使用、水路に関するデータを追跡し、データレイクに保存する一方で、このデータを利用してより高効率のサービスを提供することで「よりスマートな都市」を作り出す方法を考えることができます。
データマートは、比較的狭い分野のデータを提供して、特定のグループのニーズを満たすよう設計されています。 データマートには数百万にのぼるレコードが含まれる場合もありますが、その目的はビジネス・ユーザーに最も関連性の高いデータを最短時間で提供することです。
より小さく、焦点を絞って設計されたデータマートには、エンド・ユーザーにとって以下のようないくつかのメリットがあります。
データウェアハウスおよびそれぞれのシステムのデータ・ソースとの関係により、データマートには3種類あります。
データマートは、アクセス、編成、理解を容易にするために、トランザクション・データを行と列で保存する、サブジェクト指向の リレーショナル・データベース です。 ここには履歴データが含まれるため、この構造では、アナリストによるデータ傾向の判断が容易になります。 標準的なデータ・フィールドには、番号順、時間値、1つ以上のオブジェクトへの参照などがあります。
企業では、分析タスクを行うためにデータベースを使用する人々のニーズに対応するために、青図面として多次元スキーマ内でデータマートを編成します。 スキーマにはスター、スノーフレーク、ボールトという、3つの主な種類があります。
スター・スキーマとは、多次元データベース内に星形に配列された表の論理構造です。 この青図面では、特定のビジネス・イベントまたはプロセスに関連付けられたメトリック・セットである、1つのファクト表がスターの中央に置かれ、その周りを数個の関連するディメンション表が囲んでいます。
ディメンション表間には従属関係がないため、スター・スキーマではクエリーを記述する際に必要な結合の数は少なくて済みます。 この構造によって照会が容易になるため、スター・スキーマは、大量のデータ・セットにアクセスし、操作する必要のあるアナリストにとっては非常に効率的です。
スノーフレーク・スキーマは、スター・スキーマの論理拡張であり、青図面にディメンション表が追加されます。 ディメンション表は、データ保全性を保護し、データ冗長性を最小限に抑えるために正規化されます。
この方法ではディメンション表を保存するスペースが少なくて済みますが、構造が複雑なため、管理が困難になる場合があります。 スノーフレーク・スキーマを使用する主なメリットは、ディスク容量が少なくて済むことですが、追加の表によってパフォーマンスに悪影響が及ぶ可能性があることに注意する必要があります。
データ・ボールトとは、ITの専門家によるアジャイルなエンタープライズ・データウェアハウスの設計を可能にする最新のデータベース・モデリング手法です。 この手法では、階層化構造が構築されます。この手法は、他のスキーマ・モデルを使用した際に発生する俊敏性、柔軟性、拡張性に関する課題に対処するために開発されました。
データ・ボールトにより、スター・スキーマでは必要な、追加された新しいデータ・ソースのクレンジングおよび合理化の作業を排除できます。これによって、既存のスキーマに混乱が起きることはありません。
データマートは、部門レベルのビジネスの重要な意思決定の指針となります。 例えば、マーケティング・チームはデータマートを使用して消費者の行動を分析し、営業担当者はデータマートを使用して四半期ごとの売上レポートをまとめることができます。 これらのタスクは、それぞれの部門内で発生するため、各チームがすべての企業データにアクセスする必要はありません。
一般にデータマートは、それを使用する各業務部門によって作成・管理されます。 データマートの設計プロセスは通常、次の手順で構成されます。
基盤が完了したら、QlikやSiSenseなどのスペシャリスト向けのビジネス・インテリジェンス・ツールを使用してデータマートから大きな価値を獲得できます。 これらのソリューションには、データから洞察を容易に引き出せるようにするダッシュボードと可視化機能が搭載されており、ひいては企業のためになるよりスマートな意思決定を実現できます。
データマートが企業に高い効率性や柔軟性というメリットを提供する一方で、止めようのないデータ量の増加は、引き続きオンプレミス・ソリューションを使用する企業に問題をもたらしています。
データウェアハウスのクラウドへの移行が進むにつれ、データマートもこれに続くでしょう。 複数のデータ・リソースを統合して、すべてのデータマートを格納する単一のリポジトリーに入れることにより、企業はコストを削減すると同時に、すべての部門が必要なデータにリアルタイムで自由にアクセスできるようにすることができます。
また、クラウドベースのプラットフォームを導入すると、大量のデータ・セットを容易に作成、共有、保管して、より効率的で効果的なデータ・アクセスおよびデータ分析の実現に向けた道を開くことができます。 クラウド・システムは、持続可能なビジネスの成長という目標を実現するために構築されます。今日、多くの Software-as-a Service(SaaS) プロバイダーは、データ照会時の拡張性を向上させるために、データ・ストレージをコンピュートから分離しようとしています。
高性能な分析とAIのために開発されたフルマネージドの柔軟なクラウド・データウェアハウスの機能についてご説明します。
IBM InfoSphere Master Data Managementが、企業全体を網羅した信頼できるマスター・データを提供することで、ビジネス・ユーザーとITユーザーによるコラボレーションとイノベーションをどのように支援できるかをご覧ください。