データ・マートとは

データ・マートは、特定の事業分野、部門、または主題領域に重点を置いたデータウェアハウスのサブセットです。データ・マートは、チームの効率性を向上させ、コストを削減し、企業におけるよりスマートかつ戦術的なビジネス上の意思決定を促進します。

データ・マートは、定義されたユーザー・グループが特定のデータを利用できるようにするため、ユーザーはデータウェアハウス全体の検索に時間を浪費することなく、重要な洞察に素早くアクセスできるようになります。たとえば、多くの企業では、財務、営業、マーケティングなど、ビジネス内の特定の部門に合わせたデータ・マートを持っている場合があります。

The DX Leaders

AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。

データ・マート、データウェアハウス、データレイク

データ・マート、データウェアハウス、データレイクは重要な中央データリポジトリですが、これらは組織内でそれぞれ異なるニーズに対応します。

データウェアハウスは、データマイニング、人工知能（AI）、および機械学習をサポートするために、複数のソースからのデータを単一の中央の一貫したデータストアに集約するシステムであり、最終的には洗練された分析とビジネス・インテリジェンスを強化できます。データウェアハウス・ソリューションは、この戦略的収集プロセスを通じて、さまざまなソースからのデータを統合し、1つの統一された形式で利用できるようにします。

データ・マート（前述のとおり）は、データウェアハウスの対象を絞ったバージョンであり、組織内の単一のチームまたは選択されたユーザーグループにとって重要かつ必要とされるデータの、比較的小さなサブセットを含みます。データ・マートは、既存のデータウェアハウス（またはその他のデータソース）から、物理データベースの設計と構築、データ投入、複雑なアクセス・管理プロトコルの設定など、複数のテクノロジーやツールを駆使した複雑な手順で構築されます。

これは難しいプロセスですが、ビジネス部門は、より広範なデータウェアハウスのデータセットを扱うよりも、より焦点を絞った洞察をすばやく見つけることができます。たとえば、マーケティング・チームは、既存のウェアハウスからデータ・マートを作成することでメリットが得られる場合があります。彼らの業務は通常、他の業務とは独立して実行されるためです。これにより、チームはすべての企業データにアクセスする必要はありません。

データレイクもまた、データのリポジトリです。データレイクは、複数のソースから供給される非構造化データまたは生データの大規模なストレージを提供しますが、その情報はまだ処理されておらず、分析の準備ができていません。データを生のフォーマットで保存できる結果、データレイクはデータウェアハウスよりもアクセスしやすく、コスト効率も高くなります。取り込み前にデータのクリーニングや処理を行う必要はありません。

たとえば、官公庁・自治体は、テクノロジーを利用して交通行動、電力使用状況、水路に関するデータを追跡し、データレイクに保存することで、そのデータをどのように使用すればより効率的なサービスを備えた「スマートシティ」を実現できるかを検討できます。

AI Academy

生成AIの成功の鍵はデータ管理

生成AIの使用を成功させるために、高品質のデータが不可欠である理由をご覧ください。

エピソードに移動

データ・マートのメリット

データ・マートは、比較的狭いデータの主題を持つことにより、特定のグループのニーズを満たすように設計されています。また、データ・マートには何百万ものレコードを含めることができますが、その目的は、ビジネスユーザーに最短時間で最も関連性の高いデータを提供することです。

より小さく、焦点を絞った設計により、データ・マートはエンドユーザーに次のようないくつかの利点をもたらします。

コスト効率：データ・マートを設定する際には、範囲、統合、および抽出、変換、ロード（ETL）のプロセスなど、考慮すべき要素が多数あります。ただし、通常データ・マートでは、データウェアハウスの費用のほんの一部しか発生しません。
データ・アクセスの簡素化： データ・マートはデータの小さなサブセットのみを保持するため、データ・ウェアハウスから広範なデータセットを扱う場合よりも少ない作業で、必要なデータを素早く取得できます。
洞察への迅速なアクセス：データ・ウェアハウスから得られる直感は、ビジネス全体に影響を与える企業レベルでの戦略的な意思決定をサポートします。データ・マートは、部門レベルで意思決定をガイドするBusiness Intelligenceと分析を強化します。チームは特定の目標を念頭に置いて、焦点を絞ったデータの洞察を活用できます。チームがより短い時間で貴重なデータを特定・抽出するため、企業は加速したビジネス・プロセスと向上した生産性によるメリットを享受します。
データ・メンテナンスの簡素化：データ・ウェアハウスには、複数の事業分野にまたがる豊富なビジネス情報が保管されています。データ・マートは100GB未満のデータを格納する単一ラインに焦点を当てているため、煩雑さが軽減され、メンテナンスが容易になります。
より簡単で迅速な実装：データウェアハウスは、内部および外部の多数のソースからデータを収集するため、実装にかなりの時間がかかり、特に大企業ではその傾向が顕著になります。一方、データ・マートを設定する際に必要なのは規模の小さいデータ・サブセットのみであるため、実装はより効率的になり、セットアップ時間も短縮される傾向があります。

データ・マートの種類

データ・マートには、データウェアハウスと各システムのそれぞれのデータ・ソースとの関係に基づいて異なる3つのタイプがあります。

依存型データ・マートは、エンタープライズ・データウェアハウス内で分割されたセグメントです。このトップダウンのアプローチは、すべてのビジネス・データを 1 つの中央の場所に保存することから始まります。新しく作成されたデータ・マートは、分析のため必要性が生じるたびに、プライマリ・データの定義済みサブセットを抽出します。
独立型データ・マートは、データウェアハウスに依存しないスタンドアロン・システムとして機能します。アナリストは、特定のテーマやビジネス・プロセスに関するデータを内部または外部のデータ・ソースから抽出・処理し、チームが必要とするまでデータ・マート・リポジトリに保存できます。
ハイブリッド・データ・マートでは、既存のデータウェアハウスと他の運用ソースからのデータを組み合わせます。この統一されたアプローチは、トップダウン・アプローチのスピードとユーザーフレンドリーなインターフェイスを活用し、独立した手法によるエンタープライズ・レベルの統合も提供します。

データ・マートの構造

データ・マートは、トランザクション・データを行と列に格納する主題指向のリレーショナル・データベースであり、アクセス、整理、理解が容易になります。この構造には履歴データが含まれているため、アナリストはデータの傾向を判断しやすくなります。一般的なデータ・フィールドには、数値順序、時間値、および1つ以上のオブジェクトへの参照が含まれます。

企業は、分析作業にデータベースを使用する人々のニーズに対応するための青写真として、多次元スキーマでデータ・マートを編成します。スキーマには、主にスター型、スノーフレーク型、ボールト型の3つのタイプがあります。

スター

スター・スキーマは、星型に似た多次元データベース内での、テーブルの論理的な形成です。この青写真では、1つのファクト・テーブル（特定のビジネスイベントまたはプロセスに関連するメトリクスセット）が星の中心にあり、複数の関連するディメンション・テーブルに囲まれています。

ディメンション・テーブル間には依存関係がないため、スター・スキーマがクエリーを作成する際に必要な結合の数が減ります。この構造によりクエリが容易になるため、スター・スキーマは、大規模なデータセットにアクセスしてナビゲートしたいアナリストにとって非常に効率的です。

スノーフレーク

スノーフレーク・スキーマは、スター・スキーマの論理的な拡張であり、追加のディメンション・テーブルを使用して青写真を構築します。ディメンション・テーブルは、データの整合性を保護し、データの冗長性を最小限に抑えるために正規化されます。

この方法では、ディメンション・テーブルを保存するのに必要なスペースが少なくて済みますが、構造が複雑で保守が難しい場合があります。スノーフレーク・スキーマを使用する主な利点は、要求されるディスク容量が少ないことですが、注意すべき点は、テーブルが追加されることによるパフォーマンスへの悪影響です。

ボールト

データ・ボールトは、ITプロフェッショナルがアジャイルなエンタープライズ・データウェアハウスを設計できるようにする最新のデータベース・モデリング手法です。このアプローチは階層構造を適用するもので、他のスキーマ・モデルを使用する際に生じる俊敏性、柔軟性、スケーラビリティの問題に対処する目的のために開発されました。

データ・ボールトは、スター・スキーマのクレンジングの必要性を排除し、既存のスキーマを混乱させることなく、新しいデータソースの追加を合理化します。

データ・マートを扱う対象者（およびその使用方法）

データ・マートは、重要なビジネス上の意思決定を部門レベルでガイドします。たとえば、マーケティング・チームはデータ・マートを使用して消費者の行動を分析し、営業スタッフはデータ・マートを使用して四半期ごとの販売レポートを作成できます。これらのタスクはそれぞれの部門内で行われるため、チームはすべてのエンタープライズ・データにアクセスする必要はありません。

通常、データ・マートは、その使用を意図した特定のビジネス部門によって作成および管理されます。データ・マートを設計するプロセスは通常、以下のステップで構成されます。

データ・マートのビジネスおよび技術的ニーズを理解するために重要な要件を文書化します。
データ・マートが情報として依存するデータ・ソースを特定します。
より詳細なレベルでトピックに関するすべての情報であるか、特定のフィールドに関するものであるか、データ・サブセットを見極めます。
大規模なデータウェアハウスと相関するスキーマを選択して、データ・マートの論理レイアウトを設計します。

基礎作業が完了したら、QlikやSiSenseなどの専門のビジネス・インテリジェンス・ツールを使用することで、データ・マートから最大の価値を引き出すことができます。これらのソリューションには、データからインサイトを容易に識別できるダッシュボードや視覚化が含まれており、最終的には企業に利益をもたらすより賢明な意思決定につながります。

データ・マートとクラウド・アーキテクチャー

データ・マートは、ビジネスに効率と柔軟性の向上のメリットを提供しますが、データの増加を止めることはできないため、オンプレミス・ソリューションを使用し続ける企業は問題に直面することになります。

データウェアハウスがクラウドに移行すると、データ・マートもそれに追随します。すべてのデータ・マートを含む単一のリポジトリにデータ・リソースを統合することで、企業はコストを削減し、すべての部門は必要なデータにリアルタイムで自由にアクセスできます。

クラウドベースのプラットフォームによって、膨大なデータセットを簡単に作成、共有、保存することが可能になり、より効率的で効果的なデータ・アクセスと分析への道が開かれます。クラウド・システムは、ビジネスの持続的な成長を前提に構築されています。そのため現代のSaaS（Software-as-a Service）プロバイダーの多くは、データクエリ時のスケーラビリティを向上させるために、データ・ストレージとコンピューティングを分離させています。