データ・マートは、特定の事業分野、部門、または主題領域に重点を置いたデータウェアハウスのサブセットです。データ・マートは、チームの効率性を向上させ、コストを削減し、企業におけるよりスマートかつ戦術的なビジネス上の意思決定を促進します。
データ・マートは、定義されたユーザー・グループが特定のデータを利用できるようにするため、ユーザーはデータウェアハウス全体の検索に時間を浪費することなく、重要な洞察に素早くアクセスできるようになります。たとえば、多くの企業では、財務、営業、マーケティングなど、ビジネス内の特定の部門に合わせたデータ・マートを持っている場合があります。
データ・マート、データウェアハウス、データレイクは重要な中央データリポジトリですが、これらは組織内でそれぞれ異なるニーズに対応します。
データウェアハウスは、データマイニング、人工知能(AI)、および機械学習をサポートするために、複数のソースからのデータを単一の中央の一貫したデータストアに集約するシステムであり、最終的には洗練された分析とビジネス・インテリジェンスを強化できます。データウェアハウス・ソリューションは、この戦略的収集プロセスを通じて、さまざまなソースからのデータを統合し、1つの統一された形式で利用できるようにします。
データ・マート(前述のとおり)は、データウェアハウスの対象を絞ったバージョンであり、組織内の単一のチームまたは選択されたユーザーグループにとって重要かつ必要とされるデータの、比較的小さなサブセットを含みます。データ・マートは、既存のデータウェアハウス(またはその他のデータソース)から、物理データベースの設計と構築、データ投入、複雑なアクセス・管理プロトコルの設定など、複数のテクノロジーやツールを駆使した複雑な手順で構築されます。
これは難しいプロセスですが、ビジネス部門は、より広範なデータウェアハウスのデータセットを扱うよりも、より焦点を絞った洞察をすばやく見つけることができます。たとえば、マーケティング・チームは、既存のウェアハウスからデータ・マートを作成することでメリットが得られる場合があります。彼らの業務は通常、他の業務とは独立して実行されるためです。これにより、チームはすべての企業データにアクセスする必要はありません。
データレイクもまた、データのリポジトリです。データレイクは、複数のソースから供給される非構造化データまたは生データの大規模なストレージを提供しますが、その情報はまだ処理されておらず、分析の準備ができていません。データを生のフォーマットで保存できる結果、データレイクはデータウェアハウスよりもアクセスしやすく、コスト効率も高くなります。取り込み前にデータのクリーニングや処理を行う必要はありません。
たとえば、官公庁・自治体は、テクノロジーを利用して交通行動、電力使用状況、水路に関するデータを追跡し、データレイクに保存することで、そのデータをどのように使用すればより効率的なサービスを備えた「スマートシティ」を実現できるかを検討できます。
データ・マートは、比較的狭いデータの主題を持つことにより、特定のグループのニーズを満たすように設計されています。また、データ・マートには何百万ものレコードを含めることができますが、その目的は、ビジネスユーザーに最短時間で最も関連性の高いデータを提供することです。
より小さく、焦点を絞った設計により、データ・マートはエンドユーザーに次のようないくつかの利点をもたらします。
データ・マートには、データウェアハウスと各システムのそれぞれのデータ・ソースとの関係に基づいて異なる3つのタイプがあります。
データ・マートは、トランザクション・データを行と列に格納する主題指向のリレーショナル・データベースであり、アクセス、整理、理解が容易になります。この構造には履歴データが含まれているため、アナリストはデータの傾向を判断しやすくなります。一般的なデータ・フィールドには、数値順序、時間値、および1つ以上のオブジェクトへの参照が含まれます。
企業は、分析作業にデータベースを使用する人々のニーズに対応するための青写真として、多次元スキーマでデータ・マートを編成します。スキーマには、主にスター型、スノーフレーク型、ボールト型の3つのタイプがあります。
スター・スキーマは、星型に似た多次元データベース内での、テーブルの論理的な形成です。この青写真では、1つのファクト・テーブル(特定のビジネスイベントまたはプロセスに関連するメトリクスセット)が星の中心にあり、複数の関連するディメンション・テーブルに囲まれています。
ディメンション・テーブル間には依存関係がないため、スター・スキーマがクエリーを作成する際に必要な結合の数が減ります。この構造によりクエリが容易になるため、スター・スキーマは、大規模なデータセットにアクセスしてナビゲートしたいアナリストにとって非常に効率的です。
スノーフレーク・スキーマは、スター・スキーマの論理的な拡張であり、追加のディメンション・テーブルを使用して青写真を構築します。ディメンション・テーブルは、データの整合性を保護し、データの冗長性を最小限に抑えるために正規化されます。
この方法では、ディメンション・テーブルを保存するのに必要なスペースが少なくて済みますが、構造が複雑で保守が難しい場合があります。スノーフレーク・スキーマを使用する主な利点は、要求されるディスク容量が少ないことですが、注意すべき点は、テーブルが追加されることによるパフォーマンスへの悪影響です。
データ・ボールトは、ITプロフェッショナルがアジャイルなエンタープライズ・データウェアハウスを設計できるようにする最新のデータベース・モデリング手法です。このアプローチは階層構造を適用するもので、他のスキーマ・モデルを使用する際に生じる俊敏性、柔軟性、スケーラビリティの問題に対処する目的のために開発されました。
データ・ボールトは、スター・スキーマのクレンジングの必要性を排除し、既存のスキーマを混乱させることなく、新しいデータソースの追加を合理化します。
データ・マートは、重要なビジネス上の意思決定を部門レベルでガイドします。たとえば、マーケティング・チームはデータ・マートを使用して消費者の行動を分析し、営業スタッフはデータ・マートを使用して四半期ごとの販売レポートを作成できます。これらのタスクはそれぞれの部門内で行われるため、チームはすべてのエンタープライズ・データにアクセスする必要はありません。
通常、データ・マートは、その使用を意図した特定のビジネス部門によって作成および管理されます。データ・マートを設計するプロセスは通常、以下のステップで構成されます。
基礎作業が完了したら、QlikやSiSenseなどの専門のビジネス・インテリジェンス・ツールを使用することで、データ・マートから最大の価値を引き出すことができます。これらのソリューションには、データからインサイトを容易に識別できるダッシュボードや視覚化が含まれており、最終的には企業に利益をもたらすより賢明な意思決定につながります。
データ・マートは、ビジネスに効率と柔軟性の向上のメリットを提供しますが、データの増加を止めることはできないため、オンプレミス・ソリューションを使用し続ける企業は問題に直面することになります。
データウェアハウスがクラウドに移行すると、データ・マートもそれに追随します。すべてのデータ・マートを含む単一のリポジトリにデータ・リソースを統合することで、企業はコストを削減し、すべての部門は必要なデータにリアルタイムで自由にアクセスできます。
クラウドベースのプラットフォームによって、膨大なデータセットを簡単に作成、共有、保存することが可能になり、より効率的で効果的なデータ・アクセスと分析への道が開かれます。クラウド・システムは、ビジネスの持続的な成長を前提に構築されています。そのため現代のSaaS(Software-as-a Service)プロバイダーの多くは、データクエリ時のスケーラビリティを向上させるために、データ・ストレージとコンピューティングを分離させています。
watsonx.dataを使用すると、オープンでハイブリッド、かつ管理されたデータ・ストアを通じて、データがどこに保存されていても、すべてのデータを使用して分析とAIを拡張できます。
管理対象データに対する常時稼働の高性能な分析とAIワークロードを組織全体に拡張
IBMコンサルティングと連携して、企業データの価値を引き出しましょう。洞察を活用してビジネス上の優位を達成する組織を構築できます。