データ・モデリングとは、情報システム全体またはその一部を視覚的に表現し、データ・ポイントや構造間のつながりを伝えるプロセスです。 その目的は、システム内で使用され保存されているデータの種類、これらのデータの種類間の関係、データをグループ化し整理する方法、そのフォーマットや属性を説明することです。
データ・モデルは、ビジネスニーズに基づいて構築されます。 ルールや要件は、ビジネスのステークホルダーからのフィードバックによって前もって定義され、新しいシステムの設計に組み込まれたり、既存のシステムの反復作業の中で適応されたりします。
データは様々な抽象度でモデル化することができます。 このプロセスは、ステークホルダーやエンド・ユーザーからビジネス要件に関する情報を収集することから始まります。 そして、このビジネス・ルールをデータ構造に変換し、具体的なデータベースの設計を行います。 データ・モデルは、ロードマップや建築家の設計図など、設計内容をより深く理解するための正式な図に例えることができます。
データ・モデリングには、標準化されたスキーマとフォーマルな技法が用いられます。 これにより、組織全体、あるいは組織を超えてデータ・リソースを定義し、管理するための共通の、一貫性のある、予測可能な方法が提供されます。
データ・モデルは、ビジネス・ニーズの変化に合わせて進化する生きたドキュメントであることが理想です。 ビジネス・プロセスをサポートし、ITアーキテクチャーや戦略を計画する上で重要な役割を果たしています。 データ・モデルは、ベンダー、パートナー、業界の同業者と共有することが可能です。
他の設計プロセスと同様に、データベースや情報システムの設計は、抽象度の高いレベルから始まり、次第に具体的で明確になっていきます。 データ・モデルは一般的に3つのカテゴリーに分けられ、その抽象度によって異なります。 このプロセスは、概念モデルから始まり、論理モデルへと進み、最後に物理モデルで締めくくります。 各データ・モデルについて、以下で詳しくご説明します。
データ・モデリングでは、データの処理や保存方法を細部まで詳細に評価することが体系的に求められます。 データ・モデリングの技法には、データを表現するためにどのシンボルを使用するか、モデルをどのようにレイアウトするか、ビジネス要件をどのように伝えるかなど、さまざまな規定があります。 すべてのアプローチによって、反復的に実行される一連のタスクが含まれた体系化されたワークフローが実現します。 それらのワークフローは、一般的に次のような内容です。
データ・モデリングは、データベース管理システムとともに進化してきましたが、企業のデータ保存ニーズの高まりとともに、モデルの種類も複雑化してきました。 ここではいくつかのモデルタイプを紹介します。
リレーショナル・データベースでは、データの管理に構造化照会言語(SQL)が多用されている。 これらのデータベースは、データの整合性を保ち、冗長性を最小限に抑えるのに適しています。 POSシステムやその他のトランザクション処理によく使用されています。
一般的な次元データ・モデルとしては、データをファクト(測定可能な項目)とディメンション(参照情報)に分けて整理するスター・スキーマがあり、各ファクトは関連するディメンションに囲まれて星のようになっています。 もう1つはスノーフレーク・スキーマで、これはスター・スキーマに似ていますが、関連する次元の層が追加され、分岐パターンがより複雑になります。
データ・モデリングは、開発者、データ・アーキテクト、ビジネス・アナリストなどの関係者が、データベースやデータ・ウェアハウス内のデータ間の関係を見て理解することを容易にします。 さらに、以下を可能にします。
現在、数多くの商用およびオープン・ソースのコンピューター支援ソフトウェア・エンジニアリング(CASE)ソリューションが広く使用されており、その中にはデータ・モデリング、ダイアグラム作成、視覚化のためのツールも含まれています。 いくつか例をご紹介します。
高性能な分析とAIのために開発されたフルマネージドの柔軟なクラウド・データウェアハウスです。
ハイブリッド。 オープン。 レジリエント。 デジタル・トランスフォーメーションのためのお客様のプラットフォームであり、パートナーでもあります。
AI搭載のハイブリッドクラウド・ソフトウェアです。