データ・モデリングは、情報システム全体またはその一部の視覚的表現を作成して、データ・ポイントと構造間の接続を伝達するプロセスです。
データ・モデリングの目的は、システム内で使用および保存されているデータの種類、これらのデータ型間の関係、データをグループ化して整理する方法、およびその形式と属性を示すことです。
データ・モデルはビジネス・ニーズを中心に構築されます。ルールと要件は、ビジネス利害関係者からのフィードバックを通じて事前に定義されるため、新しいシステムの設計に組み込んだり、既存のシステムの反復に適応させたりすることができます。
データはさまざまな抽象化レベルでモデル化できます。このプロセスは、利害関係者やエンド・ユーザーからビジネス要件に関する情報を収集することから始まります。次に、これらのビジネス・ルールをデータ構造に変換し、具体的なデータベース設計を作成します。データ・モデルは、ロードマップ、アーキテクトの青写真、または設計内容のより深い理解を促す正式な図に例えることができます。
データ・モデリングでは、標準化されたスキーマと正式な手法を使用します。これにより、組織全体、あるいは組織を超えて、データ・リソースを定義および管理するための共通の、一貫性のある、予測可能な方法が提供されます。
データ・モデルは、ビジネス・ニーズの変化とともに進化する生きた文書であることが理想的です。これらのモデルは、ビジネス・プロセスのサポートとITアーキテクチャーとストラテジーの計画において重要な役割を果たします。データ・モデルは、ベンダー、パートナー、同業他社と共有できます。
IBMニュースレター
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
ニュースレターは日本語で配信されます。すべてのニュースレターに登録解除リンクがあります。サブスクリプションの管理や解除はこちらから。詳しくはIBMプライバシー・ステートメントをご覧ください。
他の設計プロセスと同様、データベースと情報システムの設計は、高度な抽象化レベルから始まり、徐々に具体的かつ明確になります。データモデルは一般的に、抽象化の度合いに応じて3つのカテゴリに分類できます。このプロセスは概念モデルから始まり、論理モデルへと進み、物理モデルで完了します。各タイプのデータ・モデルについては、後続セクションで詳しく説明します。
これらはドメイン・モデルとも呼ばれ、システムに含まれるもの、システムが構成される方法、関与するビジネス・ルールについての全体像を提供します。概念モデルは通常、プロジェクトの初期要件を収集するプロセスの一環として作成されます。通常は、エンティティー・クラス(データ・モデルで表現するビジネスにとって重要なものの種類を定義)、その特性と制約、エンティティー・クラス間の関係、および関連するセキュリティーとデータ整合性の要件が含まれます。表記法はどれも通常は単純です。
これらは抽象度が低く、検討中のドメイン内の概念と関係についてより詳細な情報を提供します。いくつかの正式なデータ・モデリング表記法システムの1つに従います。これらは、データ・タイプやそれに対応する長さなどのデータ属性を示し、エンティティー間の関係を定義します。論理データ・モデルでは、技術的なシステム要件は指定されません。この段階は、アジャイルや DevOps の実践においては省略されることがよくあります。論理データ・モデルは、高度に手続き的な実装環境や、データ・ウェアハウスの設計やレポート・システムの開発など、本質的にデータ指向のプロジェクトに役立ちます。
これらは、データがデータベース内で物理的にどのように保管されるかについてのスキーマを提供します。そのため、抽象性が最も低いものですエンティティ間の関係を示す関連付けテーブル、およびそれらの関係を維持するために使用される主キーと外部キーなど、リレーショナル・データベースとして実装できる最終的な設計が得られます。物理データモデルには、パフォーマンス調整を含むデータベース管理システム(DBMS)固有のプロパティを含めることができます。
データ・モデリングは性質上、利害関係者にデータ処理やストレージを厳密に細部まで評価することを促します。データ・モデリング技術には、データを表すためにどのシンボルを使用するか、モデルがどのように配置されるか、およびビジネス要件をどう伝達するかを規定するさまざまな規則があります。すべてのアプローチは、反復的に実行される一連のタスクを含む形式化されたワークフローを提供します。そのワークフローは一般的に次のようなものになります。
データ・モデリングはデータベース管理システムとともに進化し、企業のデータ・ストレージのニーズが高まるにつれてモデル・タイプの複雑さも増しています。ここでは、いくつかのモデル・タイプを紹介します。
リレーショナル・データベースでは、データ管理に構造化照会言語(SQL)が採用されることがよくあります。これらのデータベースは、データの整合性を維持し、冗長性を最小限に抑えるのに効果的です。これらは、販売時点管理システムや他のタイプのトランザクション処理によく使用されます。
一般的な2つの次元データ・モデルはスター・スキーマです。ここではデータがファクト(測定可能な項目)とディメンション(参照情報)に編成され、各ファクトが星型のパターンで関連するディメンションに囲まれています。もう 1 つはスノーフレーク・スキーマです。スター・スキーマに似ていますが、関連するディメンションの追加レイヤーが含まれており、分岐パターンをより複雑にします。
データ・モデリングにより、開発者、データ・アーキテクト、ビジネス・アナリスト、その他の利害関係者は、データベースやデータ・ウェアハウス内のデータ間の関係を表示し、理解することが容易になります。さらに、以下の機能も可能です:
現在、複数のデータ・モデリング、ダイアグラム作成、視覚化ツールなど、数多くの商用およびオープンソースのコンピューター支援ソフトウェア・エンジニアリング(CASE)ソリューションが広く使用されています。以下にそうした例を一部ご紹介します。
データサイエンスのツールとソリューションを使って、データ、アルゴリズム、機械学習、AI技術を活用してパターンを発見し、予測モデルを構築します。
より良い意思決定を可能にする、AIを活用して洞察を引き出すCognos Analytics 12.0をご紹介します。
IBMコンサルティングと連携することで、企業データの価値を引き出し、ビジネス上の優位性をもたらす洞察を活用した組織を構築します。