The DX Leaders
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
データ・モデリングは、情報システム全体またはその一部の視覚的表現を作成して、データ・ポイントと構造間の接続を伝達するプロセスです。
データ・モデリングの目的は、システム内で使用、保管されるデータの種類と、それらのデータの種類の間にある関係を示すことです。また、データをグループ化および整理する方法と、そのフォーマットや属性についても説明します。
データ・モデルはビジネス・ニーズを中心に構築されます。ルールと要件は、ビジネス利害関係者からのフィードバックを通じて事前に定義されるため、新しいシステムの設計に組み込んだり、既存のシステムの反復に適応させたりすることができます。
データはさまざまな抽象化レベルでモデル化できます。このプロセスは、利害関係者やエンド・ユーザーからビジネス要件に関する情報を収集することから始まります。次に、これらのビジネス・ルールをデータ構造に変換し、具体的なデータベース設計を作成します。データ・モデルは、ロードマップ、アーキテクトの青写真、または設計内容のより深い理解を促す正式な図に例えることができます。
データ・モデリングでは、標準化されたスキーマと形式的な手法を使用します。このアプローチにより、組織全体、さらには組織の枠を超えて、共通性、一貫性、予測可能性のある方法でデータ・リソースを定義および管理できます。
データ・モデルは、ビジネス・ニーズの変化とともに進化する生きた文書であることが理想的です。データ・モデルは、ビジネス・プロセスのサポートや、ITアーキテクチャーと戦略の計画において重要な役割を果たします。データ・モデルは、ベンダー、パートナー、同業他社と共有できます。
AI活用のグローバル・トレンドや日本の市場動向を踏まえたDX、生成AIの最新情報を毎月お届けします。登録の際はIBMプライバシー・ステートメントをご覧ください。
他の設計プロセスと同様に、データベースと情報システムの設計は、高い抽象度から始まり、徐々に具体的かつ明確になります。データ・モデルは一般に、抽象度に応じて3つのカテゴリーに分類できます。このプロセスは概念モデルから始まり、論理モデルへと進み、物理モデルで完了します。各タイプのデータ・モデルについては、後続のセクションで詳しく説明します。
概念データ・モデルはドメイン・モデルとも呼ばれ、システムに何が含まれるか、どのように構成されるか、どのビジネス・ルールが関係するかについて、高レベルのビューを提供します。概念モデルは、プロジェクトの初期要件を収集するプロセスの一環として作成されます。
通常、概念データ・モデルには、エンティティー・クラス(データ・モデルで表現することがビジネス上重要な対象の種類を定義するもの)、その特性と制約、それらの間の関係が含まれます。また、関連するセキュリティー要件やデータ保全性要件も含まれます。これらの要素を組み合わせることで、モデル内でデータをどのように構造化し、ガバナンスするかが定義されます。表記法は通常、単純です。
物理データ・モデルは、データがデータベース内で物理的にどのように保管されるかについてのスキーマを提供します。そのため、抽象度は最も低くなります。エンティティー間の関係を示す関連テーブルなど、リレーショナル・データベースとして実装できる最終的な設計を提供します。この設計では、それらの関係を維持するために使用される主キーと外部キーも指定されます。物理データ・モデルには、パフォーマンス・チューニングなど、データベース管理システム(DBMS)固有のプロパティを含めることができます。
データ・モデリングは性質上、利害関係者にデータ処理やストレージを厳密に細部まで評価することを促します。データ・モデリング技術には、データを表すためにどのシンボルを使用するか、モデルがどのように配置されるか、およびビジネス要件をどう伝達するかを規定するさまざまな規則があります。すべてのアプローチは、反復的に実行される一連のタスクを含む形式化されたワークフローを提供します。そのワークフローは一般的に次のようなものになります。
データ・モデリングはデータベース管理システムとともに進化し、企業のデータ・ストレージ・ニーズが高まるにつれて、モデル・タイプの複雑さも増しています。ここでは、いくつかのモデル・タイプを紹介します。
リレーショナル・データベースでは、データ管理に構造化照会言語(SQL)がよく使用されます。これらのデータベースは、データの整合性を維持し、冗長性を最小限に抑えるのに適しています。POSシステムをはじめ、その他の種類のトランザクション処理にもよく使用されます。
一般的な次元データ・モデルには、スター・スキーマとスノーフレーク・スキーマの2つがあります。スター・スキーマでは、データはファクト(測定可能な項目)とディメンション(参照情報)に編成されます。このモデルでは、各ファクトが関連するディメンションに星型のパターンで囲まれています。もう1つはスノーフレーク・スキーマで、スター・スキーマに似ていますが、関連するディメンションのレイヤーがさらに含まれるため、分岐パターンがより複雑になります。
データ・モデリングにより、開発者、データ・アーキテクト、ビジネス・アナリスト、その他の利害関係者は、データベースやデータウェアハウス内のデータ間の関係を把握し、理解しやすくなります。さらに、次のことも可能になります。
現在、複数のデータ・モデリング、ダイアグラム作成、視覚化ツールなど、数多くの商用およびオープンソースのコンピューター支援ソフトウェア・エンジニアリング(CASE)ソリューションが広く使用されています。以下にそうした例を一部ご紹介します。
データサイエンスのツールとソリューションを使って、データ、アルゴリズム、機械学習、AI技術を活用してパターンを発見し、予測モデルを構築します。
より良い意思決定を可能にする、AIを活用して洞察を引き出すCognos Analytics 12.0をご紹介します。
IBMコンサルティングと連携することで、企業データの価値を引き出し、ビジネス上の優位性をもたらす洞察を活用した組織を構築します。