Bei der Datenmodellierung wird ein ganzes Informationssystem oder Teile davon visuell dargestellt, um Verbindungen zwischen Datenpunkten und -strukturen zu verdeutlichen. Ziel ist es, die im System verwendeten und gespeicherten Datentypen, die Beziehungen zwischen diesen Datentypen, die Art und Weise, wie die Daten gruppiert und organisiert werden können, sowie ihre Formate und Attribute zu veranschaulichen.
Datenmodelle basieren auf den Geschäftsanforderungen. Regeln und Anforderungen werden im Vorfeld durch Rückmeldungen von verschiedenen Beteiligten definiert, damit sie in den Entwurf eines neuen Systems einfließen oder bei der Iteration eines bestehenden Systems angepasst werden können.
Daten können auf verschiedenen Abstraktionsebenen modelliert werden. Der Prozess beginnt mit dem Sammeln von Informationen über die Geschäftsanforderungen verschiedener Interessengruppen und Endbenutzer. Diese Geschäftsregeln werden dann in Datenstrukturen übersetzt, um einen konkreten Datenbankentwurf zu formulieren. Ein Datenmodell ist vergleichbar mit einer Roadmap, dem Entwurf eines Architekten oder einem anderen formalen Diagramm, das ein tieferes Verständnis von dem ermöglicht, was entworfen werden soll.
Bei der Datenmodellierung werden standardisierte Schemata und formale Techniken verwendet. Dies ermöglicht eine einheitliche, konsistente und vorhersehbare Art der Definition und Verwaltung von Datenressourcen im gesamten Unternehmen oder sogar darüber hinaus.
Im Idealfall handelt es sich bei Datenmodellen um dynamische Dokumente, die sich mit den sich ändernden Geschäftsanforderungen weiterentwickeln. Sie spielen eine wichtige Rolle bei der Unterstützung der Geschäftsprozesse und der Planung der IT-Architektur und -Strategie. Datenmodelle können mit Lieferanten, Partnern und/oder anderen Unternehmen der Branche ausgetauscht werden.
Wie jeder Entwurfsprozess beginnt auch der Entwurf von Datenbanken und Informationssystemen auf einer hohen Abstraktionsebene und wird zunehmend konkreter und spezifischer. Datenmodelle können im Allgemeinen in drei Kategorien eingeteilt werden, die sich nach ihrem Abstraktionsgrad unterscheiden. Der Prozess beginnt mit einem konzeptionellen Modell, geht über zu einem logischen Modell und endet mit einem physischen Modell. Die verschiedenen Arten von Datenmodellen werden im Folgenden näher erläutert:
Bei der Datenmodellierung sind die Beteiligten gefordert, die Datenverarbeitung und -speicherung bis ins kleinste Detail zu bewerten. Für Datenmodellierungstechniken gibt es verschiedene Konventionen, die vorschreiben, welche Symbole zur Darstellung der Daten verwendet werden, wie die Modelle aufgebaut sind und wie die Geschäftsanforderungen übermittelt werden. Alle Ansätze bieten formalisierte Arbeitsabläufe, die eine Abfolge von Aufgaben beinhalten, die iterativ durchgeführt werden. Diese Arbeitsabläufe sehen in der Regel wie folgt aus:
Die Datenmodellierung hat sich parallel zu den Datenbankmanagementsystemen entwickelt, wobei die Modelltypen mit dem wachsenden Datenspeicherbedarf der Unternehmen immer komplexer wurden. Im Folgenden sind verschiedene Arten von Modellen aufgeführt:
Relationale Datenbanken verwenden häufig eine strukturierte Abfragesprache (SQL) für das Datenmanagement. Diese Datenbanken eignen sich gut zur Erhaltung der Datenintegrität und zur Minimierung der Redundanz. Sie werden häufig in Kassensystemen und für andere Arten der Transaktionsverarbeitung eingesetzt.
Zwei beliebte dimensionale Datenmodelle sind zum einen das Sternschema, bei dem die Daten in Fakten (messbare Elemente) und Dimensionen (Referenzinformationen) gegliedert sind, wobei jeder Fakt sternförmig von den zugehörigen Dimensionen umgeben ist. Das andere ist das Schneeflockenschema, das dem Sternschema ähnelt, aber zusätzliche Schichten von assoziierten Dimensionen enthält, wodurch das Verzweigungsmuster komplexer wird.
Die Datenmodellierung erleichtert es Entwicklern, Datenarchitekten, Geschäftsanalysten und anderen Beteiligten, die Beziehungen zwischen den Daten in einer Datenbank oder einem Data-Warehouse sichtbar und verständlich zu machen. Darüber hinaus bietet die Modellierung folgende Möglichkeiten:
Zahlreiche kommerzielle und Open-Source-Lösungen für Computer-Aided Software Engineering (CASE) sind heute im Umlauf, darunter mehrere Tools für Datenmodellierung, Diagrammerstellung und Visualisierung. Im Folgenden sind einige Beispiele aufgeführt:
Ein vollständig verwaltetes, elastisches Cloud-Data-Warehouse für leistungsfähige Analysen und KI
Hybrid. Offen. Ausfallsicher. Ihre Plattform und Ihr Partner für digitale Transformation.
Software für KI-gestützte Hybrid-Cloud.