Power the agentic enterprise Sehen Sie sich die Think-Keynote an

Was ist Datenmodellierung?

Was ist Datenmodellierung?

Bei der Datenmodellierung wird entweder ein ganzes Informationssystem oder Teile davon visuell dargestellt, um Verbindungen zwischen Datenpunkten und Strukturen zu kommunizieren.

Das Ziel der Datenmodellierung besteht darin, die im System verwendeten und gespeicherten Typen sowie die Beziehungen zwischen diesen Typen darzustellen. Außerdem werden die Möglichkeiten beschrieben, wie die Daten gruppiert und organisiert werden können, sowie deren Formate und Attribute.

Datenmodelle sind auf die Bedürfnisse von Unternehmen zugeschnitten. Regeln und Anforderungen werden im Voraus anhand des Feedbacks der Stakeholder definiert, sodass sie in den Entwurf eines neuen Systems integriert oder in der Iteration eines bestehenden Systems angepasst werden können.

Daten können auf verschiedenen Abstraktionsebenen modelliert werden. Der Prozess beginnt mit dem Sammeln von Informationen über die Geschäftsanforderungen von Stakeholdern und Endnutzern. Diese Business Rules werden dann in Datenstrukturen übersetzt, um einen konkreten Datenbankentwurf zu formulieren. Ein Datenmodell lässt sich mit einer Straßenkarte, einem Architektenplan oder einem beliebigen formalen Diagramm vergleichen, das ein tieferes Verständnis dessen ermöglicht, was entworfen wird.

Bei der Datenmodellierung kommen standardisierte Schemata und formale Techniken zum Einsatz. Dieser Ansatz bietet eine einheitliche, konsistente und vorhersehbare Methode zur Definition und Verwaltung von Datenressourcen innerhalb eines Unternehmens oder sogar darüber hinaus.

Im Idealfall sind Datenmodelle lebendige Dokumente, die sich mit den sich wandelnden geschäftlichen Anforderungen weiterentwickeln. Sie spielen eine wichtige Rolle bei der Unterstützung von Geschäftsprozessen sowie bei der Planung der IT-Architektur und -Strategie. Datenmodelle können mit Anbietern, Partnern oder Branchenkollegen geteilt werden.

Arten von Datenmodellen

Wie jeder Entwurfsprozess beginnt auch der Entwurf von Datenbanken und Informationssystemen auf einer hohen Abstraktionsebene und wird im weiteren Verlauf immer konkreter und spezifischer. Datenmodelle lassen sich im Allgemeinen in drei Kategorien einteilen, die sich durch ihren Abstraktionsgrad unterscheiden. Der Prozess beginnt mit einem konzeptionellen Modell, geht über in ein logisches Modell und endet mit einem physischen Modell. Jede Art von Datenmodell wird in den folgenden Abschnitten näher erläutert:

Konzeptionelle Datenmodelle

Sie werden auch als Domänenmodelle bezeichnet und bieten einen Überblick darüber, was das System umfassen wird, wie es organisiert sein wird und welche Geschäftsregeln dabei eine Rolle spielen. Solche konzeptionellen Modelle werden als Teil des Prozesses zur Erfassung der ersten Projektanforderungen erstellt.

In der Regel umfassen sie Entitätsklassen (die die Typen von Objekten definieren, deren Darstellung im Datenmodell für das Unternehmen wichtig ist), deren Eigenschaften und Einschränkungen sowie die Beziehungen zwischen ihnen. Darüber hinaus umfassen sie relevante Anforderungen an die Sicherheit und die Datenintegrität. Diese Elemente legen gemeinsam fest, wie Daten innerhalb des Modells strukturiert und verwaltet werden. Die Notation ist in der Regel einfach.

Diagramm zur konzeptionellen Datenmodellierung

Logische Datenmodelle

Sie sind weniger abstrakt und enthalten detailliertere Informationen zu den Konzepten und Beziehungen in der betrachteten Domain. Es wird eines von mehreren formalen Notationssystemen für die Datenmodellierung verwendet. Diese Notationen geben Datenattribute wie Datentypen und ihre entsprechenden Längen an und zeigen die Beziehungen zwischen den Entitäten.

Logische Datenmodelle legen keine technischen Systemanforderungen fest. Diese Phase wird bei agilen oder DevOps-Praktiken häufig übersprungen. Logische Datenmodelle können in stark prozeduralen Implementierungsumgebungen oder bei Projekten nützlich sein, die von Natur aus datenorientiert sind, wie beispielsweise beim Entwurf von Data Warehouses oder bei der Entwicklung von Berichtssystemen.

Diagramm zur logischen Datenmodellierung

Physische Datenmodelle

Sie legen fest, wie die Daten physisch in einer Datenbank gespeichert werden. Daher sind sie am wenigsten abstrakt. Sie bieten ein fertiges Design, das als relationale Datenbank implementiert werden kann, einschließlich assoziativer Tabellen, die die Beziehungen zwischen den Entitäten veranschaulichen. Das Design legt zudem die Primärschlüssel und Fremdschlüssel fest, die zur Aufrechterhaltung dieser Beziehungen verwendet werden. Physische Datenmodelle können DBMS-spezifische Eigenschaften enthalten, einschließlich der Leistungsoptimierung.

Diagramm zur physischen Datenmodellierung

Datenmodellierungsprozess

Als Disziplin lädt die Datenmodellierung die Stakeholder dazu ein, die Datenverarbeitung und den Speicher bis ins kleinste Detail zu bewerten. Datenmodellierungstechniken haben unterschiedliche Konventionen, die bestimmen, welche Symbole zur Darstellung der Daten verwendet werden, wie Modelle angeordnet werden und wie geschäftliche Anforderungen übermittelt werden. Alle Ansätze bieten formalisierte Workflows, die eine Abfolge von Aufgaben enthalten, die iterativ ausgeführt werden. Diese Workflows sehen im Allgemeinen so aus:

  1. Identifizieren Sie die Entitäten. Der Prozess der Datenmodellierung beginnt mit der Identifikation der Dinge, Ereignisse oder Konzepte, die im zu modellierenden Datensatz dargestellt sind. Jede Entität sollte zusammenhängend und logisch von allen anderen getrennt sein.
  2. Ermitteln Sie die Haupteigenschaften jeder Entität.Jeder Entitätstyp lässt sich von allen anderen unterscheiden, da er über eine oder mehrere einzigartige Eigenschaften verfügt, die als Attribute bezeichnet werden. Beispielsweise könnte eine Entität namens „Kunde“ Attribute wie Vorname, Nachname, Telefonnummer und Anrede aufweisen. Eine Entität namens „Adresse“ könnte einen Straßennamen und eine Hausnummer, einen Ort, ein Bundesland, ein Land und eine Postleitzahl umfassen.
  3. Identifizieren Sie Beziehungen zwischen Entitäten. Der erste Entwurf eines Datenmodells legt fest, in welcher Beziehung die einzelnen Entitäten zueinander stehen. Im vorherigen Beispiel „wohnt“ jeder Kunde an einer Adresse. Wird dieses Modell um eine Entität namens „Bestellungen“ erweitert, wird jede Bestellung an eine Adresse versandt und dort in Rechnung gestellt. Diese Beziehungen werden mithilfe der Unified Modeling Language (UML) dokumentiert.
  4. Ordnen Sie die Attribute vollständig den Entitäten zu. Dieser Ansatz stellt sicher, dass das Modell die Art und Weise widerspiegelt, wie das Unternehmen die Daten nutzen wird. Mehrere formale Datenmodellierungsmuster sind weit verbreitet. Objektorientierte Entwickler wenden häufig Analysemuster oder Entwurfsmuster an, während Stakeholder aus anderen Geschäftsbereichen auf andere Muster zurückgreifen können.
  5. Weisen Sie den Schlüsseln nach Bedarf eine Rolle zu und legen Sie einen Normalisierungsgrad fest, der ein Gleichgewicht zwischen der Notwendigkeit, Redundanzen zu reduzieren, und den Leistungsanforderungen herstellt. Normalisierung ist eine Technik zum Unternehmen von Datenmodellen (und der von ihnen repräsentierten Datenbanken), bei der Gruppen von Daten numerische Bezeichner, sogenannte Schlüssel, zugewiesen werden, um Beziehungen zwischen ihnen darzustellen, ohne die Daten zu wiederholen. Wenn beispielsweise jedem Kunden ein Schlüssel zugewiesen wird, kann dieser Schlüssel sowohl mit seiner Adresse als auch mit seiner Bestellhistorie verknüpft werden, ohne dass diese Informationen in der Tabelle mit den Kundennamen wiederholt werden müssen. Die Normalisierung verringert den Speicherplatzbedarf einer Datenbank, kann jedoch zu Lasten der Abfrageleistung gehen.
  6. Finalisieren und validieren Sie das Datenmodell. Die Datenmodellierung ist ein iterativer Prozess, der wiederholt und verfeinert werden sollte, wenn sich die Geschäftsanforderungen ändern.
AI Academy

Ist Datenverwaltung das Geheimnis generativer KI?

Erfahren Sie, warum qualitativ hochwertige Daten für den erfolgreichen Einsatz generativer KI unerlässlich sind.

Typen der Datenmodellierung

Die Datenmodellierung hat sich parallel zu den Datenbankmanagementsystemen weiterentwickelt, wobei die Typen der Modelle mit den wachsenden Anforderungen der Unternehmen an die Datenspeicher immer komplexer geworden sind. Hier sind verschiedene Modelltypen:

  • Hierarchische Datenmodelle stellen Eins-zu-Viele-Beziehungen in einer baumartigen Struktur dar. In dieser Art von Modell hat jeder Datensatz eine einzige Wurzel oder ein übergeordnetes Element, das einem oder mehreren untergeordneten Tabellen zugeordnet ist. Dieses Modell wurde im IBM Information Management System (IMS) implementiert, das 1966 eingeführt wurde und insbesondere im Bankwesen rasch breite Anwendung fand. Obwohl dieser Ansatz weniger effizient ist als neuere Datenbankmodelle, wird er nach wie vor in Extensible Markup Language (XML)-Systemen und geografischen Informationssystemen (GIS) verwendet.
  • Relationale Datenmodelle wurden ursprünglich 1970 vom IBM-Forscher E.F. Codd vorgeschlagen. Sie werden auch heute noch in den vielen verschiedenen relationalen Datenbanken umgesetzt, die in der Unternehmens-IT weit verbreitet sind. Die relationale Datenmodellierung erfordert kein detailliertes Verständnis der physikalischen Eigenschaften des verwendeten Datenspeichers. Dabei werden Datensegmente explizit über Tabellen miteinander verknüpft, was die Komplexität der Datenbank verringert.

Relationale Datenbanken nutzen häufig eine strukturierte Abfragesprache (SQL) zur Datenverwaltung. Diese Datenbanken eignen sich gut zur Wahrung der Datenintegrität und zur Minimierung von Redundanzen. Sie werden häufig in Kassensystemen sowie für andere Typen der Transaktionsverarbeitung eingesetzt.

  • Entity-Relationship (ER)-Datenmodelle verwenden formale Diagramme zur Darstellung der Beziehungen zwischen Entitäten in einer Datenbank. Mehrere ER-Modellierungswerkzeuge werden von Data Architects verwendet, um visuelle Karten zu erstellen, die die Ziele des Datenbankdesigns vermitteln.
  • Objektorientierte Datenmodelle gewannen als objektorientierte Programmierung an Zugkraft und wurden Mitte der 1990er Jahre populär. Bei den verwendeten „Objekten“ handelt es sich um Abstraktionen von Entitäten der realen Welt. Objekte sind in Klassenhierarchien gruppiert und haben zugehörige Funktionen. Objektorientierte Datenbanken können Tabellen enthalten, können aber auch komplexere Datenbeziehungen unterstützen. Dieser Ansatz wird in Multimedia- und Hypertextdatenbanken sowie in anderen Anwendungsfallen eingesetzt.
  • Dimensionale Datenmodelle  wurden von Ralph Kimball entwickelt und dienen dazu, die Geschwindigkeit des Datenabrufs für Analysezwecke in einem Data Warehouse zu optimieren. Während relationale und ER-Modelle den Schwerpunkt auf eine effiziente Speicherung legen, erhöhen dimensionale Modelle die Redundanz, um das Auffinden von Informationen für die Berichterstellung und den Datenabruf zu erleichtern. Diese Modellierung wird typischerweise in OLAP-Systemen verwendet.

Zwei gängige dimensionale Datenmodelle sind das Sternschema, bei dem Daten in Fakten (messbare Größen) und Dimensionen (Referenzinformationen) gegliedert sind. In diesem Modell ist jede Tatsache von den zugehörigen Dimensionen in einer sternförmigen Anordnung umgeben. Das andere Modell ist das Schneeflockenschema, das dem Sternschema ähnelt, jedoch weitere Ebenen zugehöriger Dimensionen umfasst, wodurch das Verzweigungsmuster komplexer wird.

Vorteile der Datenmodellierung

Die Datenmodellierung erleichtert es Entwicklern, Datenarchitekten, Geschäftsanalysten und anderen Stakeholdern, die Beziehungen zwischen den Daten in einer Datenbank oder einem Data Warehouse zu erkennen und zu verstehen. Darüber hinaus kann es:

  • Fehler bei der Software- und Datenbankentwicklung reduzieren.
  • Die Einheitlichkeit der Dokumentation und des Systemdesigns im gesamten Unternehmen steigern.
  • Die Leistung von Anwendungen und Datenbanken verbessern.
  • Die Datenzuordnung im gesamten Unternehmen vereinfachen.
  • Die Kommunikation zwischen Entwicklern und Business-Intelligence-Teams verbessern.
  • Den Prozess der Datenbankgestaltung auf konzeptionlicher, logischer und physischer Ebene erleichtern und beschleunigen.

Tools zur Datenmodellierung

Zahlreiche kommerzielle und Open-Source-Lösungen für computergestütztes Software-Engineering (CASE) sind heute weit verbreitet, darunter mehrere Tools für die Datenmodellierung, Diagrammerstellung und Visualisierung. Hier einige Beispiele:

  • erwin Data Modeler ist ein Datenmodellierungstool, das auf der IDEF1X-Datenmodellierungssprache (Integration DEFinition for Information Modeling) basiert und inzwischen auch andere Notationsmethoden unterstützt, einschließlich eines dimensionalen Ansatzes.
  • Enterprise Architect ist ein visuelles Modellierungs- und Designwerkzeug, das die Modellierung von Unternehmensinformationssystemen und -architekturen sowie von Softwareanwendungen und Datenbanken unterstützt. Es basiert auf objektorientierten Sprachen und Standards.
  • ER/Studio ist Datenbankdesign-Software, die mit mehreren der heute beliebtesten Datenbankmanagementsysteme kompatibel ist. Es unterstützt sowohl relationale als auch dimensionale Datenmodellierung.
  • Zu den kostenlosen Tools für die Datenmodellierung gehören Open-Source-Lösungen wie Open ModelSphere.
3D-Rendering einer Spirale aus mehreren nebeneinander angeordneten Symbolen, darunter eine Kamera, ein Lautstärkeregler und eine Zwischenablage
Weiterführende Lösungen
Data-Science-Tools und -Lösungen

Nutzen Sie Data-Science-Tools und -Lösungen, um mithilfe von Daten, Algorithmen, maschinellem Lernen und KI-Techniken Muster zu erkennen und Prognosen zu treffen.

Entdecken Sie Data-Science-Lösungen
IBM Cognos Analytics

Wir stellen vor: Cognos Analytics 12.0, KI-gestützte Erkenntnisse für eine bessere Entscheidungsfindung.

Cognos Analytics erkunden
Beratungsservices für Daten und Analysen

Erschließen Sie den Wert von Unternehmensdaten mit IBM Consulting und bauen Sie ein erkenntnisorientiertes Unternehmen auf, das Ihnen geschäftliche Vorteile verschafft.

Entdecken Sie die Analyse-Services
Machen Sie den nächsten Schritt

Nutzen Sie Data-Science-Tools und -Lösungen, um mithilfe von Daten, Algorithmen, maschinellem Lernen und KI-Techniken Muster zu erkennen und Prognosen zu treffen.

  1. Data-Science-Lösungen erkunden
  2. Analysedienste erkunden