Bei der Datenmodellierung wird entweder ein ganzes Informationssystem oder Teile davon visuell dargestellt, um Verbindungen zwischen Datenpunkten und Strukturen zu kommunizieren.
Das Ziel der Datenmodellierung ist es, die im System verwendeten und gespeicherten Datentypen, die Beziehungen zwischen diesen Datentypen, die Gruppierungs- und Organisationsformen der Daten sowie deren Formate und Attribute zu illustrieren.
Datenmodelle sind auf die Bedürfnisse von Unternehmen zugeschnitten. Regeln und Anforderungen werden im Voraus anhand des Feedbacks der Stakeholder definiert, sodass sie in den Entwurf eines neuen Systems integriert oder in der Iteration eines bestehenden Systems angepasst werden können.
Daten können auf verschiedenen Abstraktionsebenen modelliert werden. Der Prozess beginnt mit dem Sammeln von Informationen über die Geschäftsanforderungen von Stakeholdern und Endnutzern. Diese Business Rules werden dann in Datenstrukturen übersetzt, um einen konkreten Datenbankentwurf zu formulieren. Ein Datenmodell lässt sich mit einer Straßenkarte, einem Architektenplan oder einem beliebigen formalen Diagramm vergleichen, das ein tieferes Verständnis dessen ermöglicht, was entworfen wird.
Bei der Datenmodellierung werden standardisierte Schemata und formale Techniken verwendet. Dies bietet eine gemeinsame, konsistente und vorhersehbare Methode zur Definition und Verwaltung von Ressourcen in einem Unternehmen oder sogar darüber hinaus.
Im Idealfall sind Datenmodelle lebendige Dokumente, die sich mit den sich ändernden Geschäftsanforderungen weiterentwickeln. Sie spielen eine wichtige Rolle bei der Unterstützung von Geschäftsprozessen sowie bei der Planung der IT-Architektur und -Strategie. Datenmodelle können mit Anbietern, Partnern und/oder Branchenkollegen geteilt werden.
Branchen-Newsletter
Bleiben Sie mit dem Think-Newsletter über die wichtigsten – und faszinierendsten – Branchentrends in den Bereichen KI, Automatisierung, Daten und mehr auf dem Laufenden. Weitere Informationen finden Sie in der IBM Datenschutzerklärung.
Ihr Abonnement wird auf Englisch geliefert. In jedem Newsletter finden Sie einen Abmeldelink. Hier können Sie Ihre Abonnements verwalten oder sich abmelden. Weitere Informationen finden Sie in unserer IBM Datenschutzerklärung.
Wie jeder Designprozess beginnt auch die Entwicklung von Datenbanken und Informationssystemen auf einer hohen Abstraktionsebene und wird zunehmend konkreter und spezifischer. Datenmodelle lassen sich im Allgemeinen in drei Kategorien einteilen, die je nach Grad der Abstraktion variieren. Der Prozess beginnt mit einem konzeptuellen Modell, entwickelt sich zu einem logischen Modell und endet mit einem physikalischen Modell. Jede Art von Datenmodell wird in den folgenden Abschnitten ausführlicher behandelt:
Konzeptionelle Datenmodelle: Sie werden auch als Domainmodelle bezeichnet und bieten einen umfassenden Überblick darüber, was das System enthalten wird, wie es organisiert sein wird und welche Business Rules daran beteiligt sind. Solche konzeptionellen Modelle werden in der Regel als Teil des Prozesses zur Erfassung der ersten Projektanforderungen erstellt. Meist enthalten sie Entitätsklassen (die Dinge definieren, die für das Unternehmen im Datenmodell dargestellt werden sollen), ihre Merkmale und Einschränkungen, die Beziehungen zwischen ihnen und die relevanten Sicherheits- und Datenintegritätsanforderungen. Jede Notation ist typischerweise einfach.
Logische Datenmodelle: Sie sind weniger abstrakt und enthalten detailliertere Informationen zu den Konzepten und Beziehungen in der betrachteten Domain. Es wird eines von mehreren formalen Notationssystemen für die Datenmodellierung verwendet. Diese geben Datenattribute wie Datentypen und ihre entsprechenden Längen an und zeigen die Beziehungen zwischen den Entitäten. Logische Datenmodelle legen keine technischen Systemanforderungen fest. Diese Phase wird in flexiblen oder DevOps-Praktiken DevOps häufig ausgelassen. Logische Datenmodelle können in hochprozeduralen Implementierungsumgebungen oder für datenorientierte Projekte nützlich sein, wie etwa das Design von Data Warehouse oder die Entwicklung von Berichtssystemen.
Sie bieten ein Schema vor, wie die Daten physisch in einer Datenbank gespeichert werden. Als solche sind sie am wenigsten abstrakt von allen. Sie bieten ein fertiges Design, das als relationale Datenbank implementiert werden kann, einschließlich assoziativer Tabellen, die die Beziehungen zwischen Entitäten veranschaulichen, sowie der Primär- und Fremdschlüssel, die zur Aufrechterhaltung dieser Beziehungen verwendet werden. Physische Datenmodelle können für das Datenbankmanagementsystem (DBMS) spezifische Eigenschaften enthalten, einschließlich Leistung.
Als Disziplin lädt die Datenmodellierung die Stakeholder dazu ein, die Datenverarbeitung und den Speicher bis ins kleinste Detail zu bewerten. Datenmodellierungstechniken haben unterschiedliche Konventionen, die bestimmen, welche Symbole zur Darstellung der Daten verwendet werden, wie Modelle angeordnet werden und wie geschäftliche Anforderungen übermittelt werden. Alle Ansätze bieten formalisierte Workflows, die eine Abfolge von Aufgaben enthalten, die iterativ ausgeführt werden. Diese Workflows sehen im Allgemeinen so aus:
Die Datenmodellierung hat sich parallel zu den Datenbankmanagementsystemen weiterentwickelt, wobei die Komplexität der Modelltypen mit dem Wachstum des Datenspeicherbedarfs der Unternehmen zugenommen hat. Hier sind verschiedene Modelltypen:
Relationale Datenbanken verwenden häufig strukturierte Abfragesprache (SQL) für die Datenverwaltung. Diese Datenbanken eignen sich gut zur Wahrung der Datenintegrität und zur Minimierung von Redundanz. Sie werden häufig in Kassensystemen und für andere Arten der Transaktionsverarbeitung verwendet.
Zwei beliebte dimensionale Datenmodelle sind das Sternschema, bei dem die Daten in Fakten (messbare Elemente) und Dimensionen (Referenzinformationen) gegliedert sind, wobei jeder Fakt von den zugehörigen Dimensionen in einem sternförmigen Muster umgeben ist. Das andere ist das Schneeflockenschema, das dem Sternschema ähnelt, aber zusätzliche Ebenen assoziierter Dimensionen enthält, wodurch das Verzweigungsmuster komplexer wird.
Datenmodellierung erleichtert es Entwicklern, Datenarchitekten, Geschäftsanalysten und anderen Stakeholdern, die Beziehungen zwischen den Daten in einer Datenbank oder einem Data Warehouse einzusehen und zu verstehen. Darüber hinaus kann es:
Zahlreiche kommerzielle und Open-Source-Lösungen für computergestütztes Software-Engineering (CASE) sind heute weit verbreitet, darunter mehrere Tools für die Datenmodellierung, Diagrammerstellung und Visualisierung. Hier einige Beispiele:
Nutzen Sie Data-Science-Tools und -Lösungen, um mithilfe von Daten, Algorithmen, maschinellem Lernen und KI-Techniken Muster zu erkennen und Prognosen zu treffen.
Wir stellen vor: Cognos Analytics 12.0, KI-gestützte Erkenntnisse für eine bessere Entscheidungsfindung.
Erschließen Sie den Wert von Unternehmensdaten mit IBM Consulting und bauen Sie ein erkenntnisorientiertes Unternehmen auf, das Ihnen geschäftliche Vorteile verschafft.