Ein Entity-Relationship-Diagramm (ER-Diagramm oder ERD) ist eine visuelle Darstellung der Beziehung von Elementen in einer Datenbank zueinander. ERDs sind eine spezielle Art von Flussdiagrammen, die die Beziehungstypen zwischen verschiedenen Entitäten innerhalb eines Systems vermitteln. Sie verwenden einen definierten Satz von Symbolen, darunter Rechtecke, Ovale und Rauten, und verbinden diese mit Verbindungslinien.
Innerhalb des relationalen Modells des Datenbank-Designs legen ERDs fest, wie Einträge in einer Datenbank miteinander verbunden sind. ERDs sind ein allgemeines konzeptionelles Datenmodell, das die Grundlage für fortgeschritteneres Datenbankdesign und -analyse schafft.
Außerdem kann die Modellierung von Entitätsbeziehungen dazu beitragen, Narrative und Erkenntnisse aus einer scheinbar verteilten Sammlung von Datenpunkten zu destillieren.
Geschäftsanalysten und Datenbankingenieure verwenden ER-Diagramme als Tools für die Datenmodellierung, um den Umfang der Datenbanken zu beurteilen, die ihre Unternehmen benötigen, und dann zu planen, wie die Daten gespeichert werden.
ERDs unterstützen den Softwareentwicklungsteil eines Datenbankprojekts, indem sie die Anforderungen an die Architektur des Informationssystems und die Datenbankstruktur festlegen. Im Drei-Schema-Ansatz der Softwareentwicklung für Datenbankmanagementsysteme (DBMS) ist das ERD die konzeptionelle Ebene.
Datenintegration ist ein komplexer Datenentwicklungsprozess, der aus vielen beweglichen Teilen besteht. Ein ERD kann Dateningenieuren dabei helfen, das Gesamtsystem zu konzipieren und das Fehlerpotenzial zu reduzieren.
Der Vergleich bestehender Datenbanken mit einem ERD kann Fehler beim Datenbankdesign aufdecken, die Probleme verursachen könnten. Komplexe Datenbanken mit zahlreichen Tabellen erfordern umfangreiche SQL-Kenntnisse für den Debugging-Prozess. Ein ERD fasst die Datenbank zusammen, damit die Ingenieure potenzielle Fehler schnell identifizieren können.
Bei Projekten zur Neugestaltung von Geschäftsprozessen (Business Process Reengineering, BPR) kann es hilfreich sein, sich einen Überblick über alle Daten in den Informationssystemen eines Unternehmens zu verschaffen. ERDs werden verwendet, um neuere, effizientere Datenarchitekturlösungen zu entwerfen, die die anderen Phasen des BPR-Prozesses erleichtern.
Entity-Relationship-Diagramme, Datenbankschemata und Datenflussdiagramme stellen alle visuell dar, wie Daten in einem System angeordnet sind.
Entity-Relationship-Diagramme veranschaulichen die Entitäten in einer Datenbank und ihre Beziehungen untereinander. ER-Diagramme stellen oft Datenbankschemata dar.
Datenbankschemata legen fest, wie reale Entitäten in einer relationalen Datenbank modelliert werden. Sie enthalten die Regeln und Richtlinien, die die Organisation der Datenbank bestimmen, z. B. Tabellennamen, Felder und Datentypen.
Datenflussdiagramme sind eine Art von Flussdiagramm, das den Datenfluss durch einen Prozess oder ein System darstellt. Sie zeigen, wie sich Daten vom Prozess zu internen und externen Speicherorten bewegen.
Entity-Relationship-Diagramme umfassen Entitäten, die Attribute dieser Entitäten und die Beziehungen zwischen ihnen. Einige ERDs übermitteln auch Kardinalität, die die Beziehung zwischen zwei Entitäten quantifiziert.
Eine ERD-Entität ist eine definierbare Sache, wie eine Person, eine Rolle, ein Ereignis, ein Konzept oder ein Objekt, über die Informationen in einer relationalen Datenbank gespeichert werden können. Viele Arten von Entity-Relationship-Diagrammen stellen Entitäten als Rechtecke dar.
Entitäten sind in einem grammatikalischen Sinne Substantiven ähnlich. Sie sind Kernelemente in der Datenbank, mit Attributen und Beziehungen, die Informationen über diese Entitäten vermitteln, so wie Adjektive und Verben mehr Informationen über die Substantive in einem Satz liefern.
Entitätstypen sind eine Categories von Entitäten. Wenn Entitäten Substantiven ähneln, dann sind Entitätstypen Kategorien von Substantiven: Lebensmittel, Sport und Länder. Die einzelnen Entitäten innerhalb eines Entitätstyps werden als Instanzen bezeichnet. Innerhalb des Entitätstyps Gemüse könnten sich beispielsweise die Instanzen Brokkoli, Karotte und Spargel befinden.
Entitäten werden entweder als stark oder schwach klassifiziert. Starke Entitäten enthalten genügend identifizierende Informationen in ihren Attributen, sodass keine weiteren Erläuterungen erforderlich sind. Schwache Entitäten hingegen existieren nur als Ergebnis oder Konsequenz einer anderen Entität. Die starke Entität, die einer bestimmten schwachen Entität zugeordnet ist, wird als übergeordnete oder Besitzerentität bezeichnet.
Stellen Sie sich eine Datenbank vor, die Kundenbestellungen in einem E-Commerce-Unternehmen modelliert. Jede Bestellung ist eine starke Entität, da sie basierend auf dem Käufer, der Uhrzeit und dem Datum als eindeutige Instanz definiert werden kann. Die Posten innerhalb jeder Bestellung sind jedoch schwache Entitäten. Sie haben nur im Kontext ihrer jeweiligen Bestellungen eine Bedeutung. Diese Abhängigkeit wird als Existenzabhängigkeit oder Teilnahmebeschränkung bezeichnet.
Starke Entitäten werden als ausgefüllte Rechtecke dargestellt, während ERDs schwache Entitäten als doppeltes Rechteck darstellen.
Eine assoziative Entität verbindet die Instanzen zwischen zwei Entitätssätzen und verfügt über eigene Attribute, die weitere Informationen über diese Beziehung bereitstellen. In einem ERD, das von einer Universität verwendet wird, haben die Entitätssätze Studenten und Professoren viele Verbindungen zueinander. Die assoziative Entität, die die beiden verbindet, würde zeigen, welche Studenten Kurse belegen, die von welchen Professoren unterrichtet werden.
Relationale Datenbanken verwenden assoziative Entitäten, um Verbindungstabellen zu informieren, die Felder aus mehreren anderen Datenbanktabellen kombinieren. In ER-Diagrammen werden assoziative Entitäten als Raute innerhalb eines Rechtecks dargestellt.
Attribute sind Qualitäten, Eigenschaften und Merkmale, die eine Entität oder einen Entitätstyp definieren. In einem klassischen ERD-Design werden Attribute als Ovale dargestellt und neben der entsprechenden Entität in einem ERD angezeigt.
Entitätsschlüssel sind die Attribute, die jede Entität in einem Datensatz eindeutig definieren. Jedes Attribut kann als Schlüssel bestimmt werden, vorausgesetzt, es erfüllt diese Rolle. In einem Personen-Entitätssatz kann ein geeignetes Schlüsselattribut z. B. eine Personalausweisnummer sein. Nachnamen würden hingegen in diesem Zusammenhang nicht als Schlüsselattribut funktionieren, da mehr als eine Person denselben Nachnamen haben kann.
Beziehungen sind die Verbindungslinien, die die Entitäten in einem ERD miteinander verbinden. Sie zeigen an, wie Entitäten innerhalb eines ERD miteinander verbunden sind. Wenn Entitäten Substantive sind und Attribute Adjektive, dann sind Beziehungen Verben.
In einem traditionellen ERD werden Beziehungen als Rauten dargestellt. Schwache Beziehungen binden eine schwache Entität an ihren Besitzer und werden als Doppelrauten dargestellt.
Die Entitätsteilnahme an einer Beziehung kann vollständig sein, in diesem Fall ist der gesamte Entitätssatz an der Beziehung beteiligt, oder teilweise. Bei einer partiellen Beteiligung können einige oder alle Entitäten innerhalb der Menge zu einem bestimmten Zeitpunkt an der Beziehung beteiligt sein.
Die Kardinalität ist die Eigenschaft einer Beziehung, die die Anzahl der Instanzen in einer Entität definiert, die sich auf die Instanzen einer anderen Entität beziehen.
ERDs stellen die Kardinalität durch Variationen in den Verbindungslinien zwischen Entitäten dar. Wie die Kardinalität dargestellt wird, hängt von der Art des verwendeten ERD ab.
Die meisten ERDs werden in einem von drei Entity-Relationship-Modellen entworfen: konzeptionell, logisch und physisch. Alle drei stellen Entitäten zusammen mit ihren Attributen und Beziehungen dar, aber ihre Anwendungsfälle und Zielgruppen unterscheiden sich. Konzeptionelle sind am wenigsten detailliert, während physische ERDs die detailliertesten Informationen bieten.
Seit der Einführung von ERDs durch den Informatiker und Datenbanktheoretiker Peter Chen in den 1970er Jahren sind zahlreiche Arten von Diagrammen entstanden, die eine wachsende Bandbreite von Anwendungsfällen abdecken.
Chen ERDs ähneln klassischen Flussdiagrammen, mit verschiedenen Formen, die durch Linien verbunden sind. Die Kardinalität wird durch die Zeichen 1, M und N entlang der Verbindungslinien dargestellt. M und N stehen beide für „viele“ in einer Eins-zu-viele- oder Viele-zu-viele-Beziehung, wobei die Letzteren mit M:N- oder N:M -Notation dargestellt werden, was impliziert, dass die Anzahl der Entitäten in der Beziehung nicht auf beiden Seiten gleich sein muss.
Der Chen-Stil stellt die totale Beteiligung mit einer einzigen Verbindungslinie und die teilweise Beteiligung mit einer doppelten Verbindungslinie dar.
Benannt nach seiner dreizackigen, gegabelten Verbindungslinie, die viele Beziehungen aufweist, ersetzt die Krähenfuß-Notation die Chen-Symbole durch Tabellen. Jede Tabelle repräsentiert eine Entität und enthält alle ihre Attribute. Mit der Krähenfuß-Notation können ERD-Ersteller Informationen über die Kardinalität von Beziehungen zeigen.
Die Datenstrukturdiagramme von Charles Bachman haben Chen bei der Entwicklung des ERD direkt inspiriert. Bachman verwendete Linien mit Pfeilen, um die Kardinalität in Beziehungen anzuzeigen.
Die US Air Force führte in den 1980er Jahren die Integration DEFinition for Information Modeling (IDEF1X)-Sprache ein, um die Entwicklung semantischer Datenmodelle zu unterstützen. Sie brachte Chens Arbeit einen Schritt weiter, indem sie Attribute in einer gemeinsamen Tabelle anzeigte und mehr Optionen für die Kardinalität einführte.
Der Barker-Stil wurde 1981 von Richard Barker entwickelt und ist der Standard für die Verwendung in Oracle. Die Barker-Notation verwendet den Krähenfuß-Stil für Verbindungslinien, verwendet aber auch gestrichelte Linien, um eine partielle oder optionale Teilnahme darzustellen.
Mit IBM Datenbanklösungen können Sie verschiedene Workload-Anforderungen in der Hybrid Cloud erfüllen.
Erfahren Sie mehr über IBM Db2: eine relationale Datenbank, die hohe Leistung, Skalierbarkeit und Zuverlässigkeit für das Speichern und Verwaltung strukturierter Daten bietet. Die Lösung ist als SaaS in der IBM Cloud oder als Self-Hosting-Option verfügbar.
Erschließen Sie den Wert von Unternehmensdaten mit IBM Consulting und bauen Sie ein erkenntnisorientiertes Unternehmen auf, das Ihnen geschäftliche Vorteile verschafft.