Veröffentlicht: 24. Juni 2024
Mitwirkende: Ivan Belcic, Cole Stryker
Ein Entity-Relationship-Diagramm (ER-Diagramm oder ERD) ist eine visuelle Darstellung der Beziehung von Elementen in einer Datenbank zueinander. ERDs sind eine spezielle Art von Flussdiagrammen, die die Beziehungstypen zwischen verschiedenen Entitäten innerhalb eines Systems vermitteln. Sie verwenden einen definierten Satz von Symbolen, darunter Rechtecke, Ovale und Rauten, und verbinden diese mit Verbindungslinien.
Innerhalb des relationalen Modells des Datenbank-Designs legen ERDs fest, wie Einträge in einer Datenbank miteinander verbunden sind. ERDs sind ein allgemeines konzeptionelles Datenmodell, das die Grundlage für fortgeschritteneres Datenbankdesign und -analyse schafft.
Außerdem kann die Modellierung von Entitätsbeziehungen dazu beitragen, Narrative und Erkenntnisse aus einer scheinbar verteilten Sammlung von Datenpunkten zu destillieren.
Verschaffen Sie sich einen Überblick über den Markt für Datenbank- und Big-Data-Sicherheitslösungen sowie die richtigen Produkte für den Schutz sensibler Daten, um die Anforderungen Ihrer Kunden zu erfüllen.
Geschäftsanalysten und Datenbankingenieure verwenden ER-Diagramme als Tools für die Datenmodellierung, um den Umfang der Datenbanken zu beurteilen, die ihre Unternehmen benötigen, und dann zu planen, wie die Daten gespeichert werden.
ERDs informieren den Softwareentwicklungs-Teil eines Datenbankprojekts, indem sie die Anforderungen an die Architektur des Informationssystems und die Datenbankstruktur festlegen. Im Drei-Schema-Ansatz der Softwareentwicklung für Datenbankmanagementsysteme (DBMS) ist das ERD die konzeptionelle Ebene.
Datenintegration ist ein komplexer Datenentwicklungsprozess, der aus vielen beweglichen Teilen besteht. Ein ERD kann Dateningenieuren dabei helfen, das Gesamtsystem zu konzipieren und das Fehlerpotenzial zu reduzieren.
Der Vergleich bestehender Datenbanken mit einem ERD kann Fehltritte beim Datenbankdesign aufdecken, die Probleme verursachen könnten. Komplexe Datenbanken mit zahlreichen Tabellen erfordern umfangreiche SQL-Kenntnisse für den Debugging-Prozess. Ein ERD fasst die Datenbank zusammen, damit die Ingenieure potenzielle Fehler schnell identifizieren können.
Bei Projekten zur Neugestaltung von Geschäftsprozessen (Business Process Reengineering, BPR) kann es hilfreich sein, sich einen Überblick über alle Daten in den Informationssystemen eines Unternehmens zu verschaffen. ERDs werden verwendet, um neuere, effizientere Datenarchitekturlösungen zu entwerfen, die die anderen Phasen des BPR-Prozesses erleichtern.
Entity-Relationship-Diagramme, Datenbankschemata und Datenflussdiagramme stellen alle visuell dar, wie Daten in einem System angeordnet sind.
Entity-Relationship-Diagramme veranschaulichen die Entitäten in einer Datenbank und ihre Beziehungen untereinander. ER-Diagramme stellen oft Datenbankschemata dar.
Datenbankschemata legen fest, wie reale Entitäten in einer relationalen Datenbank modelliert werden. Sie enthalten die Regeln und Richtlinien, die die Organisation der Datenbank bestimmen, z. B. Tabellennamen, Felder und Datentypen.
Datenflussdiagramme sind eine Art von Flussdiagramm, das den Datenfluss durch einen Prozess oder ein System darstellt. Sie zeigen, wie sich Daten vom Prozess zu internen und externen Speicherorten bewegen.
Entity-Relationship-Diagramme umfassen Entitäten, die Attribute dieser Entitäten und die Beziehungen zwischen ihnen. Einige ERDs übermitteln auch Kardinalität, die die Beziehung zwischen zwei Entitäten quantifiziert.
Eine ERD-Entität ist eine definierbare Sache, wie eine Person, eine Rolle, ein Ereignis, ein Konzept oder ein Objekt, über die Informationen in einer relationalen Datenbank gespeichert werden können. Viele Arten von Entity-Relationship-Diagrammen stellen Entitäten als Rechtecke dar.
Entitäten sind in einem grammatikalischen Sinne Substantiven ähnlich. Sie sind Kernelemente in der Datenbank, mit Attributen und Beziehungen, die Informationen über diese Entitäten vermitteln, so wie Adjektive und Verben mehr Informationen über die Substantive in einem Satz liefern.
Entitätstypen sind eine Categories von Entitäten. Wenn Entitäten Substantiven ähneln, dann sind Entitätstypen Kategorien von Substantiven: Lebensmittel, Sport und Länder. Die einzelnen Entitäten innerhalb eines Entitätstyps werden als Instanzen bezeichnet. Innerhalb des Entitätstyps Gemüse könnten sich beispielsweise die Instanzen Brokkoli, Karotte und Spargel befinden.
Entitäten werden entweder als stark oder schwach klassifiziert. Starke Entitäten enthalten genügend identifizierende Informationen in ihren Attributen, sodass keine weiteren Erläuterungen erforderlich sind. Schwache Entitäten hingegen existieren nur als Ergebnis oder Konsequenz einer anderen Entität. Die starke Entität, die einer bestimmten schwachen Entität zugeordnet ist, wird als übergeordnete oder Besitzerentität bezeichnet.
Stellen Sie sich eine Datenbank vor, die Kundenbestellungen in einem E-Commerce-Unternehmen modelliert. Jede Bestellung ist eine starke Entität, da sie basierend auf dem Käufer, der Uhrzeit und dem Datum als eindeutige Instanz definiert werden kann. Die Posten innerhalb jeder Bestellung sind jedoch schwache Entitäten. Sie haben nur im Kontext ihrer jeweiligen Bestellungen eine Bedeutung. Diese Abhängigkeit wird als Existenzabhängigkeit oder Teilnahmebeschränkung bezeichnet.
Starke Entitäten werden als ausgefüllte Rechtecke dargestellt, während ERDs schwache Entitäten als doppeltes Rechteck darstellen.
Eine assoziative Entität verbindet die Instanzen zwischen zwei Entitätssätzen und verfügt über eigene Attribute, die weitere Informationen über diese Beziehung bereitstellen. In einem ERD, das von einer Universität verwendet wird, haben die Entitätssätze Studenten und Professoren viele Verbindungen zueinander. Die assoziative Entität, die die beiden verbindet, würde zeigen, welche Studenten Kurse belegen, die von welchen Professoren unterrichtet werden.
Relationale Datenbanken verwenden assoziative Entitäten, um Verbindungstabellen zu informieren, die Felder aus mehreren anderen Datenbanktabellen kombinieren. In ER-Diagrammen werden assoziative Entitäten als Raute innerhalb eines Rechtecks dargestellt.
Attribute sind Qualitäten, Eigenschaften und Merkmale, die eine Entität oder einen Entitätstyp definieren. In einem klassischen ERD-Design werden Attribute als Ovale dargestellt und neben der entsprechenden Entität in einem ERD angezeigt.
Entitätsschlüssel sind die Attribute, die jede Entität in einem Datensatz eindeutig definieren. Jedes Attribut kann als Schlüssel bestimmt werden, vorausgesetzt, es erfüllt diese Rolle. In einem Personen-Entitätssatz kann ein geeignetes Schlüsselattribut z. B. eine nationale Ausweisnummer sein. Umgekehrt würden Nachnamen in diesem Zusammenhang nicht als Schlüsselattribut funktionieren, da mehr als eine Person denselben Nachnamen haben kann.
Beziehungen sind die Verbindungslinien, die die Entitäten in einem ERD miteinander verbinden. Sie zeigen an, wie Entitäten innerhalb eines ERD miteinander verbunden sind. Wenn Entitäten Substantive sind und Attribute Adjektive, dann sind Beziehungen Verben.
In einem traditionellen ERD werden Beziehungen als Rauten dargestellt. Schwache Beziehungen binden eine schwache Entität an ihren Besitzer und werden als Doppelrauten dargestellt.
Die Entitätsteilnahme an einer Beziehung kann vollständig sein, in diesem Fall ist der gesamte Entitätssatz an der Beziehung beteiligt, oder teilweise. Bei einer partiellen Beteiligung können einige oder alle Entitäten innerhalb der Menge zu einem bestimmten Zeitpunkt an der Beziehung beteiligt sein.
Die Kardinalität ist die Eigenschaft einer Beziehung, die die Anzahl der Instanzen in einer Entität definiert, die sich auf die Instanzen einer anderen Entität beziehen.
ERDs stellen die Kardinalität durch Variationen in den Verbindungslinien zwischen Entitäten dar. Wie die Kardinalität dargestellt wird, hängt von der Art des verwendeten ERD ab.
Die meisten ERDs werden in einem von drei Entity-Relationship-Modellen entworfen: konzeptionell, logisch und physisch. Alle drei stellen Entitäten zusammen mit ihren Attributen und Beziehungen dar, aber ihre Anwendungsfälle und Zielgruppen unterscheiden sich. Konzeptionelle sind am wenigsten detailliert, während physische ERDs die detailliertesten Informationen bieten.
Seit der Einführung von ERDs durch den Informatiker und Datenbanktheoretiker Peter Chen in den 1970er Jahren sind zahlreiche Arten von Diagrammen entstanden, die eine wachsende Bandbreite von Anwendungsfällen abdecken.
Chen ERDs ähneln klassischen Flussdiagrammen, mit verschiedenen Formen, die durch Linien verbunden sind. Die Kardinalität wird durch die Zeichen 1, M und N entlang der Verbindungslinien dargestellt. M und N stehen beide für „viele“ in einer Eins-zu-viele- oder Viele-zu-viele-Beziehung, wobei die Letzteren mit M:N- oder N:M -Notation dargestellt werden, was impliziert, dass die Anzahl der Entitäten in der Beziehung nicht auf beiden Seiten gleich sein muss.
Der Chen-Stil stellt die totale Beteiligung mit einer einzigen Verbindungslinie und die teilweise Beteiligung mit einer doppelten Verbindungslinie dar.
Benannt nach seiner dreizackigen, gegabelten Verbindungslinie, die viele Beziehungen aufweist, ersetzt die Krähenfuß-Notation die Chen-Symbole durch Tabellen. Jede Tabelle repräsentiert eine Entität und enthält alle ihre Attribute. Mit der Krähenfuß-Notation können ERD-Ersteller Informationen über die Kardinalität von Beziehungen zeigen.
Die Datenstrukturdiagramme von Charles Bachman haben Chen bei der Entwicklung des ERD direkt inspiriert. Bachman verwendete Linien mit Pfeilen, um die Kardinalität in Beziehungen anzuzeigen.
Die US Air Force führte in den 1980er Jahren die Integration DEFinition for Information Modeling (IDEF1X)-Sprache ein, um die Entwicklung semantischer Datenmodelle zu unterstützen. Sie brachte Chens Arbeit einen Schritt weiter, indem sie Attribute in einer gemeinsamen Tabelle anzeigte und mehr Optionen für die Kardinalität einführte.
Der Barker-Stil wurde 1981 von Richard Barker entwickelt und ist der Standard für die Verwendung in Oracle. Die Barker-Notation verwendet den Krähenfuß-Stil für Verbindungslinien, verwendet aber auch gestrichelte Linien, um eine partielle oder optionale Teilnahme darzustellen.
IBM® OpenPages ist eine KI-gesteuerte, hoch skalierbare Governance-, Risiko- und Compliance-Lösung (GRC), die mit IBM® Cloud Pak for Data in jeder Cloud bereitgestellt werden kann.
IBM Db2 ist eine cloudnative Datenbank, die auf Transaktionen mit geringer Latenz, Echtzeitanalysen und KI-Anwendungen im großen Maßstab ausgelegt ist.
Schnellere Skalierung von Anwendungen, Analysen und generativer KI mit Datenbanken in der Hybrid Cloud.
Unternehmen stehen bei der Vorbereitung von Daten für KI-Anwendungen vor großen Hürden. Das Vorhandensein von Datensilos und Duplizierung sowie Befürchtungen hinsichtlich der Datenqualität stellen eine facettenreiche Umgebung dar, die Unternehmen handhaben müssen.
Stellen Sie sich eine Zukunft vor, in der KI nahtlos mit bestehenden Lieferkettenlösungen zusammenarbeitet und die Art und Weise, wie Unternehmen ihre Assets verwalten, neu definiert. Wenn Sie derzeit traditionelle KI, fortschrittliche Analysen und intelligente Automatisierung verwenden, erhalten Sie nicht bereits tiefe Einblicke in die Asset Performance?