Ein Datenbankschema legt fest, wie Daten in einer relationalen Datenbank organisiert werden. Dies umfasst logische Einschränkungen wie Tabellennamen, Felder, Datentypen und Beziehungen zwischen diesen Entitäten.
Schemata verwenden in der Regel visuelle Darstellungen, um die Architektur der Datenbank zu beschreiben, und bilden die Grundlage für die Datenverwaltungsstrategie eines Unternehmens. Dieser Prozess des Datenbankschemadesigns wird auch als Datenmodellierung bezeichnet.
Diese Datenmodelle unterstützen eine Vielzahl von Rollen, so z. B. Datenbankbenutzer, Datenbankadministratoren und Programmierer. Beispielsweise können Datenbankadministratoren damit Normalisierungsprozesse verwalten, um Datenduplikate zu vermeiden. Alternativ können Analysten in diesen Datenstrukturen navigieren, um Berichte oder andere wertvolle Geschäftsanalysen durchzuführen. Diese Diagramme dienen als wertvolle Dokumentation innerhalb des Datenbankmanagementsystems (DBMS) und stellen die Abstimmung zwischen verschiedenen Stakeholdern sicher.
Ein Datenbankschema gilt als „Blueprint“ (Bauplan) einer Datenbank und beschreibt, wie die Daten mit anderen Tabellen oder anderen Datenmodellen in Beziehung stehen können. Das Schema enthält allerdings keine Daten.
Eine Stichprobe von Daten aus einer Datenbank zu einem bestimmten Zeitpunkt wird als Datenbankinstanz bezeichnet. Sie enthält alle Eigenschaften, die das Schema als Datenwerte beschreibt. Da Datenbankinstanzen nur eine Momentaufnahme zu einem bestimmten Zeitpunkt darstellen, können sie sich im Gegensatz zu Datenbankschemata im Laufe der Zeit ändern.
Lesen Sie das kostenlose O'Reilly-E-Book, um zu erfahren, wie Sie mit Presto, der Open-Source-SQL-Engine für Datenanalysen, loslegen können.
Registrieren Sie sich für das E-Book zu KI-Datenspeichern
Obwohl der Begriff „Schema“ sehr weit gefasst ist, bezieht er sich im Allgemeinen auf drei verschiedene Arten von Schemata: ein konzeptionelles Datenbankschema, ein logisches Datenbankschema und ein physisches Datenbankschema.
Sowohl in logischen Schemata als auch in physischen Schemata haben Datenbanktabellen einen Primärschlüssel oder einen Fremdschlüssel, die als eindeutige Identifikatoren für einzelne Einträge in einer Tabelle dienen. Diese Schlüssel werden in SQL-Anweisungen verwendet, um Tabellen miteinander zu verbinden und eine einheitliche Ansicht der Informationen zu erstellen. Schemadiagramme sind besonders hilfreich, wenn es darum geht, diese Beziehungen zwischen Tabellen darzustellen. Sie ermöglichen es Analysten, die Schlüssel zu verstehen, mit denen sie verknüpft werden sollen. Es gibt zwei weitere Arten von Schemata, auf die im Zusammenhang mit relationalen Datenbankmanagementsystemen (RDBMS) häufig verwiesen wird: Sie werden als Sternschemata und Schneeflockenschemata bezeichnet.
Konzeptionelle, logische und physische Schemata enthalten zwar unterschiedliche Ebenen von Informationen über Datenbanken in ihren Diagrammen, aber Stern- und Schneeflockenschemata stellen diese Beziehungen zwischen Entitäten unterschiedlich dar. Genauer gesagt ist ein Sternschema eine Art von relationalem Datenbankschema, das aus einer einzigen, zentralen Faktentabelle besteht, die von Dimensionstabellen umgeben ist. Dies wird im Vergleich zum Schneeflockenschema als einfacheres Schema angesehen.
Ein Schneeflockenschema besteht aus einer Faktentabelle, die mit vielen Dimensionstabellen verbunden ist, die wiederum über eine Viele-zu-Eins-Beziehung mit anderen Dimensionstabellen verbunden sein können. Dieses Schema bietet den Vorteil einer geringen Datenredundanz, ist aber in Bezug auf die Abfrageleistung nicht so effektiv.
Wie die Namen schon sagen, sieht ein Sternschema eher wie ein Stern aus, während ein Schneeflockenschema eher einer Schneeflocke ähnelt.
In Zeiten von Big Data und wachsenden Datenmengen sind Datenbankobjekte und -schemata von entscheidender Bedeutung, um die Effizienz der täglichen Unternehmensabläufe zu gewährleisten. Wenn relationale Modelle schlecht organisiert und schlecht dokumentiert sind, ist die Pflege schwieriger, was sowohl für die Benutzer als auch für das Unternehmen problematisch ist.
Zu den wichtigsten Vorteilen von Datenbankschemata gehören:
Informieren Sie sich über eine vollständig verwaltete Cloud Database mit KI-Funktionen, die Ihr Unternehmen rund um die Uhr am Laufen halten.
Erfahren Sie mehr über Managed PostgreSQL, für Unternehmen entwickelt und mit nativer Integration in die IBM Cloud.
Aufgrund seiner Umsetzungsfähigkeit und Vollständigkeit seiner Vision wurde IBM zum zweiten Mal in Folge im Gartner Magic Quadrant 2021 für Cloud-Datenbank-Managementsysteme als führender Anbieter eingestuft.
Erwerben Sie Datenbank-Kenntnisse durch Kurse im IBM Cloud Professional Architect Ausbildungsprogramm.
Erfahren Sie mehr über DBaaS, eine der am schnellsten wachsenden Kategorien von SaaS-Angeboten. Holen Sie sich Tipps und Ratschläge zur Auswahl der am besten geeigneten DBaaS-Lösung für Ihre Cloud-Anwendungen.