Was ist ein Datenbankschema?
Erfahren Sie, wie ein Datenbankschema Daten innerhalb einer relationalen Datenbank definiert und organisiert
Labortechniker bei der Eingabe von Informationen auf einem Bildschirm
Was ist ein Datenbankschema?

Ein Datenbankschema definiert, wie Daten innerhalb einer relationalen Datenbank organisiert sind. Dies bezieht logische Einschränkungen wie Tabellennamen, Felder, Datentypen und die Beziehungen zwischen diesen Entitäten ein. Schemata verwenden im Allgemeinen visuelle Darstellungen, um die Architektur der Datenbank zu vermitteln, und bilden so die Grundlage für die Datenverwaltungsdisziplin eines Unternehmens. Dieser Vorgang der Datenbankschemagestaltung wird auch als  Datenmodellierung bezeichnet.

Diese Datenmodelle bedienen eine Vielzahl unterschiedlicher Rollen, wie etwa die des Datenbankbenutzers, Datenbankadministrators und Programmierers. So können sie zum Beispiel Datenbankadministratoren bei der Verwaltung von Normalisierungsprozessen unterstützen, um die Datenduplizierung zu vermeiden. Alternativ dazu können sie Analysten ermöglichen, in diesen Datenstrukturen zu navigieren, um Berichte zu erstellen oder andere wertvolle Geschäftsanalysen durchzuführen. Diese Diagramme dienen als aussagekräftige Dokumentation innerhalb des Datenbankmanagementsystems (DBMS) und stellen die Abgleichung zwischen den unterschiedlichen Interessensvertretern sicher.

Datenbankschema versus Datenbankinstanz

Ein Datenbankschema gilt als „Blueprint“ (Entwurf) einer Datenbank, der beschreibt, in welcher Beziehung die Daten gegebenenfalls zu anderen Tabellen oder anderen Datenmodellen stehen. Das Schema an sich enthält jedoch keine Daten.

Eine Stichprobe von Daten aus einer Datenbank zu einem bestimmten Zeitpunkt wird als Datenbankinstanz bezeichnet. Sie enthält alle Eigenschaften, die das Schema als Datenwerte beschreibt. Da es sich bei Datenbankinstanzen lediglich um eine Momentaufnahme zu einem bestimmten Zeitpunkt handelt, ist es – im Gegensatz zu Datenbankschemas – wahrscheinlich, dass sie sich im Laufe der Zeit ändern.

Arten von Datenbankschemas

Auch wenn der Begriff „Schema“ sehr weitläufig verwendet wird, bezieht er sich im Allgemeinen auf drei unterschiedliche Schematypen – ein konzeptionelles Datenbankschema, ein logisches Datenbankschema und ein physisches Datenbankschema.

  • Konzeptuelle Schemas vermitteln einen allgemeinen Überblick darüber, welchen Inhalt das System künftig enthält, wie dieser Inhalt organisiert sein wird und welche Geschäftsregeln beteiligt sind. Konzeptuelle Modelle werden in der Regel als Teil des Prozesses zur Erfassung der ersten Projektanforderungen erstellt.
  • Logische Datenbankschemas weisen im Vergleich zu konzeptuellen Schemas einen geringeren Abstraktionsgrad auf. Sie definieren Schemaobjekte eindeutig mit Informationen wie Tabellennamen, Feldnamen, Entitätsbeziehungen und Integritätseinschränkungen, also mit allen Regeln, die für die Datenbank gelten. Sie umfassen im Allgemeinen jedoch keine technischen Voraussetzungen oder Anforderungen.
  • Physische Datenbankschemas liefern zusätzlich zu den kontextuellen Informationen wie Tabellennamen, Feldnamen, Entitätsbeziehungen usw. die technischen Informationen, die dem Schematyp logischer Datenbanken fehlen. Sie enthalten also auch die Syntax, die künftig zur Erstellung dieser Datenstrukturen im Plattenspeicher verwendet wird.

Sternschema versus Snowflake-Schema

Sowohl in logischen Schemas als auch in physischen Schemas besitzen Datenbanktabellen einen Primärschlüssel oder einen Fremdschlüssel, der jeweils als eindeutige Kennung für einzelne Einträge in einer Tabelle dient. Diese Schlüssel werden in SQL-Anweisungen verwendet, um Tabellen miteinander zu verknüpfen und so eine vereinheitlichte Darstellung von Informationen zu erzeugen. Schemadiagramme sind besonders dann hilfreich, wenn es darum geht, diese Beziehungen zwischen Tabellen darzustellen, und sie ermöglichen es Analysten, die Schlüssel zu verstehen, mit denen sie verknüpft werden sollten. Im Zusammenhang mit relationalen Datenbankmanagementsystemen (RDBMS) wird häufig auf zwei weitere Arten von Schemas verwiesen: Sternschemas und Snowflake-Schemas.

Während konzeptionelle, logische und physische Schemas unterschiedliche Ebenen von Informationen über Datenbanken in ihren Diagrammen enthalten, stellen Sternschemas und Snowflake-Schemas diese Beziehungen zwischen Entitäten auf andere Weise dar. Genauer gesagt handelt es sich bei einem Sternschema um eine Art von relationalem Datenbankschema, das sich aus einer einzelnen zentralen Fakttabelle zusammensetzt, die von Dimensionstabellen umgeben ist. Dieses Schema gilt im Vergleich zum Snowflake-Schema tendenziell als das einfachere.

Ein Snowflake-Schema besteht aus einer Fakttabelle, die mit vielen Dimensionstabellen verbunden ist, die ihrerseits über eine Viele-zu-eins-Beziehung mit weiteren Dimensionstabellen verbunden sein können. Dieses Schema bietet den Vorteil einer geringen Datenredundanz, ist aber weniger effektiv, wenn es um die Abfrageleistung geht.

Wie der Name bereits andeutet, sieht ein Sternschema eher wie ein Stern aus, während ein Snowflake-Schema eher einer Schneeflocke ähnelt.

Vorteile von Datenbankschemas

Im Zuge des fortschreitenden Wachstums von Big Data sind Datenbankobjekte und -schemas von maßgeblicher Bedeutung, um die Effizienz im täglichen Unternehmensbetrieb sicherzustellen. Wenn relationale Modelle mangelhaft organisiert und schlecht dokumentiert sind, sind sie schwieriger zu pflegen, was sowohl die Benutzer als auch das Unternehmen selbst vor Probleme stellt.

Zu den wichtigsten Vorteilen von Datenbankschemas gehören die folgenden:

  • Zugriff und Sicherheit:  Das Design von Datenbankschemas hilft bei der Anordnung von Daten in getrennten Einheiten, was die gemeinsame Nutzung eines einzelnen Schemas in einer anderen Datenbank einfacher macht. Administratoren können außerdem den Zugriff über Datenbankberechtigungen steuern und so eine weitere Sicherheitsebene für proprietäre Daten schaffen. Beispielsweise kann ein einzelnes Schema personenbezogene Daten enthalten, die Sie aus Datenschutz- und Sicherheitsgründen verschlüsseln sollten.
  • Organisation und Kommunikation:  Die Dokumentation von Datenbankschemas ermöglicht eine bessere Organisation und bessere Kommunikation zwischen internen Interessensvertretern. Da sie eine allgemeine und gemeinsam verwendete Wissensressource darstellt, können Benutzer die logischen Einschränkungen und Methoden zur Aggregation tabellenübergreifend verstehen.  
  • Integrität:  Diese Form der Organisierung und Kommunikation trägt auch dazu bei, die Gültigkeit der Daten sicherzustellen. Sie kann so zum Beispiel Administratoren bei der Verwaltung von Normalisierungsprozessen unterstützen, um eine Datenduplizierung zu vermeiden. Sie kann auch bei der Überwachung der Einhaltung der Beschränkungen im Datenbankdesign des Schemas helfen und die Einhaltung der ACID-Eigenschaften (Atomicity, Consistency, Isolation, Durability, d. h. Atomarität, Konsistenz, Isolation, Dauerhaftigkeit) ermöglichen.
IBM Lösungen
IBM Db2 on Cloud

Lernen Sie eine vollständig verwaltete Cloud-Datenbank mit KI-Funktionalität kennen, die Ihr Unternehmen rund um die Uhr am Laufen hält

IBM Db2 on Cloud testen
IBM Cloud Databases for PostgreSQL

Informieren Sie sich über das für Unternehmen einsatzbereite verwaltete PostgreSQL mit nativer Integration in die IBM Cloud

Verwaltetes PostgreSQL jetzt erkunden
Ressourcen IBM als „Leader" für Cloud-Datenbankmanagementsysteme benannt

Zum zweiten Mal in Folge wurde IBM von Gartner basierend auf der Fähigkeit zur Umsetzung und der Vollständigkeit der Vision im Gartner Magic Quadrant für Cloud-Datenbankmanagementsysteme 2021 als „Leader" benannt.

IBM Cloud Professional Architect

Erwerben Sie Datenbank-Know-how durch Kurse im Rahmen des IBM Cloud Professional Architect-Curriculums.

DBaaS 101

Erfahren Sie mehr zu DBaaS, einer der am schnellsten wachsenden Kategorien von SaaS-Angeboten. Holen Sie sich Tipps und Ratschläge zur Auswahl des am besten geeigneten DBaaS für Ihre Cloud-Anwendungen.

Machen Sie den nächsten Schritt

Gartner hat IBM im Gartner Magic Quadrant für Cloud-Datenbankmanagementsysteme als „Leader“ benannt und damit unsere umfangreichen und ausgereiften Produkte, unsere Fähigkeit zur Umsetzung und die Vollständigkeit unserer Vision gewürdigt. IBM Cloud bietet zweckgerecht entwickelte Datenbanken, die hohe Verfügbarkeit, verbesserte Sicherheit und skalierbare Leistung bieten.

IBM Cloud-Datenbanken noch heute erkunden