Die erste Normalform, das grundlegendste Kriterium für die Normalisierung von Datenbanken, verlangt, dass ein Datenbanktabellenschema einen Primärschlüssel enthält und Wiederholungen zwischen den Spalten ausschließt. Konkret bedeutet dies, dass eine Tabelle in erster Normalform keine Felder mit Arrays von Werten enthalten sollte (z. B. eine einzelne Zelle mit drei verschiedenen Namen) und auch keine sich wiederholenden Gruppen, d. h. verschiedene Spalten, die den gleichen Datentyp speichern.

Um die erste Normalform besser zu verstehen, wollen wir den folgenden Spaltensatz als Beispiel verwenden:1

rec_num lname Fname bdate anniv email child1 child2 child3

Die Spalten bestehen aus einer Tabelle einer Gruppe von Eltern, einschließlich ihrer Namen, Geburtstage, Hochzeitstage, E-Mails und Namen der Kinder.

Diese Tabelle verstößt gegen die erste Normalform, da sie drei separate Spalten enthält, in denen dieselbe Art von Informationen gespeichert ist: die Namen der Kinder. Insbesondere in diesem Fall könnte die Tabellenstruktur Einfügungsfehlern Tür und Tor öffnen. In der realen Welt haben zum Beispiel viele Eltern weniger als drei Kinder.

In unserer Beispieltabelle ist es nicht möglich, solche Elterndatensätze zur Tabelle hinzuzufügen. Darüber hinaus wäre die Abfrage dieser Tabelle nach dem Namen eines Kindes ineffizient, da in jeder Zeile Daten in drei verschiedenen Spalten gesucht werden müssten.

Um die erste Normalform für die Daten in der Tabelle zu erreichen, muss die Originaltabelle in zwei Tabellen aufgeteilt werden. Eine Tabelle würde die meisten Attribute der Originaltabelle enthalten, während die andere sich auf die Kinder konzentrieren würde.

TABELLE 1

rec_num lname fname bdate anniv E-Mail

TABELLE 2

rec_num child_name

In diesem Beispiel bleiben die neuen Tabellen über die Spalte „rec_num“ verknüpft, die der Primärschlüssel in Tabelle 1 ist und von der Spalte „rec_num“ in Tabelle 2 referenziert wird, die als Fremdschlüssel dient.

Auch wenn die Erfüllung der ersten Normalform redundante Daten nicht reduziert („rec_num“-Werte erscheinen in mehreren Zeilen der Tabelle 2, wenn Eltern mehr als ein Kind haben), kann die Eliminierung von sich wiederholenden Gruppen Abfragen einfacher machen.