SoundEx-Funktionen

SoundEx ist eine Methode zum Auffinden von Zeichenfolgen, deren Klang bekannt ist, nicht jedoch deren genaue Schreibweise. Die Methode wurde im Jahr 1918 entwickelt. Hiermit werden Wörter mit ähnlichen Lauten ermittelt und zwar auf der Grundlage phonetischer Annahmen, wie bestimmte Buchstaben ausgesprochen werden. Suchen Sie beispielsweise Namen in einer Datenbank, bei denen die Schreibweise und die Betonung ähnlicher Namen voneinander abweichen können. Der grundlegende SoundEx-Algorithmus ist in zahlreichen Schriften dokumentiert. Trotz bekannter Einschränkungen (führende Buchstaben und Buchstabenfolgen wie ph und f gelten beispielsweise nicht als Übereinstimmung, obwohl sie gleich klingen) wird diese Methode in den meisten Datenbanken in irgendeiner Form genutzt.

Tabelle 1. Soundex-Funktionen von CLEM
Funktion Ergebnis Beschreibung
soundex(ZEICHENFOLGE) ganze Zahl Ergibt den vierbuchstabigen SoundEx-Code für die angegebene ZEICHENFOLGE.
soundex_difference(ZEICHENFOLGE1, ZEICHENFOLGE2) ganze Zahl Ergibt eine ganze Zahl zwischen 0 und 4, aus der die Anzahl der Zeichen hervorgeht, die im SoundEx-Code für die beiden Zeichenfolgen übereinstimmen. Der Wert 0 bedeutet dabei, dass gar keine Ähnlichkeit zwischen den Zeichenfolgen vorliegt, der Wert 4 weist auf sehr ähnliche oder sogar identische Zeichenfolgen hin.