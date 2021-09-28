Während Spracherkennung häufig mit Stimmerkennung verwechselt wird, konzentriert sich die Spracherkennung auf die Übersetzung von Sprache aus einem verbalen Format in ein Textformat, während die Spracherkennung lediglich versucht, die Stimme eines einzelnen Benutzers zu identifizieren.

Seit der Markteinführung von „Shoebox“ im Jahr 1962 spielt IBM eine herausragende Rolle in der Spracherkennung. Diese Maschine konnte 16 verschiedene Wörter erkennen und stellte eine Weiterentwicklung der ersten Arbeiten von Bell Labs aus den 1950er Jahren dar. IBM blieb jedoch nicht stehen, sondern setzte seine Innovationen im Laufe der Jahre fort und brachte 1996 die Anwendung „VoiceType Simply Speaking“ auf den Markt. Diese Spracherkennungssoftware verfügte über einen Wortschatz von 42.000 Wörtern, unterstützte Englisch und Spanisch und enthielt ein Rechtschreibwörterbuch mit 100.000 Wörtern.

Während die Sprachtechnologie in ihren Anfängen nur über einen begrenzten Wortschatz verfügte, wird sie heute in einer Vielzahl von Branchen eingesetzt, wie z. B. in der Automobilindustrie, im Technologiesektor und im Gesundheitswesen. Ihre Anwendung hat sich in den letzten Jahren aufgrund der Fortschritte im Bereich maschinelles Lernen und Big Data nur noch beschleunigt. Recherchen (Link befindet sich außerhalb von ibm.com) zeigen, dass dieser Markt bis 2025 voraussichtlich einen Wert von 24,9 Milliarden US-Dollar erreichen wird.