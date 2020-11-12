Die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP), das Verstehen natürlicher Sprache (Natural Language Understanding, NLU) und die Generierung natürlicher Sprache (Natural Language Generation, NLG) sind zwar alle miteinander verwandt, aber dennoch unterschiedliche Themen. Auf einer hohen Ebene sind NLU und NLG nur Komponenten von NLP. Aufgrund ihrer Überschneidungen werden sie in Gesprächen häufig verwechselt. In diesem Beitrag werden wir jeden Begriff einzeln definieren und ihre Unterschiede zusammenfassen, um Unklarheiten zu beseitigen.
Verarbeitung natürlicher Sprache, die aus der Computerlinguistik hervorgegangen ist, nutzt Methoden verschiedener Disziplinen wie Informatik, künstliche Intelligenz, Linguistik und Datenwissenschaft, um Computern die Möglichkeit zu geben, menschliche Sprache sowohl in schriftlicher als auch in mündlicher Form zu verstehen. Während sich die Computerlinguistik eher auf Aspekte der Sprache konzentriert, liegt der Schwerpunkt bei der Verarbeitung natürlicher Sprache auf der Verwendung von maschinellem Lernen und Deep-Learning-Techniken zur Erfüllung von Aufgaben wie Sprachübersetzung oder Beantwortung von Fragen. Bei der Verarbeitung natürlicher Sprache werden unstrukturierte Daten in ein strukturiertes Datenformat umgewandelt. Dies geschieht durch die Identifizierung von benannten Entitäten (ein Prozess, der als Named Entity Recognition bezeichnet wird) und die Identifizierung von Wortmustern mithilfe von Methoden wie Tokenisierung, Stemming und Lemmatisierung, die die Stammformen von Wörtern untersuchen. Das Suffix -ed an einem Wort wie angerufen zeigt beispielsweise die Vergangenheitsform an, hat aber den gleichen Basis-Infinitiv (anrufen) wie das Verb anrufen in der Gegenwartsform.
Es gibt zwar eine Reihe von NLP-Algorithmen, aber für verschiedene Arten von Sprachaufgaben werden meist unterschiedliche Ansätze verwendet. Versteckte Markov-Ketten werden zum Beispiel häufig für Part-of-Speech-Tagging verwendet. Rekurrente neuronale Netze helfen dabei, die passende Textsequenz zu erzeugen. N-Gramme, ein einfaches Sprachmodell (LM), ordnen Sätzen oder Phrasen Wahrscheinlichkeiten zu, um die Genauigkeit einer Antwort vorherzusagen. Diese Techniken wirken zusammen, um beliebte Technologien wie Chatbots oder Spracherkennungsprodukte wie Alexa von Amazon oder Siri von Apple zu unterstützen. Die Anwendung ist jedoch breiter angelegt und betrifft auch andere Branchen wie das Bildungs- und Gesundheitswesen.
Natural Language Understanding ist ein Teilbereich der natürlichen Sprachverarbeitung, der die syntaktische und semantische Analyse von Text und Sprache verwendet, um die Bedeutung eines Satzes zu bestimmen. Die Syntax bezieht sich auf die grammatikalische Struktur eines Satzes, während die Semantik auf die beabsichtigte Bedeutung anspielt. NLU erstellt auch eine relevante Ontologie: eine Datenstruktur, die die Beziehungen zwischen Wörtern und Phrasen festlegt. Während Menschen dies im Gespräch natürlich tun, ist die Kombination dieser Analysen erforderlich, damit eine Maschine die beabsichtigte Bedeutung verschiedener Texte verstehen kann.
Unsere Fähigkeit, zwischen Homonymen und Homophonen zu unterscheiden, veranschaulicht gut die Nuancen der Sprache. Nehmen wir zum Beispiel die folgenden zwei Sätze:
Im ersten Satz ist das Wort aktuell ein Substantiv. Das vorangestellte Verb „Schwimmen“ liefert dem Leser einen zusätzlichen Kontext, aus dem wir schließen können, dass es sich um den Fluss des Wassers im Ozean handelt. Im zweiten Satz wird das Wort „aktuell“ verwendet, aber als Adjektiv. Das Substantiv „Version“ bezeichnet mehrere Iterationen eines Berichts, sodass wir feststellen können, dass wir uns auf den aktuellsten Stand einer Datei beziehen.
Diese Ansätze werden auch häufig im Data Mining verwendet, um die Einstellung der Verbraucher zu verstehen. Insbesondere die Sentiment-Analyse ermöglicht es Marken, ihr Kundenfeedback genauer zu überwachen, positive und negative Kommentare in sozialen Medien zu bündeln und Net Promoter Scores zu verfolgen. Durch die Überprüfung von Kommentaren mit negativer Stimmung sind Unternehmen in der Lage, potenzielle Problembereiche bei ihren Produkten oder Dienstleistungen schneller zu erkennen und zu beheben.
Natural Language Generation ist ein weiterer Teilbereich der Verarbeitung natürlicher Sprache. Während sich das Natural Language Understanding auf das Leseverständnis von Computern konzentriert, ermöglicht die Erzeugung natürlicher Sprache Computern das Schreiben. NLG ist der Prozess, bei dem eine Textantwort in menschlicher Sprache auf der Grundlage einer Dateneingabe erstellt wird. Dieser Text kann auch über Text-to-Speech-Services in ein Sprachformat umgewandelt werden.
NLG umfasst auch Funktionen zur Textzusammenfassung, die aus eingegebenen Dokumenten Zusammenfassungen erstellen und dabei die Integrität der Informationen wahren. Die extraktive Zusammenfassung ist die KI-Innovation, die die in That's Debatable verwendete Key Point Analysis antreibt.
Ursprünglich verwendeten NLG-Systeme Vorlagen zur Generierung von Text. Auf der Grundlage von Daten oder Abfragen würde ein NLG-System die Lücke ausfüllen, wie bei einem Spiel von Mad Libs. Doch im Laufe der Zeit haben sich die Systeme zur Generierung natürlicher Sprache durch den Einsatz von versteckten Markov-Ketten, rekurrenten neuronalen Netzen und Transformatoren weiterentwickelt und ermöglichen eine dynamischere Texterstellung in Echtzeit.
Wie bei NLU müssen NLG-Anwendungen Sprachregeln auf der Grundlage von Morphologie, Lexika, Syntax und Semantik berücksichtigen, um zu entscheiden, wie Antworten angemessen formuliert werden sollen. Sie gehen dies in drei Phasen an:
Die Verarbeitung natürlicher Sprache und ihre Teilmengen haben in der heutigen Welt zahlreiche praktische Anwendungen, z. B. bei Gesundheitsdiagnosen oder im Online-Kundenservice.
