Was ist Natural Language Understanding (NLU)?

Autoren

Ivan Belcic

Staff writer

Cole Stryker

Staff Editor, AI Models

IBM Think

Was ist Natural Language Understanding (NLU)?

Das Verstehen natürlicher Sprache (Natural Language Understanding, NLU) ist ein Teilbereich der künstlichen Intelligenz (KI), der semantische und syntaktische Analysen nutzt, um Computern das Verstehen menschlicher Spracheingaben zu ermöglichen. NLU zielt darauf ab, Absicht, Bedeutung und Kontext ganzheitlich zu erfassen, anstatt sich auf die Bedeutung einzelner Wörter zu konzentrieren. 

NLU ermöglicht es Unternehmen, Erkenntnisse aus unstrukturierten Daten zu gewinnen, wie z. B. gesprochener Sprache oder schriftlichen Eingaben in natürlicher Sprache. Mithilfe von NLU können Computer auch mit ungeschulten Benutzern kommunizieren, ohne dass Programmiersprachen verwendet werden müssen.  

Da die menschliche Sprache so nuanciert, komplex und voller Mehrdeutigkeiten ist, stellt NLU eine anspruchsvolle Herausforderung im Bereich des maschinellen Lernens für Informatiker und Ingenieure dar, die mit großen Sprachmodellen (LLMs) arbeiten. NLU-Systeme ermöglichen es Computern, die Feinheiten der geschriebenen und gesprochenen Sprache zu erfassen – subtile Nuancen, komplexe Satzstrukturen, potenziell verwirrende Wortverwendungen, Slang und Dialekte und vieles mehr.  

Aufgrund des Aufstiegs der generativen KI und ihrer Verwendung in Chatbots für Verbraucher, Frage-Antwort-Systemen, maschineller Übersetzung und anderen Anwendungen erhält NLU beträchtliche kommerzielle Investitionen. Ohne NLU gäbe es interaktive Chatbots wie ChatGPT vielleicht nicht – NLU ist der Grund, warum generative KI-Chatbots ein Gespräch mit Benutzern führen können, das sich realistisch und natürlich anfühlt.

Natural Language Understanding vs. Verarbeitung natürlicher Sprache (NLP) 

NLU ist eine Art von Verarbeitung natürlicher Sprache (NLP), das breitere Feld, das es Computern ermöglicht, menschliche Sprache zu verstehen und in ihr zu kommunizieren. Zusätzlich zu dem Fokus von NLU auf dem Verständnis von Bedeutungen umfassen die NLP-Aufgaben die Abbildung linguistischer Elemente wie Syntax, Wortdefinitionen und Wortarten. 

Vor der Entwicklung von NLP kommunizierten Benutzer mit Computern über Programmiersprachen wie Python und C++. Während beim Programmieren weiterhin Programmiersprachen verwendet werden, ermöglichen No-Code-Softwareanwendungen den Benutzern, Computer direkt mit natürlicher Sprache zu steuern. 

NLP entstand aus dem Bereich der Computerwissenschaft, der Computerlinguistik, die Computer zur Analyse von Sprache einsetzt. Die Einführung von Algorithmen für maschinelles Lernen und Deep-Learning-Modellen ermöglichte es Computern, sprachbezogene Aufgaben wie Spracherkennung und Inhaltserstellung zu erfüllen. 

NLU vs. Generierung natürlicher Sprache (NLG) 

Natural Language Generation (NLG) ist die Art und Weise, wie Computer automatisch Inhalte in menschlicher Sprache generieren, z. B. wenn ein Chatbot eine Textzusammenfassung liefert oder ein Gespräch mit einem Benutzer führt. NLG wird in der Regel mit NLU gekoppelt. Ein Deep-Learning-Modell empfängt eine natürliche Spracheingabe, konvertiert sie in nutzbare Daten mit NLP, einschließlich NLU, und generiert dann eine Antwort mit NLG, die der Benutzer verstehen kann. 

NLP, NLG und NLU sind alle miteinander verwandt, wobei NLP die beiden letzteren als übergeordnete Disziplin umfasst. NLG ermöglicht es Chatbots wie ChatGPT, modernen Kundensupport-Bots und Sprachassistenten wie Amazons Alexa, bei der Interaktion mit Benutzern menschenähnlich zu wirken.

Die neuesten KI-Trends, präsentiert von Experten

Erhalten Sie kuratierte Einblicke in die wichtigsten – und faszinierendsten – KI-Neuheiten. Abonnieren Sie unseren wöchentlichen Think-Newsletter. Weitere Informationen in der IBM Datenschutzerklärung.

Vielen Dank! Sie haben ein Abonnement abgeschlossen.

Ihr Abonnement wird auf Englisch geliefert. In jedem Newsletter finden Sie einen Abmeldelink. Hier können Sie Ihre Abonnements verwalten oder sich abmelden. Weitere Informationen finden Sie in unserer IBM Datenschutzerklärung.

Wie funktioniert Natural Language Understanding?

Das Verstehen natürlicher Sprache funktioniert mithilfe von Algorithmen des maschinellen Lernens, die unstrukturierte Sprache oder geschriebene Sprache in ein strukturiertes Datenmodell umwandeln, das deren Inhalt und Bedeutung wiedergibt. NLU-Systeme wenden syntaktische Analysen an, um die Wörter in einem Satz zu verstehen, und semantische Analysen, um die Bedeutung des Gesagten zu verarbeiten. 

Überwachte Lerntechniken für NLU-Algorithmen beinhalten das Füttern des Algorithmus mit gekennzeichneten Trainingsdaten. Diese Methode leitet den Algorithmus explizit dazu an, sprachliche Nuancen zu verstehen – beispielsweise wenn das englische Homonym „mean“ in einem statistischen Kontext verwendet wird (Mittelwert), im Gegensatz zu einer Persönlichkeitsbewertung (niederträchtig). 

Unüberwachte Lerntechniken zeigen Algorithmen zu riesigen unbeschrifteten Datensätzen mit dem Ziel, dass der Algorithmus die zugrundeliegenden Beziehungen und Muster entdeckt. Moderne NLU-Modelle werden in der Regel mit einer Kombination aus überwachten und unüberwachten Methoden trainiert. 

Zu den wichtigsten Mechanismen, die NLU ermöglichen, gehören: 

  • Tokenisierung und Einbetten

  • Named Entity Recognition (NER) 

  • Absichtserkennung

Tokenisierung und Einbettung

Tokenisierung in NLU ist die Verwendung von Algorithmen für maschinelles Lernen, um unstrukturierten Text in kleinere Teile zu segmentieren, die dann weiter analysiert werden können. Jedes resultierende Segment wird als Token bezeichnet. Einbettungsalgorithmen wandeln jedes Token in eine numerische Darstellung um, die dann in einen dreidimensionalen Vektorraum eingezeichnet wird, um die Beziehungen zwischen den Tokens abzubilden. 

Moderne NLU verwendet in der Regel transformatorbasierte Modelle wie GPT, da diese sich hervorragend für die Erfassung von Abhängigkeiten zwischen Tokens eignen. Abhängigkeiten sind weitreichende Beziehungen zwischen entfernten Token in einer Sequenz. Durch die korrekte Erfassung von Abhängigkeiten können Computer das Kontextverständnis über lange Eingabesequenzen hinweg aufrechterhalten.

Named Entity Recognition (NER)

Named Entity Recognition (NER) ist eine Technik zur Informationsgewinnung, die benannte Entitäten oder Objekte der realen Welt in Textdaten identifiziert und klassifiziert. Benannte Entitäten können physisch sein, wie beispielsweise Personen, Orte und Gegenstände, oder abstrakt, wie beispielsweise ein Datum oder das Alter und die Telefonnummer einer Person.

Absichtserkennung

Die Absichtserkennung teilt einem NLU-Algorithmus mit, was ein Benutzer tun möchte. Suchmaschinen nutzen die Absichtserkennung, um Ergebnisse zu liefern, die nicht nur sachlich relevant für die entsprechende Suchanfrage sind, sondern dem Nutzer auch die gewünschten Informationen liefern. 

Eine Suche nach „Chicken Tikka Masala“ liefert beispielsweise wahrscheinlich eine Liste mit Rezepten. Was aber, wenn der Nutzer stattdessen „Chicken Tikka Masala in meiner Nähe“ eingibt? Die Absichtserkennung teilt der Suchmaschine mit, dass der Nutzer Chicken Tikka Masala nicht selbst kochen, sondern stattdessen in einem Restaurant in seiner Nähe genießen möchte.

Mixture of Experts | 12. Dezember, Folge 85

KI entschlüsseln: Wöchentlicher Nachrichtenüberblick

Schließen Sie sich unserer erstklassigen Expertenrunde aus Ingenieuren, Forschern, Produktführern und anderen an, die sich durch das KI-Rauschen kämpfen, um Ihnen die neuesten KI-Nachrichten und Erkenntnisse zu liefern.

Anwendungsfälle zum Natural Language Understanding

NLU-Anwendungen decken ein breites Spektrum von Anwendungsfällen ab, in denen es erforderlich ist, dass Computer entweder direkt mit Menschen kommunizieren oder Daten in menschlicher Sprache verarbeiten. Zu den Anwendungsfällen für Natural Language Understanding gehören: 

  • Stimmungsanalyse

  • Absicht des Benutzers 

  • Maschinelle Übersetzung 

  • Customer Support

  • Spracherkennung 

  • Klassifizierung von Text

  • Virtuelle Agenten

Stimmungsanalyse

Stimmungsanalyse ist die Anwendung von Modellen des maschinellen Lernens zur Identifizierung von Stimmungen und Emotionen in einem Inhalt. Beispielsweise können Forscher mithilfe von Stimmungsanalysen in Social-Media-Beiträgen und Nutzerbewertungen herausfinden, wie Nutzer zu einer Marke stehen. Die gewonnenen Informationen können für die zukünftige Produktentwicklung, Preisanpassungen und andere Änderungen genutzt werden. 

Absicht des Benutzers

Suchmaschinen verwenden NLU, um relevantere Antworten bereitzustellen. Das gleiche Prinzip gilt für Websites mit Suchfunktionen – beispielsweise kann eine E-Commerce-Website potenziell ihren Umsatz steigern, indem sie als Antwort auf Suchanfragen der Nutzer die relevantesten Artikel anzeigt. Die Optimierung der Suchergebnisse dürfte dazu führen, dass mehr Nutzer die Suchmaschine weiterhin nutzen oder einen Kauf tätigen.

Maschinelle Übersetzung

Maschinelle Übersetzung ist die Verwendung von Computern zur Durchführung automatischer Sprachübersetzungen. Stellen Sie sich beispielsweise eine mobile Anwendung vor, die in Echtzeit zwischen gesprochenem Englisch und Spanisch übersetzt. Ein spanischsprachiger Nutzer könnte eine solche App verwenden, um sich mit Englischsprechenden zu unterhalten und gleichzeitig alles zu verstehen, was in seiner Umgebung auf Englisch gesagt wird. 

Kundensupport

Kundensupport-Chatbots sind mit der Verbesserung der generativen KI immer ausgefeilter geworden. NLU ermöglicht es Chatbots, menschenähnliche Gespräche mit Benutzern zu führen, und Unternehmen setzen sie zunehmend ein, um Kundendienstanfragen zu bearbeiten und häufig gestellte Fragen zu beantworten. In der Zwischenzeit runden menschliche Mitarbeiter die Schnittstelle zur Customer Experience ab, indem sie sich um Probleme kümmern, die für KI zu komplex sind.

Der Einsatz von Chatbots im Kundensupport ist ein Beispiel dafür, wie Fortschritte in der KI, einschließlich NLU, Workflows rationalisiert und zu einer stärkeren Automatisierung von Workflows geführt haben.

Spracherkennung

NLU-Systeme helfen Benutzern bei der verbalen Kommunikation mit Software, beispielsweise mit automatisierten Weiterleitungssystemen, wie man sie beim Anruf bei großen Unternehmen vorfindet. Anstatt wiederholt die Taste 0 zu drücken, bis das System den Anruf an einen Mitarbeiter weiterleitet, können Anrufer stattdessen sagen: „Ich möchte mit einem Menschen sprechen.“ Mit NLU kann die Software die gesprochene Anfrage des Benutzers in Echtzeit in strukturierte Daten umwandeln und den Anruf weiterleiten. 

Virtuelle Agenten

Unternehmen haben damit begonnen,virtuelle Agenten als Teil der größeren Customer Experience bereitzustellen. Diese Modelle können direkt mit Benutzern verbunden werden – unter Verwendung von NLU und NLG, um die Interaktion zu erleichtern – und im Namen von Benutzern und Unternehmen handeln. Virtuelle Assistenten wie Alexa und Siri nutzen ebenfalls NLU, um Benutzeranfragen zu erfüllen.

Weitere Lösungen
IBM® watsonx™ Orchestrate®

Mit IBM® watsonx Orchestrate können Sie ganz einfach skalierbare KI-Assistenten und Agenten entwickeln, sich wiederholende Aufgaben automatisieren und komplexe Prozesse vereinfachen.

Entdecken Sie watsonx Orchestrate
Tools und APIs zur Verarbeitung natürlicher Sprache

Steigern Sie den Geschäftswert der künstlichen Intelligenz mit einem leistungsstarken und flexiblen Portfolio aus Bibliotheken, Diensten und Anwendungen.

NLP-Lösungen erkunden
KI-Beratung und -Services

Erfinden Sie kritische Workflows und Abläufe neu, indem Sie KI einsetzen, um Erfahrungen, Entscheidungsfindung in Echtzeit und den geschäftlichen Nutzen zu maximieren.

KI-Services entdecken
Machen Sie den nächsten Schritt

Mit IBM® watsonx Orchestrate können Sie ganz einfach skalierbare KI-Assistenten und Agenten entwickeln, sich wiederholende Aufgaben automatisieren und komplexe Prozesse vereinfachen.

Entdecken Sie watsonx Orchestrate NLP-Lösungen erkunden