Was ist natürliche Sprachgenerierung (NLG)?

Autoren

Ivan Belcic

Staff writer

Cole Stryker

Staff Editor, AI Models

IBM Think

Was ist die Generierung natürlicher Sprache (NLG)?

Die Generierung natürlicher Sprache (Natural Language Generation, NLG) ist der Einsatz von künstlicher Intelligenz (KI) zur Erstellung von Ausgaben in natürlicher Sprache aus strukturierten und unstrukturierten Daten. NLG ermöglicht es Computern und generativen KI (gen KI) -Software-Anwendungen, mit Benutzern in verständlicher menschlicher Sprache zu interagieren. Neben natural language understanding (NLU) ist NLG eine Unterkategorie der Verarbeitung natürlicher Sprache (NLP)

NLG-Systeme sind sowohl in Unternehmens- als auch in Verbraucherprodukten weit verbreitet, z. B. in Tools für Business Intelligence (BI) und Chatbots. Sprachassistenten kommunizieren mit Benutzern über NLG.

Führungskräfte nutzen NLG, um komplexe Daten in generierten Text umzuwandeln, um wichtige Erkenntnisse zu gewinnen. Wenn ein KI-Modell einen Output in menschlicher Sprache generiert, ist das NLG im Einsatz. 

Die neuesten KI-Trends, präsentiert von Experten

Erhalten Sie kuratierte Einblicke in die wichtigsten – und faszinierendsten – KI-Neuheiten. Abonnieren Sie unseren wöchentlichen Think-Newsletter. Weitere Informationen in der IBM Datenschutzerklärung.

Vielen Dank! Sie haben ein Abonnement abgeschlossen.

Ihr Abonnement wird auf Englisch geliefert. In jedem Newsletter finden Sie einen Abmeldelink. Hier können Sie Ihre Abonnements verwalten oder sich abmelden. Weitere Informationen finden Sie in unserer IBM Datenschutzerklärung.

Arten von NLG

Die beiden Haupttypen von NLG sind extraktiv und abstraktiv: 

  • Extraktives NLG extrahiert exakte Wörter und Phrasen direkt aus dem Quelltext. Sie wird in Fällen verwendet, in denen bestimmte Formulierungen entscheidend sind, z. B. bei juristischen Dokumenten. Im Vergleich zu abstrakter NLG ist extraktive NLG einfacher, da sie aus Quelldokumenten kopiert, anstatt neue Inhalte auszugeben.

  • Abstrahierende NLG erstellt neuartige Ausgaben auf der Grundlage von Quelldokumenten, paraphrasiert und generiert neue Inhalte. Es handelt sich um einen komplexeren Prozess, der fortschrittlichere Modelle, wie z. B. Transformatoren, erfordert. Während extraktives NLG in technischen Umgebungen bevorzugt wird, glänzt abstraktes NLG in kreativeren Anwendungen

Mixture of Experts | 12. Dezember, Folge 85

KI entschlüsseln: Wöchentlicher Nachrichtenüberblick

Schließen Sie sich unserer erstklassigen Expertenrunde aus Ingenieuren, Forschern, Produktführern und anderen an, die sich durch das KI-Rauschen kämpfen, um Ihnen die neuesten KI-Nachrichten und Erkenntnisse zu liefern.

Funktionsweise der NLG

NLG durchläuft einen mehrstufigen Prozess, um strukturierte und unstrukturierte Daten Eingaben zu verfeinern und Ausgaben in natürlicher Sprache zu erzeugen. Nach der Beschreibung des Informatikers Ehud Reiter,1 sind die Phasen des typischen NLG-Prozesses folgende: 

  • Analyse des Signals: Das NLG-System bestimmt, welche Eingabe benötigt wird für die Ausgabe. In der Signal- oder Datenanalysephase erkennt die Mustererkennung den Gegenstand des Inhalts und die Beziehungen zwischen den Themen. Zu den Eingaben gehören Prompts, Datenbankinhalte und unstrukturierte Sprachinhalte wie PDFs, Dokumente und Aufzeichnungen in gesprochener Sprache. Entitätserkennung hilft NLP-Systemen zu verstehen, worüber gesprochen wird. 

  • Dateninterpretation: NLP-Modelle generieren Erkenntnisse aus den Ergebnissen der Datenanalyse. Wenn die Daten bereits mit den verfügbaren Erkenntnissen vorverarbeitet sind, wird dieser Schritt umgangen. NLP-Systeme identifizieren Wortarten und verwenden NLU, um Syntax und Semantik zu bewerten und so ein Verständnis für die Bedeutung zu schaffen. 

  • Dokumentenplanung: In dieser Phase wird festgelegt, welche Informationen mitgeteilt werden sollen und wie sie formatiert werden sollen. Das NLG-System bestimmt seinen Ansatz für das Endergebnis, abhängig von den ihm zur Verfügung stehenden Daten und der Eingabeaufforderung des Benutzers. 

  • Mikroplanung: Nachdem Inhalt und Format der Kommunikation festgelegt wurden, plant das NLG-System die Satz- und Absatzstruktur für die endgültige Ausgabe. 

  • Oberflächenrealisierung: Das NLG-System setzt seinen Plan in die Tat um und generiert Ausgaben in natürlicher Sprache gemäß den Ergebnissen der vorherigen Schritte. 

NLG vs. NLP

NLG ist Teil der Informatikdisziplin für die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP): die Verwendung von Modellen des maschinellen Lernens (ML), um menschliche Sprache zu verstehen und mit ihr zu arbeiten.

NLG ist der Teil von NLP, der sich mit der Generierung von Inhalten befasst, insbesondere mit der Ausgabe neuer geschriebener oder gesprochener Sprache. Zum Beispiel verwenden intelligente Chatbots mit dialogorientierter KI NLG, um in Echtzeit auf Eingaben zu reagieren. 

NLP wandelt Eingaben in natürlicher Sprache in Daten um, und NLG verwendet Daten, um Ausgaben in natürlicher Sprache zu generieren. 

NLP gehört zum Bereich der Computerlinguistik: der Untersuchung der Frage, wie Computer die menschliche Sprache analysieren und verstehen. NLP ist Computerlinguistik in der Praxis.

Die Entwicklung von Deep Learning und großen Sprachmodellen (LLMs) ermöglichte Fortschritte in der natürlichen Sprachverarbeitung (NLP), die die vielen generativen KI-Anwendungen antreiben, die sich mit der Inhaltserstellung befassen.

NLG vs. NLU

Natural Language Understanding (NLU) ist eine weitere Untergruppe von NLP. Anstatt sich auf die grammatikalische und sprachliche Bedeutung zu konzentrieren, versucht NLU, die menschliche Sprache ganzheitlich zu erfassen. NLU verwendet semantische und syntaktische Analysen, um Eingaben in natürlicher Sprache, einschließlich Emotionen, Stimmungen und Absichten, vollständig und kontextuell zu verstehen. 

NLU ermöglicht es Computern, Eingaben in natürlicher Sprache auf eine Weise zu verstehen, die der Sprache der Menschen näher kommen. Wenn Menschen miteinander sprechen, verarbeiten sie mehr als die Definitionen der verwendeten Wörter. Sie können von Natur aus die tiefere Bedeutung hinter den wörtlichen Worten eines Sprechers verstehen. 

Wenn eine Softwareanwendung Optionen für die Texterkennung anbietet, verwendet sie NLU, um die Absicht des Benutzers zu verstehen, und wendet dann NLG an, um den Satz zu beenden. NLP, NLU und NLG arbeiten zusammen, um Computer bei der Kommunikation mit Benutzern zu unterstützen.

NLG-Modelle und -Methoden

Viele NLG-Systeme verwenden fortschrittliche KI-Modelle wie Transformatoren, um neuartige Texte aus Trainingsdaten und Eingaben zu erstellen.

Bevor diese Modelle entwickelt wurden, wurde NLG jedoch auf andere Weise ermöglicht. Zu den NLG-Modellen und -Techniken gehören: 

  • Vorlagen

  • Regelbasierte Systeme 

  • Transformer

Vorlagen

Vorlagenbasierte Systeme verwenden vordefinierte Satzvorlagen mit Variablen für Eingabedaten. Vorlagen sind eine der frühesten und einfachsten Arten von NLG und eignen sich für Kontexte, in denen die Satz- und Dokumentstrukturen konsistent sind. Vorlagenbasierte Systeme können jedoch nicht außerhalb ihrer vordefinierten Anwendungsfälle angepasst werden. 

Ein Beispiel könnte wie folgt aussehen: Im [Monat], [Jahr] hat unser [Standort] Geschäft [Menge] Einheiten von [Artikel] verkauft.

Diese Vorlage eignet sich zwar hervorragend für die Berichterstattung über standortbezogene Verkäufe, aber man kann sie nicht verwenden, um ein Kochrezept zu erstellen.

Regelbasierte Systeme

Regelbasierte Systeme generieren Text nach einer Reihe vordefinierter Regeln und Logik. Frühe regelbasierte Systeme wurden entwickelt, um die Art und Weise, wie Experten sprachen oder schrieben, widerzuspiegeln. Programmierer würden Experten befragen und dann entsprechende Regeln für die Textgenerierung erstellen. 

„Wenn-dann“-Systeme sind ein gängiges Beispiel für die regelbasierte Programmierung. Beispielsweise könnte die NLG-Software für Wettervorhersagen angewiesen werden, das Wetter als „unter dem Gefrierpunkt“ zu beschreiben, wenn die Temperatur unter 32 Grad Fahrenheit bzw. 0 Grad Celsius liegt.

Statistische Algorithmen des maschinellen Lernens

Statistische Algorithmen des maschinellen Lernens, wie z. B. versteckte Markov-Ketten, identifizieren Muster in großen Datensätzen, um Vorhersagen und Entscheidungen mit neuen Daten zu treffen.

Sie generieren neue Instanzen basierend auf der aktuellen Instanz. Für NLG generieren Markov-Ketten und andere statistische Modelle Wörter, die wahrscheinlich aufeinander folgen. 

Statistische Modelle sind flexibler als Vorlagen und regelbasierte Systeme, benötigen aber große Mengen an Trainingsdaten.

Deep-Learning-Modelle

Deep Learning Modelle sind ein Fortschritt in der KI Technologie gegenüber statistischen Algorithmen und können natürlicher wirkenden Text generieren. Neuronale Netze (RNNs) sind ein Beispiel für Deep Learning-Modelle, die auf NLG angewendet werden.

RNNs verarbeiten sequenzielle Daten, etwa die Wörter in einem Satz, und können Wissen übertragen, z. B. mit maschineller Übersetzung.

Transformer

Die Architektur des Transformer-Modells unterstützt einige der effektivsten NLG-Technologien auf dem Markt. Transformer-basierte Modelle wie GPT und BERT nutzen Selbstaufmerksamkeitsmechanismen, um weitreichende Abhängigkeiten in Eingabesequenzen zu erfassen und so ein besseres kontextuelles Verständnis zu ermöglichen.

ChatGPT, Claude und andere Transformer-basierte Chatbots können realistische Ausgaben in menschlicher Sprache erzeugen.

Anwendungsfall für die Generierung natürlicher Sprache

NLG ist in der gesamten generativen KI-Landschaft zu finden, wo KI eingesetzt wird, um in natürlicher Sprache direkt mit Menschen zu kommunizieren. Von Siri bis zur Stimmungsanalyse – NLG-Anwendungsfälle umfassen: 

  • Sprachassistenten: Siri, Alexa und andere Sprachassistenten verwenden NLG, um auf Benutzeranfragen mit gesprochener Sprache zu reagieren. Sie verwenden auch NLP und NLU für die Spracherkennung, um zu verstehen, was die Benutzer wollen. 

  • Virtuelle Assistenten: Chatbots und virtuelle Assistenten nutzen NLG, um Kundenservice zu automatisieren. Viele Unternehmen nutzen virtuelle Assistenten, um erste Kundenserviceanfragen zu bearbeiten, bevor sie bei Bedarf an menschliche Vertreter weitergeleitet werden. Virtuelle Agenten kommunizieren auch über NLG mit Benutzern.

  • Maschinelle Übersetzung: Maschinelle Übersetzung ist die Verwendung von Modellen des maschinellen Lernens, um automatisch zwischen Sprachen zu übersetzen. NLG-Systeme übernehmen die Generierung der Ausgabe und rationalisieren den zeitaufwändigen Übersetzungsprozess. Menschliche Übersetzer und Lokalisierungsexperten können die Ergebnisse dann bei Bedarf überprüfen und bearbeiten. 

  • Datenzusammenfassungen und Berichterstattung: NLG-Systeme wandeln komplexe Daten in leicht verständliche Zusammenfassungen und Gliederungen um. Die Optimierung der Aggregation und Zusammenfassung von Artikeln und Berichten macht Prognosen effizienter. Führungskräfte verwenden NLG-gestützte BI-Tools für datengesteuerte Entscheidungsfindung. Andere Unternehmen nutzen KI und NLG, um diese Inhalte für ihre Kunden zu erstellen. 

  • Inhaltsgenerierung: Jedes Mal, wenn ein generatives KI-Modell natürliche Sprache als Ausgabe ausgibt, ist das NLG im Einsatz. Unternehmen können NLG verwenden, um Produktbeschreibungen, E-Mail-Marketingkampagnen, Beiträge in sozialen Netzwerken und andere Arten von kurzformatigen Inhalten zu automatisieren. 

  • Stimmungsanalyse: Die NLG-Systeme erstellen Textzusammenfassungen und Berichte auf der Grundlage von Zielgruppen-Feedback und Kommunikation. Unternehmen können nutzergenerierte Inhalte aus Reviews, Social-Media-Plattformen, Forenbeiträgen und anderen Online-Standorten abrufen und dann NLP und NLG verwenden, um zu ermitteln, wie sich die Benutzer fühlen. 

Weitere Lösungen
IBM® watsonx™ Orchestrate®

Mit IBM® watsonx Orchestrate können Sie ganz einfach skalierbare KI-Assistenten und Agenten entwickeln, sich wiederholende Aufgaben automatisieren und komplexe Prozesse vereinfachen.

Entdecken Sie watsonx Orchestrate
Tools und APIs zur Verarbeitung natürlicher Sprache

Steigern Sie den Geschäftswert der künstlichen Intelligenz mit einem leistungsstarken und flexiblen Portfolio aus Bibliotheken, Diensten und Anwendungen.

NLP-Lösungen erkunden
KI-Beratung und -Services

Erfinden Sie kritische Workflows und Abläufe neu, indem Sie KI einsetzen, um Erfahrungen, Entscheidungsfindung in Echtzeit und den geschäftlichen Nutzen zu maximieren.

KI-Services entdecken
Machen Sie den nächsten Schritt

Mit IBM® watsonx Orchestrate können Sie ganz einfach skalierbare KI-Assistenten und Agenten entwickeln, sich wiederholende Aufgaben automatisieren und komplexe Prozesse vereinfachen.

Entdecken Sie watsonx Orchestrate NLP-Lösungen erkunden
Fußnoten

1 Natural Language Generation, Ehud Reiter, Springer, 2024.