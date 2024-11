Der letzte allgemeine Schritt bei extraktiven Algorithmen ist die Satzauswahl. Nachdem die Sätze nach ihrer Wichtigkeit gewichtet wurden, wählen die Algorithmen die n wichtigsten Sätze für ein Dokument oder eine Sammlung davon aus. Diese Sätze bilden die generierte Zusammenfassung. Aber was passiert, wenn es semantische und thematische Überschneidungen in diesen Sätzen gibt? Der Schritt der Satzauswahl zielt darauf ab, die Redundanz in den endgültigen Zusammenfassungen zu reduzieren. Die Methoden der Maximalen Marginalen Relevanz verwenden einen iterativen Ansatz. Konkret berechnen sie die Satzbewertung neu, indem sie die Ähnlichkeit dieses Satzes zu bereits ausgewählten Sätzen berücksichtigen. Globale Auswahlmethoden wählen eine Teilmenge der wichtigsten Sätze aus, um die Gesamtbedeutung zu maximieren und Redundanzen zu verringern.9

Wie diese Übersicht zeigt, geht es bei der extraktiven Textzusammenfassung hauptsächlich um die Frage der Texteinstufung (und meistens auch der Satzeinstufung). Verfahren zur extraktiven Textzusammenfassung ordnen Dokumente und ihre Teststrings (z. B. Sätze) so an, dass eine Zusammenfassung erstellt wird, die am besten den zentralen Themen der gegebenen Texte entspricht. In diesem Sinne kann die extraktive Zusammenfassung als eine Form des Informationsabrufs verstanden werden.10