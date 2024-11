La dernière étape générale des algorithmes extractifs est la sélection des phrases. Après avoir pondéré les phrases par importance, les algorithmes sélectionnent les n phrases les plus importantes pour un document ou un ensemble de ceux-ci. Ces phrases constituent le résumé généré. Mais que se passe-t-il s’il y a un chevauchement sémantique et thématique dans ces phrases ? L’étape de sélection des phrases vise à réduire la redondance dans les résumés finaux. Les méthodes de pertinence marginale maximale utilisent une approche itérative. Plus précisément, ils recalculent les scores d’importance des phrases en fonction de la similarité de cette phrase avec des phrases déjà sélectionnées. Les méthodes de sélection globale sélectionnent un sous-ensemble des phrases les plus importantes pour maximiser l’importance globale et réduire la redondance.9

Comme l’illustre cette présentation, la récapitulation de texte extractive est, en fin de compte, un problème de classement du texte (et, le plus souvent, des phrases). Les techniques de récapitulation de texte extractives classent les documents et leurs chaînes de test (par exemple : les phrases) dans l’ordre ou produisent un résumé qui correspond le mieux aux sujets principaux identifiés dans les textes concernés. En ce sens, la récapitulation extractive peut être comprise comme une forme de récupération d’informations.10