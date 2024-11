L'ultimo passaggio generale degli algoritmi estrattivi consiste nella selezione delle frasi. Dopo aver ponderato le frasi in base all'importanza, gli algoritmi selezionano le n frasi più importanti per un documento o una sua raccolta. Queste frasi costituiscono il riassunto generato. Ma che cosa succede in caso di sovrapposizione semantica e tematica in queste frasi? La fase di selezione delle frasi mira a ridurre la ridondanza nei riassunti finali. I metodi di massima rilevanza marginale impiegano un approccio iterativo. In particolare, ricalcolano i punteggi di importanza delle frasi in base alla loro somiglianza con le frasi già selezionate. I metodi di selezione globali selezionano un sottoinsieme delle frasi più importanti per massimizzare l'importanza complessiva e ridurre la ridondanza.9

Come illustra questa panoramica, il riassunto estrattivo del testo in definitiva è un problema di classificazione del testo (e, molto spesso, delle frasi). Le tecniche estrattive di riassunto dei testi classificano i documenti e le relative stringhe di testo (ad esempio, frasi) in ordine o producono un riassunto che meglio corrisponde agli argomenti centrali individuati nei testi indicati. In questo modo, la sintesi estrattiva può essere intesa come una forma di recupero delle informazioni.10