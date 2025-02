Come l'image augmentation, la text augmentation è costituita da molte tecniche e metodi utilizzati in una serie di attività di elaborazione del linguaggio naturale (NLP). Alcune risorse dividono la text augmentation in metodi basati su regole (o "facili") e neurali. Naturalmente, come per la divisione binaria delle tecniche di image augmentation, questa categorizzazione non è onnicomprensiva.

Gli approcci basati su regole includono tecniche di ricerca e sostituzione relativamente semplici, come la cancellazione o l'inserimento casuale. Gli approcci basati su regole comprendono anche la sostituzione dei sinonimi. In questa strategia, una o più parole in una stringa vengono sostituite con i rispettivi sinonimi registrati in un thesaurus predefinito, come WordNet o il Paraphrase Database. L'inversione e la passivazione della frase, in cui l'oggetto e il soggetto vengono scambiati, sono anch'essi esempi di approcci basati su regole.10