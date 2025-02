Para explorar las diferencias entre las operaciones de los algoritmos de derivación, podemos procesar esta cita en inglés de El sueño de una noche de verano de Shakespeare: “Love looks not with the eyes but with the mind, and therefore is winged Cupid painted blind.” Antes de proceder al stemming, los usuarios deben tokenizar los datos textuales sin procesar. El tokenizador incorporado en el conjunto de herramientas de lenguaje natural de Python (NLTK) produce el texto citado como:

Tokenized: ['Love', 'looks', 'not', 'with', 'the', 'eyes', 'but', 'with', 'the', 'mind', ',', 'and', 'therefore', 'is', 'winged', 'Cupid', 'painted', 'blind', '.']

Al pasar la salida tokenizada por varios lematizadores, podemos observar cómo difieren los algoritmos de derivación.