Per esplorare le differenze tra le operazioni degli algoritmi di stemming, possiamo elaborare questa riga tratta da Sogno di una notte di mezza estate di Shakespeare: "Love looks not with the eyes but with the mind, and therefore is winged Cupid painted blind". Prima dello stemming, gli utenti devono tokenizzare i dati di testo non elaborati. Il tokenizer integrato del Natural Language Toolkit (NLTK) di Python restituisce il testo citato come:

Tokenized: ['Love', 'looks', 'not', 'with', 'the', 'eyes', 'but', 'with', 'the', 'mind', ',', 'and', 'therefore', 'is', 'winged', 'Cupid', 'painted', 'blind', '.']

Eseguendo l'output tokenizzato attraverso più stemmer, possiamo osservare le differenze tra gli algoritmi di stemming.