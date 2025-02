ステミング・アルゴリズムの演算との違いを探るために、シェイクスピアの真夏の夜の夢に登場する「Love looks not with the eyes but with the mind, and therefore is winged Cupid painted blind」という行を処理してみましょう。ステミングする前に、未加工のテキスト・データをトークン化する必要があります。Pythonの自然言語ツールキット(NLTK)の組み込みトークナイザーは、引用符で囲まれたテキストを次のように出力します。

トークン化: ['Love', 'looks', 'not', 'with', 'the', 'eyes', 'but', 'with', 'the', 'mind', ',', 'and', 'therefore', 'is', 'winged', 'Cupid', 'painted', 'blind', '.']

トークン化された出力を複数のステミング・ツールで処理することで、ステミング・アルゴリズムの違いを確認できます。