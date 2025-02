Bag-of-Wordsのアプローチは、ソーシャル・メディア・プラットフォーム上のヘイト・スピーチを検出するためのアルゴリズムでテストされていますが、成功の度合いには幅があります。ある研究では、Word2vecとディープラーニング分類器を比較し、BERTはbag of wordsよりも優れたパフォーマンスを発揮し、TF-IDFは bag of words モデルからの予測を大幅に改善していないと主張しています。14 対照的に、後の研究では、bag of wordsとナイーブ・ベイズを使用した、約99%の精度でヘイトスピーチを検知するアルゴリズムが発表されています。15 データサイズやサンプリング、およびテキストの前処理の違いは、そのような調査結果のギャップに影響を与える可能性があります。実際、他の研究で、BERTとBag-of-Wordsを使用した分類器とのパフォーマンス比較は、データ・セットの分類カテゴリーのサイズに依存することが示唆されています。16