Meskipun analisis sentimen dan teknologi yang mendukungnya berkembang pesat, analisis sentimen masih merupakan bidang yang relatif baru. Menurut “Sentiment Analysis”, oleh Liu Bing (2020), istilah ini baru digunakan secara luas sejak tahun 2003.2 Masih banyak yang harus dipelajari dan disempurnakan, berikut ini adalah beberapa kekurangan dan tantangan yang paling umum.
Kurangnya konteks
Konteks adalah komponen penting untuk memahami emosi apa yang diekspresikan dalam blok teks dan yang sering menyebabkan alat analisis sentimen membuat kesalahan. Pada survei pelanggan, misalnya, pelanggan mungkin memberikan dua jawaban atas pertanyaan: “Apa yang Anda sukai dari aplikasi kami?” Jawaban pertama mungkin “fungsionalitas” dan yang kedua, “UX.” Jika pertanyaan yang diajukan berbeda, misalnya, “Apa yang tidak Anda sukai dari aplikasi kami?” itu mengubah arti respons pelanggan tanpa mengubah kata-kata itu sendiri. Untuk memperbaiki masalah ini, algoritma perlu diberikan konteks asli dari pertanyaan yang ditanggapi pelanggan, taktik memakan waktu yang dikenal sebagai pra atau pasca pemrosesan.
Penggunaan ironi dan sarkasme
Terlepas dari tingkat atau luasnya pelatihan, perangkat lunak mengalami kesulitan untuk mengidentifikasi ironi dan sarkasme dengan benar dalam sebuah teks. Hal ini karena sering kali ketika seseorang sedang menyindir atau ironis, hal ini disampaikan melalui nada suara atau ekspresi wajah mereka dan tidak ada perbedaan yang jelas dalam kata-kata yang mereka gunakan. Misalnya, ketika menganalisis frasa, “Luar biasa, tiket tilang seribu dolar lagi, tepat seperti yang saya butuhkan,” alat analisis sentimen mungkin akan salah mengartikan sifat emosi yang diekspresikan dan melabelinya sebagai hal yang positif karena penggunaan kata “luar biasa”.
Negasi
Negasi adalah ketika kata negatif digunakan untuk menyampaikan pembalikan makna dalam sebuah kalimat. Misalnya, perhatikan kalimat, “Saya tidak akan mengatakan sepatu itu murah.” Apa yang diungkapkan, adalah bahwa sepatu itu mungkin mahal, atau setidaknya harganya sedang, tetapi alat analisis sentimen kemungkinan tidak menangkap kehalusan ini.
Bahasa idiomatik
Bahasa idiomatik, seperti penggunaan, contohnya, frasa bahasa Inggris yang umum seperti “Let's not beat around the bush,” atau “Break a leg”, sering kali mengacaukan alat analisis sentimen dan algoritme ML yang dibangun di atasnya. Ketika frasa bahasa manusia seperti di atas digunakan di saluran media sosial atau dalam ulasan produk, alat analisis sentimen akan salah mengidentifikasinya. Contoh “patah kaki” dapat salah diidentifikasi sebagai sesuatu yang menyakitkan atau menyedihkan, misalnya, atau tidak teridentifikasi sama sekali.