Saat mengerjakan TakeTwo, semakin jelas bahwa meskipun solusinya dirancang untuk mendeteksi bias dengan mengumpulkan dan mengevaluasi data dalam jumlah besar, kita tetap harus menyadari bahwa data itu sendiri bisa menyimpan bias implisit di dalamnya. Dengan memanfaatkan Kecerdasan Buatan serta teknologi sumber terbuka seperti Python, FastAPI, JavaScript, dan CouchDB, solusi TakeTwo dapat terus mengevaluasi data yang dikumpulkannya dan mendeteksi dengan lebih akurat kapan bias muncul di dalamnya. Misalnya, sebuah kata atau frasa yang dianggap wajar di Amerika Serikat bisa jadi tidak pantas digunakan di Jepang – karena itu, kita perlu menyadari perbedaan ini sebaik mungkin dan memastikan solusinya memiliki fungsi yang tepat untuk menanganinya. Sebagai seseorang yang bersemangat di bidang ilmu data, saya paham betul bahwa kualitas model kami hanya sebaik data yang kami berikan. Sejalan dengan itu, satu hal yang saya pelajari dari proyek ini adalah perlunya kumpulan data yang lebih baik untuk membantu melatih model machine learning (ML) yang menjadi tulang punggung sistem ini. Kumpulan data Kaggle memang menjadi titik awal yang solid bagi kami, tetapi jika ingin memperluas proyek ini untuk mengatasi rasisme di mana pun ia muncul, kami membutuhkan data yang jauh lebih beragam.

Pada catatan terkait, keterampilan yang dibutuhkan pada proyek-proyek seperti ini jauh lebih dari sekadar ilmu data. Khusus untuk proyek ini, penting untuk melibatkan pakar linguistik yang dapat membantu mendefinisikan nuansa budaya dalam bahasa yang perlu dikodifikasikan atau diabaikan oleh sistem seperti TakeTwo. Hanya melalui kerja lintas disiplin kita dapat mencapai solusi yang benar-benar dapat diterapkan.