TakeTwoに取り組んでいる中、このソリューションは大量のデータを実用に即した試験を行い評価することによってバイアスを検知することを目的としているものの、データ自体が暗黙のバイアスを保持する可能性があることを認識することが重要であることが十分に明らかになりました。人工知能とPython、FastAPI、JavaScript、CouchDBなどのオープンソース・テクノロジーを活用することで、TakeTwoソリューションは、取り込んだデータを評価し続け、データ内にバイアスが存在する場合は、より正確に検出することができます。たとえば、米国では使用が許可されている単語やフレーズが日本では受け入れられない場合があります。そのため、私たちはこれをできる限り認識し、それに応じてソリューションが機能する必要があります。データサイエンスに情熱を注ぐ私は、私たちのモデルが、それに与えるデータと同じくらい優れていることを身をもって知っています。その点、このプロジェクトに取り組んで学んだことのひとつは、これらのシステムを支える機械学習（ML）モデルのトレーニングに役立つ、より良いデータセットが必要だということです。Kaggle社のデータ・セットは、私たちにとってすばらしい出発点となりましたが、人種差別が存在する場所でプロジェクトを拡張する場合は、より多様なデータが必要になります。

これに関連する注意点として、このようなプロジェクトに必要なスキルは単なるデータサイエンスをはるかに超えています。特にこのプロジェクトでは、TakeTwoのようなシステムが体系化するか無視する必要がある言語に存在する文化的ニュアンスの一部を定義するのに役立つ言語学の専門家を活用することが重要でした。分野を超えて取り組むことによってのみ、実行可能なソリューションを得ることができます。