Musim gugur ini, LinkedIn meluncurkan agen AI pertamanya untuk perekrut: Asisten Perekrutan. Produk baru ini, didukung oleh GPT dari OpenAI, mengotomatiskan berbagai tugas yang biasanya menghabiskan waktu perekrut, seperti menyusun deskripsi pekerjaan, mencari kandidat, dan menangani penjangkauan. Menggunakan data pengguna LinkedIn yang luas, alat ini memprioritaskan keterampilan daripada filter tradisional, yang biasanya mengurutkan kandidat berdasarkan faktor-faktor seperti lokasi atau almamater.
Asisten Perekrutan adalah entri terbaru ke bidang AI yang luas dan beragam yang dirancang untuk rekrutmen: Ada alat dari Microsoft, Indeed, Google, IBM, dan banyak lainnya. Dan ada permintaan untuk itu: Survei IBM baru-baru ini menemukan bahwa sumber daya manusia dan kebutuhan akuisisi taletan menyumbang 19% dari contoh penggunaan yang mendorong adopsi AI. Seperti banyak rekan-rekannya, LinkedIn menyadari potensi bias dari alat barunya dan mengatakan akan bekerja untuk menguranginya. Namun, apakah itu akan cukup?
“[Asisten SDM] adalah ide bagus, tetapi kita perlu memiliki transparansi dan perlu mengetahui keterampilan atau kata kunci apa dalam deskripsi pekerjaan yang disimpulkan alat ini,” kata Hilke Schellmann, jurnalis dan penulis The Algorithm: How AI Decides Who Gets Hired, Monitored, Promoted and Fired and Why We Need to Fight Back Now. “Kami telah melihat terlalu banyak kesalahan dalam teknologi semacam ini.”
Seiring dengan meningkatnya penggunaan alat perekrutan berbasis AI, legislatif negara bagian dan kota mulai memperhatikan. Kota New York sekarang mewajibkan perusahaan untuk mengungkapkan kinerja sistem perekrutan AI dan melakukan audit bias. Di California, sebuah undang-undang baru melindungi dari diskriminasi berdasarkan identitas interseksional (meskipun tidak secara spesifik menjelaskan tentang AI). Dan Departemen Tenaga Kerja AS telah menciptakan kerangka kerja untuk membantu perusahaan mempromosikan perekrutan inklusif seiring dengan berkembangnya penggunaan alat-alat ini.
Kyra Wilson, seorang mahasiswa doktoral di Fakultas Informasi Universitas Washington, tertarik untuk menyelidiki bagaimana alat perekrutan AI dapat membedakan berbagai pekerjaan dan kelompok sosial. Baru-baru ini, ia memimpin sebuah studi yang melibatkan pengamatan terhadap 554 resume dan 571 deskripsi pekerjaan, dengan nama-nama yang diubah untuk mewakili jenis kelamin dan ras yang berbeda. “Kami ingin melihat apakah alat-alat ini dapat merugikan kandidat tertentu secara tidak adil”, Wilson mengatakan.
Para peneliti menguji tiga LLM sumber terbuka dari Salesforce, Contextual AI, dan Mistral AI. Apa yang mereka temukan sangat mencolok: meskipun mengendalikan kualifikasi seperti pengalaman dan pendidikan, model masih secara tidak proporsional menyukai kandidat dengan nama terkait kulit putih 85% dari kesempatan yang ada, dan mereka yang memiliki nama terkait wanita hanya 11% dari yang ada. Dan mereka menemukan bahwa model tidak hanya mereplikasi bias sosial yang ada—mereka juga memperkenalkan pola baru.
"Model yang kami gunakan tidak disesuaikan dengan baik pada kumpulan data khusus domain apa pun, jadi kami mengamati bahwa bias masyarakat secara keseluruhan yang mendukung orang kulit putih dan laki-laki juga mulai terjadi pada posisi yang biasanya tidak terkait dengan kelompok-kelompok ini," kata Wilson. “Menggunakan model-model ini dalam skala besar maka dapat memiliki potensi untuk mengubah pola kerja masyarakat dengan cara yang negatif.”
Bias yang terkait dengan interseksionalitas (dalam hal ini, tumpang tindih antara ras dan jenis kelamin) juga muncul dalam hasil, terutama untuk pria kulit hitam, yang dirugikan hingga 100% kasus. “Interseksionalitas adalah bagian penting dari penyelidikan kami karena ini adalah representasi yang lebih baik tentang bagaimana orang didiskriminasi dalam kehidupan nyata,” kata Wilson. “Orang tidak melihat karakteristik seperti gender dan ras secara terpisah, sehingga mempelajarinya secara terpisah tidak selalu memberikan gambaran lengkap tentang dampak sosial yang sebenarnya dari sistem ini.”
Meskipun riset Wilson hanya meneliti identitas yang ditunjukkan melalui nama, ia mencatat bahwa dalam dunia nyata, orang mungkin menunjukkan identitas mereka melalui penghargaan yang mereka terima, tempat tinggal mereka, dan bahkan kata-kata yang mereka gunakan dalam CV mereka. Semua faktor ini dapat berperan dalam cara AI mengevaluasi mereka, dan karena banyak dari mereka juga relevan untuk membedakan kandidat yang kuat, mereka tidak dapat dengan mudah dihapus selama ulasan (seperti nama) tanpa menyingkirkan informasi penting.
“Mempelajari lebih lanjut tentang bagaimana faktor-faktor ini dapat menujukkan identitas yang saling bertumpang tindih dan apakah itu berperan dalam evaluasi AI adalah langkah penting selanjutnya bagi para peneliti dan pengembang model”, kata Wilson.
Data, bagaimanapun, adalah fondasi di mana model AI ini dibangun. Dan menurut Ilmuwan Riset Senior IBM Moninder Singh, di situlah sebagian besar bias—baik implisit atau eksplisit, historis, atau sosial—diperkenalkan. Cara paling efektif untuk mengurangi bias dalam AI adalah dengan menangani masalah ini lebih awal selama tahap pelatihan LLM (dan, jika berlaku, selama penyetelan halus berikutnya).
Singh menjelaskan bahwa bagi sebagian besar organisasi yang mengembangkan alat berbasis AI, seperti yang digunakan oleh perekrut, mengatasi bias tidak selalu mungkin dilakukan pada tingkat dasar. Hanya sedikit bisnis yang memiliki sumber daya untuk melatih LLM mereka sendiri, sehingga mereka biasanya mengandalkan model yang sudah dilatih sebelumnya seperti GPT dari OpenAI atau PaLM dari Google, dan menyesuaikannya untuk contoh penggunaan tertentu. Namun, penyetelan halus ini hanya bisa berjalan sejauh ini, kata Singh. Dalam praktiknya, mitigasi bias sering terjadi pada tingkat data, dengan perusahaan menyesuaikan LLM dengan kumpulan data spesifik mereka, yang pada gilirannya dibentuk oleh data yang mereka akses.
“Meskipun telah menerapkan praktik terbaik dan melakukan penyesuaian dengan jumlah data yang sangat besar yang relevan dengan tugas spesifik, seperti perekrutan, bias tetap akan muncul ketika sistem diterapkan dalam kehidupan nyata,” kata Singh.
Pada tingkat output, Singh menjelaskan, perusahaan dapat menerapkan berbagai strategi untuk deteksi dan mengurangi bias saat muncul secara real time. Misalnya, alat perekrutan AI dapat menghasilkan daftar kandidat pendek, dan perusahaan dapat mengevaluasi rekomendasi tersebut untuk keadilan, yang diperlukan berdasarkan undang-undang baru Kota New York. Jika bias terdeteksi—katakanlah, satu kelompok secara konsisten diberi peringkat lebih rendah daripada yang lain—pengembang dapat menyesuaikan model dengan menyempurnakan data pelatihan atau menggunakan teknik pasca-pemrosesan untuk menimbang ulang rekomendasi.
Metode pasca-pemrosesan juga dapat digunakan untuk menyesuaikan skor atau peringkat untuk membuatnya lebih adil tanpa berdampak negatif pada kinerja keseluruhan sistem, Singh menjelaskan. Alat seperti IBM AI Fairness 360, toolkit sumber terbuka untuk mendeteksi dan memitigasi bias, menyediakan rangkaian teknik untuk melakukan hal itu. IBM juga bekerja pada deteksi bias melalui model seperti Granite Guardian 3.0, yang disetel dengan baik untuk mengidentifikasi risiko bias dalam konten yang dihasilkan AI.
Model-model ini dapat digunakan untuk mengevaluasi output, seperti peringkat CV, dengan menghasilkan penjelasan untuk keputusan dan memeriksa apakah indikator bias muncul dalam penjelasan tersebut. Demikian pula, toolkit watsonx.governance dari IBM memungkinkan tata kelola model generatif, termasuk deteksi bias, yang diterapkan pada platform watsonx. Dan SocialStigmaQA dari IBM tolok ukur menguji LLM untuk bias yang terkait dengan stigma yang sering diabaikan dalam tes bias tradisional tetapi itu bisa menjadi penting dalam aplikasi sensitif seperti perekrutan, seperti di sekitar kesehatan mental atau penggunaan narkoba.
“Terlepas dari upaya terbaik oleh pengembang sistem AI, seperti alat perekrutan, untuk menghilangkan bias, penting untuk dicatat bahwa itu tidak mungkin mengatasi situasi khusus untuk setiap pengguna akhir, terutama jika pengguna akhir itu juga tidak cukup berhati-hati untuk tidak memperbesar atau memperkenalkan bias pada tingkat itu,” kata Singh. “Pengguna akhir alat perekrutan juga harus membawa keberagaman di setiap langkah.”
