في خريف هذا العام، طرحت LinkedIn أول وكيل للذكاء الاصطناعي موجَّه لمسؤولي التوظيف تحت اسم Hiring Assistant. ويقوم هذا المنتج الجديد، المدعوم بنموذج GPT من OpenAI، بأتمتة مجموعة واسعة من المهام التي تستهلك عادةً وقت مسؤولي التوظيف، مثل صياغة الوصف الوظيفي، والبحث عن المرشحين، والتواصل معهم. وبالاستفادة من الكمّ الهائل من بيانات مستخدمي LinkedIn، تعطي الأداة الأولوية للمهارات بدلًا من الاعتماد على عوامل الفرز التقليدية، التي غالبًا ما ترتّب المرشحين وفقًا لمعايير مثل الموقع الجغرافي أو الجامعة التي تخرّجوا فيها.
ويُعد Hiring Assistant أحدث إضافة إلى المجال الواسع والمتنوع لحلول الذكاء الاصطناعي الموجّهة للتوظيف، في سوق تزخر أيضًا بأدوات من Microsoft وIndeed وGoogle وIBM وغيرها الكثير. وهناك طلب واضح على هذه الأدوات؛ فقد كشف استطلاع حديث أجرته IBM أن احتياجات الموارد البشرية واستقطاب المواهب تمثّل 19% من حالات الاستخدام التي تقود اعتماد الذكاء الاصطناعي. وكحال كثير من الشركات المماثلة، تدرك LinkedIn التحيزات المحتملة في أداتها الجديدة وتؤكد أنها ستعمل على الحدّ منها. لكن يبقى السؤال: هل سيكون ذلك كافيًا؟
تقول Hilke Schellmann، الصحفية ومؤلفة كتاب The Algorithm: How AI Decides Who Gets Hired, Monitored, Promoted and Fired and Why We Need to Fight Back Now: "[HR Assistant] فكرة ممتازة، لكننا نحتاج إلى قدر أكبر من الشفافية، وأن نعرف بدقة أيّ مهارات أو كلمات مفتاحية في الوصف الوظيفي تبني الأداة استنتاجاتها عليها." "لقد شهدنا عددًا كبيرًا من الإخفاقات مع هذا النوع من التقنيات."
ومع اتّساع استخدام أدوات التوظيف المدعومة بالذكاء الاصطناعي، بدأت الهيئات التشريعية على مستوى الولايات والمدن في الانتباه إلى تداعياتها. فمدينة نيويورك تُلزم الشركات اليوم بالإفصاح عن أداء أنظمة التوظيف القائمة على الذكاء الاصطناعي وإجراء تدقيقات لرصد التحيّز فيها.وفي كاليفورنيا، صدر قانون جديد يوفّر حماية من التمييز القائم على الهويات المتقاطعة، وإن لم يذكر الذكاء الاصطناعي صراحةً. كما وضعت وزارة العمل الأمريكية إطار عمل لمساعدة أصحاب العمل على تعزيز ممارسات توظيف شاملة مع تزايد الاعتماد على هذه الأدوات.
وتهتم Kyra Wilson، طالبة الدكتوراه في كلية المعلومات بجامعة واشنطن، بدراسة الكيفية التي قد تُسهم بها أدوات التوظيف القائمة على الذكاء الاصطناعي في إنتاج تمييز بين المهن المختلفة والفئات الاجتماعية المتنوعة. وقد قادت مؤخرًا دراسة حلّلت 554 سيرة ذاتية و571 وصفًا وظيفيًا، مع تعديل الأسماء لتعكس اختلاف الجنس والخلفيات العرقية. وتقول Wilson: "أردنا أن نرى ما إذا كانت هذه الأدوات قد تضع بعض المرشحين في موقف مجحف."
واختبر الباحثون ثلاثة نماذج لغوية كبيرة مفتوحة المصدر (LLMs) من Salesforce وContextual AI وMistral AI. كانت النتائج لافتة؛ فرغم ضبط عوامل المؤهلات مثل الخبرة والتعليم، ظلّت النماذج تميل بشكل غير متكافئ إلى تفضيل المرشحين الذين تحمل أسماؤهم دلالات مرتبطة بالبيض في 85% من الحالات، في حين لم تُفضِّل أصحاب الأسماء المرتبطة بالنساء إلا في 11% فقط من الحالات. كما تبيّن للباحثين أن هذه النماذج لا تكتفي بإعادة إنتاج التحيزات الاجتماعية القائمة، بل تولّد أيضًا أنماطًا جديدة من التحيّز.
توضح Wilson: "النماذج التي استخدمناها لم تُضبَط بالاستعانة بمجموعات بيانات متخصّصة في مجال بعينه، ولذلك لاحظنا أن أنماط التحيّز الاجتماعي العامة التي تميل إلى تفضيل الأشخاص البيض والرجال بدأت تظهر أيضًا في وظائف لا ترتبط عادةً بهذه الفئات." "ولهذا فإن استخدام هذه النماذج على نطاق واسع قد يغيّر أنماط التوظيف في المجتمع بطرق سلبية."
كما ظهرت في النتائج تحيّزات مرتبطة بما يُعرَف بالتقاطعية، أي تداخل عوامل مثل العِرق والنوع الاجتماعي؛ وكان الأثر أوضح ما يكون لدى الرجال السود، الذين تعرّضوا لعدم إنصاف في ما يصل إلى 100% من الحالات. وتقول Wilson: "كانت مسألة التقاطعية جزءًا أساسيًا من دراستنا، لأنها تمثّل بصورة أدقّ الكيفية التي يُمارَس بها التمييز ضد الأفراد في الواقع." "فالناس لا ينظرون إلى خصائص مثل النوع الاجتماعي والعِرق باعتبارها عناصر منفصلة، وبالتالي فإن دراستها كلٌّ على حدة لا تقدّم بالضرورة صورة مكتملة عن الآثار المجتمعية الحقيقية لهذه الأنظمة."
ورغم أن بحث Wilson اقتصر على الهويات التي تُستشفّ من الأسماء، فإنها تشير إلى أن الأفراد في العالم الواقعي قد يلمّحون إلى هوياتهم من خلال الجوائز التي حصلوا عليها، والأماكن التي عاشوا فيها، بل وحتى المفردات التي يستخدمونها في سيرهم الذاتية. ويمكن أن تسهم جميع هذه العوامل في الطريقة التي يقيّم بها الذكاء الاصطناعي المرشحين، ولأن الكثير منها يرتبط أيضًا بالتمييز بين المرشحين الأقوياء، فلا يمكن حذفها بسهولة أثناء المراجعة — كما يحدث مع الأسماء — من دون التفريط في معلومات جوهرية.
وتختتم Wilson بالقول: "إن التعمّق في فهم الطريقة التي قد تُشير بها هذه العوامل إلى هويات متقاطعة، وما إذا كان لذلك دور في تقييمات الذكاء الاصطناعي، يُعد خطوة تالية بالغة الأهمية للباحثين ومطوّري النماذج."
فالبيانات، في نهاية المطاف، هي الأساس الذي تُبنى عليه نماذج الذكاء الاصطناعي. وبحسب Moninder Singh، كبير علماء الأبحاث في IBM، فهي أيضًا البوابة التي تتسرّب من خلالها أغلب أنماط التحيّز، سواء كانت ضمنية أو صريحة، أو نابعة من سياقات تاريخية أو اجتماعية. وأفضل طريقة للحد من التحيّز في أدوات الذكاء الاصطناعي، بمختلف أنواعها، هي التعامل مع هذه المشكلات مبكرًا أثناء مرحلة تدريب النماذج اللغوية الكبيرة (LLMs)، ثم في مرحلة الضبط الدقيق عند الحاجة.
يوضّح Singh أن معظم المؤسسات التي تطوّر أدوات تعتمد على الذكاء الاصطناعي — مثل أدوات التوظيف — لا تمتلك القدرة على معالجة التحيّز من مستوى نماذج الأساس نفسها. فقليل من الشركات يملك الموارد اللازمة لتدريب نماذجه اللغوية الكبيرة الخاصة به، لذا تعتمد عادةً على نماذج مدرَّبة مسبقًا مثل GPT من OpenAI أو PaLM من Google، ثم تُجري عليها عمليات ضبط دقيق لحالات استخدام محددة. ومع ذلك، يلفت Singh إلى أن الضبط الدقيق، له حدود ولا يكفي وحده للتخلّص من التحيّز بالكامل. وعلى أرض الواقع، يجري التعامل مع التحيّز غالبًا على مستوى البيانات؛ إذ تقوم الشركات بمواءمة النماذج اللغوية الكبيرة (LLMs) مع مجموعات البيانات الخاصة بها، وهي مجموعات تتكوَّن أصلًا من نوعية البيانات المتاحة لتلك الشركات.
ويقول Singh: "حتى مع اتباع أفضل الممارسات واستخدام الضبط الدقيق مع كمّيات ضخمة من البيانات المرتبطة بالمهمة — مثل التوظيف — ستستمر أنماط التحيّز في الظهور عند استخدام هذه الأنظمة في البيئات الواقعية."
ويضيف أن بوسع الشركات، على مستوى مخرجات النظام، تطبيق مجموعة من الأساليب لرصد التحيّزات والتخفيف منها فور ظهورها وفي الوقت الفعلي. فعلى سبيل المثال، قد تُنتج أدوات التوظيف المدعومة بالذكاء الاصطناعي قائمة مختصرة بالمرشحين، ويمكن للشركات مراجعة هذه القائمة للتأكد من عدالتها، وهو ما تشترطه اللوائح الجديدة في مدينة نيويورك. وإذا تبيّن وجود تحيّز — كأن تُصنَّف مجموعة معيّنة في مرتبة أدنى من غيرها بصورة متكررة — فيمكن للمطوّرين التدخّل عبر تنقيح بيانات التدريب أو استخدام تقنيات المعالجة اللاحقة لإعادة وزن التوصيات.
ويوضح Singh أن أساليب المعالجة اللاحقة تتيح كذلك تعديل الدرجات أو التصنيفات بما يجعلها أكثر إنصافًا، من دون الإضرار بالأداء الكلي للنظام. توفر أدوات مثل IBM AI Fairness 360، وهي مجموعة أدوات مفتوحة المصدر لاكتشاف التحيّز والتخفيف منه، حزمة من التقنيات المصمَّمة تحديدًا لهذا الغرض. كما تعمل IBM على كشف التحيّز باستخدام نماذج مثل Granite Guardian 3.0، الذي خضع لعمليات ضبط دقيق لتمييز مخاطر التحيّز في المحتوى الذي يُنتجه الذكاء الاصطناعي.
ويمكن الاستفادة من هذه النماذج في تقييم المخرجات — مثل ترتيب السير الذاتية — من خلال توليد تفسيرات للقرارات المتّخذة، ثم التحقق مما إذا كانت مؤشرات التحيّز تظهر في تلك التفسيرات. وبالمثل، تتيح مجموعة الأدوات IBM watsonx.governance حوكمة النماذج التوليدية المنتشرة على منصة watsonx، بما في ذلك رصد التحيّز فيها والتعامل معه. كما يختبر معيار SocialStigmaQA من IBM النماذج اللغوية الكبيرة (LLMs) للكشف عن التحيّزات المرتبطة بصور الوصم الاجتماعي التي كثيرًا ما تُهمَل في اختبارات التحيّز التقليدية، رغم أنها قد تكون حاسمة في التطبيقات الحسّاسة مثل التوظيف، لا سيما ما يتّصل بالصحة النفسية أو تعاطي المخدّرات.
ويقول Singh: "على الرغم من الجهود الكبيرة التي يبذلها مطوّر النظام القائم على الذكاء الاصطناعي — مثل أدوات التوظيف — للحد من التحيّز، فإنه من المهم الإقرار بأن هذه الجهود لا يمكن أن تغطي كل حالة استخدام عند كل مستخدم نهائي، خصوصًا إذا لم يحرص ذلك المستخدم نفسه على تجنّب تضخيم التحيّزات أو إدخال تحيّزات جديدة عند مستوى الاستخدام." "وعلى المستخدم النهائي لأداة التوظيف أن يحرص، بالمثل، على مراعاة مبادئ التنوع والإنصاف في كل خطوة من خطوات الاستخدام."
