أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء
احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.
التصفية التعاونية هي نوع من أنظمة التوصية. وهي تضع المستخدمين في مجموعات بناءً على السلوكيات المماثلة، وتوصي بعناصر جديدة وفقًا لخصائص المجموعة.
التصفية التعاونية هي طريقة لاسترجاع المعلومات ترشح العناصر للمستخدمين استنادًا إلى طريقة تفاعل مستخدمين آخرين ذوي تفضيلات وسلوكيات مماثلة مع تلك العناصر. وبعبارة آخر، تضع خوارزميات التصفية التعاونية المستخدمين في مجموعات بناءً على السلوك وتستخدم خصائص المجموعة العامة للتوصية بعناصر لمستخدم مستهدف. وتعمل أنظمة التوصية التعاونية على مبدأ أن المستخدمين المتشابهين (من حيث السلوك) يتشاركون اهتمامات وأذواقًا مشابهة.1
التصفية التعاونية هي نوع من النوعين الرئيسين لأنظمة التوصية، والنوع الآخر هو أنظمة التوصية القائمة على المحتوى. وتستخدم هذه الطريقة الأخيرة ميزات العنصر للتوصية بعناصر مشابهة لتلك التي تفاعل معها مستخدم معين بشكل إيجابي في الماضي.2 وفي حين تركِّز التصفية التعاونية على تشابه المستخدمين للتوصية بالعناصر، فإن التصفية القائمة على المحتوى توصي بالعناصر حصريًّا بناءً على الميزات الواردة في توصيف العنصر. وتستهدف التصفية القائمة على المحتوى تقديم توصيات موجَّهة لتفضيلات مستخدم محدد واحد بدلًا من مجموعة أو نوع كما في التصفية التعاونية.
شهدت كلتا الطريقتين كثير من التطبيقات العملية في السنوات الأخيرة، بدءًا من التجارة الإلكترونية مثل Amazon وصولًا إلى وسائل التواصل الاجتماعي وخدمات البث. وتعمل الأنظمة التعاونية وأنظمة التوصيات القائمة على المحتوى معًا لتشكيل أنظمة توصية هجينة. في الواقع، تبنت Netflix في عام 2009 نظام توصية هجين من خلال مسابقة جائزة Netflix.
احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.
تستخدم التصفية التعاونية مصفوفة لتعيين سلوك المستخدم لكل عنصر في نظامها. ومن ثم، يستخرج النظام القيم من هذه المصفوفة لتحديدها كنقاط بيانات في الفضاء المتجهي. وتُستخدم مقاييس متنوعة لقياس المسافة بين النقاط كوسيلة لحساب تشابه المستخدم-المستخدم والعنصر-العنصر.
في إعداد تقليدي للتصفية التعاونية، لدينا مجموعة من المستخدمين n ومجموعة من العناصر x. يُعرَض تفضيل كل مستخدم لكل عنصر في مصفوفة المستخدم-العنصر (يُشار إليها أحيانًا بمصفوفة تصنيف المستخدم). وهنا يتم تمثيل المستخدمين في الصفوف والعناصر في الأعمدة. في مصفوفة Rij ، تمثل القيمة المعطاة سلوك المستخدم u تجاه العنصر i. قد تكون هذه القيم أرقامًا مطردة يقدمها المستخدمون (مثل التقييمات)، أو قيمًا ثنائية تشير إلى ما إذا كان المستخدم قد شاهد العنصر أو اشتراه. إليك مثال لمصفوفة المستخدم-العنصر لموقع إلكتروني لبيع الكتب:
تعرض هذه المصفوفة تقييمات المستخدمين للكتب المختلفة المتاحة. وتقارن خوارزمية التصفية التعاونية التقييمات التي يقدِّمها المستخدمين لكل كتاب. ومن خلال التعرُّف على المستخدمين أو العناصر المتشابهة بناءً على هذه التقييمات، تتوقع الخوارزمية تقييمات للكتب التي لم يشاهدها المستخدم المستهدف-والتي تتم تطبيقها بالقيم الفارغة في المصفوفة- ويُوصي (أو لا توصي) بتلك الكتب إلى المستخدم المستهدف تبعًا لذلك.
والمصفوفة المستخدمة في هذا المثال مكتملة نظرًا لأنها تقتصر على أربعة مستخدمين وأربعة عناصر. ومع ذلك، في السيناريوهات الواقعية، غالبًا ما تكون تفضيلات المستخدمين المعروفة للعناصر محدودة، ما يجعل مصفوفة المستخدم-العنصر متناثرة.3
كيف تحدد خوارزمية التوصية التعاونية التشابه بين المستخدمين المختلفين؟ كما ذُكر، فإن القرب في الفضاء المتجهي هو أحد الأساليب الرئيسة. ولكن قد تختلف المقاييس الخاصة المستخدمة لتحديد هذا القرب. من هذه المقاييس اثنان هما تشابه جيب التمام ومعامل ارتباط Pearson.
يشير تشابه جيب التمام إلى قياس الزاوية بين متجهين. وتتألف المتجهات الخاضعة للمقارنة من مجموعة فرعية من التقييمات لمستخدم أو عنصر معين، حيث يمكن أن تكون درجة تشابه جيب التمام أي قيمة بين -1 و1. وكلما زادت درجة جيب التمام، زاد تشابه العنصرين. تُوصي بعض المصادر بهذا المقياس لفضاءات الميزات عالية الأبعاد. في التصفية التعاونية، يتم استخراج نقاط المتجه مباشرةً من مصفوفة المستخدم-العنصر. يتم تمثيل تشابه جيب التمام بهذه الصيغة، حيث يشير x وy إلى متجهين في الفضاء المتجه:4
يساعد معامل ارتباط Pearson (PCC) في قياس التشابه بين العناصر أو المستخدمين من خلال حساب الارتباط بين التقييمات ذات الصلة لاثنين من المستخدمين أو العناصر. ويتراوح معامل ارتباط Pearson بين -1 و1، وهو ما يشير إلى ارتباط سلبي أو متطابق. وعلى عكس تشابه جيب التمام، يستخدم معامل ارتباط Pearson جميع التقييمات لمستخدم أو عنصر معين. على سبيل المثال، عند حساب معامل الارتباط بيرسون (PCC) بين مستخدمين، نستخدم الصيغة التالية، حيث إن a وb هما مستخدمان مختلفان، وrai وrbi تمثِّل تقييم كل مستخدم للعنصر i.
هناك نوعان رئيسان من أنظمة التصفية التعاونية: القائمة على الذاكرة والقائمة على النموذج.
تُعَد أنظمة التوصية القائمة على الذاكرة، أو الأنظمة القائمة على الجار، امتدادًا لمصنِّفات/خوارزميات k-أقرب الجيران لأنها تحاول توقع سلوك المستخدم المستهدف تجاه عنصر معين بناءً على مستخدمين مماثلين أو مجموعة عناصر مماثلة. ويمكن تقسيم الأنظمة القائمة على الذاكرة إلى نوعين فرعيين:
في بعض الأحيان، تشير الأدبيات إلى الأساليب القائمة على الذاكرة باعتبارها أساليب تعلم تعتمد على الأمثلة، حيث يشير هذا إلى كيفية إجراء التصفية القائمة على المستخدم والعنصر تنبؤات خاصة بحالة معينة من تفاعل المستخدم-العنصر، مثل تقييم المستخدم المستهدف لفيلم لم يشاهده بعد.
على النقيض من ذلك، فإن الأساليب القائمة على النماذج تُنشئ نموذج تعلُّم آلي تنبؤي للبيانات، حيث يستخدم النموذج القيم الحالية في مصفوفة المستخدم-العنصر كمجموعة بيانات تدريبية، ويُنتج تنبؤات للقيم المفقودة باستخدام النموذج الناتج. وبالتالي، تستخدم الأساليب القائمة على النماذج تقنيات علم البيانات وخوارزميات التعلم الآلي مثل شجرة القرار ومصنِّف Bayes، والشبكات العصبية لتوصية العناصر للمستخدمين.8
يُعَد تحليل المصفوفة إلى عوامل هو أحد أكثر أساليب التصفية التعاونية التي تحظى بنقاش واسع، وغالبًا ما تُصَنَّف كنوع من نماذج العوامل الكامنة. وباعتبار تحليل المصفوفة إلى عوامل هو أحد نماذج العوامل الكامنة، يفترض أنه يمكن الوقوف على التشابه بين المستخدمين أو العناصر من خلال عدد محدد من الميزات. على سبيل المثال، يمكن التنبؤ بتقييم المستخدم لكتاب معين باستخدام بيانات مثل نوع الكتاب وعمر المستخدم أو جنسه فقط. وبذلك يهدف هذا التمثيل ذو الأبعاد الأدنى إلى تفسير، على سبيل المثال، تقييمات الكتب عن طريق تصنيف العناصر والمستخدمين بناءً على عدد قليل من الخصائص المختارة المُستَخلَصة من بيانات تعليقات المستخدمين.9 نظرًا لأنه يقلل من ميزات مساحة متجه معينة، فإن تحليل المصفوفة إلى عوامل يعمل أيضًا كطريقة لتقليل الأبعاد.10
مقارنةً بأنظمة التصفية القائمة على المحتوى، تُعَد التصفية التعاونية أكثر فاعلية في تقديم توصيات جديدة للمستخدمين. وتستخلص الأساليب التعاونية التوصيات من مجموعة مستخدمين يشاركون الاهتمامات نفسها مع مستخدم واحد مستهدف. فعلى سبيل المثال، إذا أُعجبت مجموعة من المستخدمين بنفس مجموعة العناصر التي أعجبت المستخدم المستهدف، ولكن أيضًا أعجبهم عنصرًا إضافيًا غير معروف للمستخدم المستهدف لأنه لا يشترك في أي ميزات مع مجموعة العناصر السابقة، فإن نظام التصفية التعاونية يوصي المستخدم بهذا العنصر الجديد. ويمكن للتصفية التعاونية أن توصي بعناصر قد لا يكون المستخدم المستهدف قد أولى لها اعتبارًا من قبل، ولكنها تروق إلى نوعية المستخدمين ذوي الاهتمامات المشابهة لاهتماماته.11
مشكلة البدء البارد ربما تُعَد أكثر العيوب شيوعًا لأنظمة التصفية التعاونية. وتحدث هذه المشكلة عندما يدخل مستخدم جديد (أو حتى عنصرًا جديدًا) إلى النظام، حيث يؤدي افتقار ذلك المستخدم إلى وجود سجل تاريخي من التفاعل مع العناصر إلى منع تمكُّن النظام من تقييم مدى تشابهه أو ارتباطه مع المستخدمين الحاليين. وعلى النقيض من ذلك، تكون أنظمة التصفية القائمة على المحتوى أكثر قدرة على التعامل مع العناصر الجديدة، على الرغم من أنها أيضًا تواجه صعوبة في تقديم توصيات للمستخدمين الجُدُد.12
ويُعَد تفرُّق البيانات مشكلة رئيسة أخرى قد تؤثِّر سلبًا في أنظمة التوصيات التعاونية. وكما ذُكر، تفتقر أنظمة التوصيات عادةً إلى البيانات الخاصة بتفضيلات المستخدمين لمعظم العناصر في النظام. ويعني هذا أن معظم مساحة الميزات في النظام تكون فارغة، وهي حالة تُعرَف باسم تفرُّق البيانات. ومع زيادة تفرُّق البيانات، تصبح نقاط المتجه متباينة بدرجة كبيرة، ما يجعل النماذج التنبؤية أقل فاعلية في تحديد الأنماط التفسيرية.13 وهذا هو السبب الرئيس لشيوع استخدام تحليل المصفوفة إلى عوامل -وأساليب العوامل الكامنة ذات الصلة مثل تحليل القيمة المفردة (SVD)- في التصفية التعاونية، إذ يخفف هذا من تفرُّق البيانات من خلال تقليل الميزات. وقد تشمل أيضًا الأساليب الأخرى المستخدمة لحل هذه المشكلة قيام المستخدمين أنفسهم بتقييم اهتماماتهم وتقديم معلومات بشأنها، والتي يمكن للنظام استخدامها بعد ذلك لتصفية التوصيات.
بينما تناولت الدراسات السابقة التوصيات بوصفها مسألة تنبؤية أو تصنيفية، تدفع مجموعة كبيرة من الأبحاث الحديثة بأنه يتعيَّن فهمها على أنها مشكلة تخص اتخاذ القرار المتسلسل. وفي هذا النموذج، قد يكون التعلم المعزز أكثر ملاءمة لمعالجة التوصية. يعمل هذا النهج على تحديث التوصيات في الوقت الفعلي وفقًا لتفاعل المستخدم مع العناصر؛ فعندما يتخطى المستخدم العناصر المقترحة أو ينقر عليها أو يُقيّمها أو يشتريها، يطوِّر النموذج سياسة مثالية مستمدة من هذه التعليقات من أجل التوصية بعناصر جديدة.17 تقترح الدراسات الحديثة مجموعة متنوعة من تطبيقات التعلم المعزز التي تُلبي اهتمامات المستخدم المتغيرة على المدى الطويل، والتي تشكِّل تحديات لكلٍّ من التصفية القائمة على المحتوى والتصفية الجماعية.18
تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.
استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.
أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.