ما المقصود بالتصفية التعاونية؟

21 مارس 2024

المؤلفين

Jacob Murel Ph.D.

Senior Technical Content Creator

Eda Kavlakoglu

Program Manager

التصفية التعاونية هي أحد أساليب أنظمة التوصية، حيث تجمع المستخدمين في مجموعات بناءً على سلوكياتهم المتشابهة، ثم توصي بعناصر جديدة وفقًا لخصائص كل مجموعة.

التصفية التعاونية هي طريقة لاسترجاع المعلومات ترشح العناصر للمستخدمين استنادًا إلى طريقة تفاعل مستخدمين آخرين ذوي تفضيلات وسلوكيات مماثلة مع تلك العناصر. وبعبارة آخر، تضع خوارزميات التصفية التعاونية المستخدمين في مجموعات بناءً على سلوكهم، ثم تستخدم الخصائص العامة لكل مجموعة للتوصية بالعناصر للمستخدم المستهدف. وتعتمد أنظمة التوصية التعاونية على مبدأ أن المستخدمين المتشابهين (من حيث السلوك) يميلون إلى مشاركة اهتمامات وأذواق متشابهة.1

مقارنة بين التصفية التعاونية والتصفية القائمة على المحتوى

التصفية التعاونية هي أحد النوعين الرئيسيين لأنظمة التوصية، والنوع الآخر هو أنظمة التوصية القائمة على المحتوى. وتستخدم هذه الطريقة الأخيرة ميزات العنصر للتوصية بعناصر مشابهة لتلك التي تفاعل معها المستخدم بشكل إيجابي في السابق.2 وبينما تركز التصفية التعاونية على تشابه المستخدمين للتوصية بالعناصر، فإن التصفية القائمة على المحتوى توصي بالعناصر بناءً فقط على الميزات الواردة في توصيف العنصر. كما أن التصفية القائمة على المحتوى تقدم توصيات مخصصة لمستخدم معين بناءً على تفضيلاته الشخصية بدلًا من الاعتماد على مجموعة معينة أو نوع معين كما هو الحال في التصفية التعاونية.

شهد كلا الأسلوبين العديد من التطبيقات العملية في السنوات الأخيرة، بدءًا من التجارة الإلكترونية مثل Amazon مرورًا بوسائل التواصل الاجتماعي، ووصولًا إلى خدمات البث. وتعمل الأنظمة التعاونية وأنظمة التوصية القائمة على المحتوى معًا لتشكيل أنظمة توصية هجينة. في الواقع، تبنت Netflix في عام 2009 نظام توصية هجين من خلال مسابقة جائزة Netflix.

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر معارف وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

كيفية عمل التصفية التعاونية

تستخدم التصفية التعاونية مصفوفة لتعيين سلوك المستخدم لكل عنصر في نظامها. ومن ثم، يستخرج النظام القيم من هذه المصفوفة وتمثيلها كنقاط بيانات في الفضاء المتجهي. وتُستخدم مقاييس متنوعة لقياس المسافة بين النقاط بهدف حساب تشابه المستخدم مع المستخدم وتشابه العنصر مع العنصر.

مصفوفة تفاعل المستخدم مع العنصر

في الإعداد القياسي للتصفية التعاونية، لدينا مجموعة n من المستخدمين ومجموعة x من العناصر. يتم عرض تفضيل كل مستخدم لكل عنصر في مصفوفة تفاعل المستخدم مع العنصر (تسمى أحيانا مصفوفة تقييم المستخدم). في هذه المصفوفة، يتم تمثيل المستخدمين في الصفوف والعناصر في الأعمدة. وفي مصفوفة Rij ، تمثل قيمة معينة سلوك المستخدم u تجاه العنصر i. قد تكون هذه القيم أرقاما مطردة يقدمها المستخدمون (مثل التقييمات) أو قيما ثنائية تشير إلى ما إذا كان مستخدم معين قد شاهد العنصر أو اشتراه. فيما يلي مثال على مصفوفة وقت تفاعل المستخدم لموقع ويب لبيع الكتب:

تعرض هذه المصفوفة تقييمات المستخدمين للكتب المختلفة المتاحة. وتقارن خوارزمية التصفية التعاونية التقييمات التي يقدمها المستخدمون لكل كتاب. من خلال التعرف على المستخدمين أو العناصر المتشابهة بناءً على هذه التقييمات، تتوقع الخوارزمية تقييمات للكتب التي لم يطلع عليها المستخدم المستهدف-والممثلة بالقيم الفارغة (null) في المصفوفة-ثم تُوصي (أو لا توصي) بتلك الكتب إلى المستخدم المستهدف تبعًا لذلك.

والمصفوفة المستخدمة في هذا المثال مكتملة نظرًا لأنها تقتصر على أربعة مستخدمين وأربعة عناصر. ولكن في السيناريوهات الواقعية، غالبًا ما تكون تفضيلات المستخدمين المعروفة للعناصر محدودة، مما يؤدي إلى انخفاض الكثافة في مصفوفة تفاعل المستخدم مع العنصر.3

مقاييس التشابه

كيف تحدد خوارزمية التوصية التعاونية التشابه بين المستخدمين المختلفين؟ كما ذُكر، فإن القرب في الفضاء المتجهي هو أحد الأساليب الرئيسة، لكن المقاييس الخاصة المستخدمة لتحديد هذا القرب قد تختلف. ومن بين هذه المقاييس تشابه جيب التمام ومعامل ارتباط Pearson.

تشابه جيب التمام

يشير تشابه جيب التمام إلى قياس الزاوية بين متجهين. وتتألف المتجهات المقارنة من مجموعة فرعية من التقييمات لمستخدم أو عنصر معين. ويمكن أن تكون درجة تشابه جيب التمام أي قيمة بين -1 و1. فكلما زادت درجة جيب التمام، زاد تشابه العنصرين. توصي بعض المصادر بهذا المقياس لفضاءات الميزات عالية الأبعاد. في التصفية التعاونية، يتم استخراج نقاط المتجه مباشرةً من مصفوفة تفاعل المستخدم مع العنصر. ويُمَثَّل تشابه جيب التمام بهذه الصيغة، حيث يشير كل من x و y إلى متجهين في الفضاء المتجهي:4

معامل ارتباط Pearson (PCC)

يساعد معامل ارتباط Pearson (PCC) في قياس التشابه بين العناصر أو المستخدمين من خلال حساب الارتباط بين التقييمات الخاصة بمستخدميْن أو عنصرين. ويتراوح معامل ارتباط Pearson بين -1 و1، مما يشير إلى ارتباط سلبي أو متطابق. وعلى عكس تشابه جيب التمام، يستخدم معامل ارتباط Pearson جميع التقييمات المتاحة لمستخدم أو عنصر معين. على سبيل المثال، عند حساب معامل ارتباط Pearson بين مستخدمين، فإننا نستخدم الصيغة التالية، حيث يمثل a وb مستخدميْن مختلفيْن، وrai وrbi تقييم المستخدم للعنصر i:5

أنواع أنظمة التوصية التعاونية 

هناك نوعان رئيسان من أنظمة التصفية التعاونية: أنظمة التوصية القائمة على الذاكرة وأنظمة التوصية القائمة على النموذج.

القائمة على الذاكرة

أنظمة التوصية القائمة على الذاكرة، أو الأنظمة القائمة على الجار، هي امتدادات لمصنِّفات/خوارزميات الجار الأقرب (KNN)، لأنها تحاول توقع سلوك المستخدم المستهدف تجاه عنصر معين بناءً على مستخدمين مماثلين أو مجموعة عناصر مماثلة. ويمكن تقسيم الأنظمة القائمة على الذاكرة إلى نوعين فرعيين:

  • توصي التصفية القائمة على المستخدم بعناصر للمستخدم المستهدف بناءً على تفضيلات المستخدمين ذوي السلوك المشابه. وتقارن خوارزمية التوصية بين السلوك السابق للمستخدم المستهدف وسلوك المستخدمين الآخرين. وعلى وجه التحديد، يخصص النظام لكل مستخدم وزنًا يمثل مستوى التشابه بينه وبين المستخدم المستهدف - وهو ما يُعرف بجيران المستخدم المستهدف. ثم يختار النظام n من المستخدمين ذوي أعلى الأوزان ويحسب توقعًا لسلوك المستخدم المستهدف (مثل تصنيف الفيلم، أو عملية شراء، أو عدم الإعجاب، إلخ) باستخدام متوسط مرجح لسلوك الجيران المحددين. بعد ذلك، يوصي النظام بعناصر للمستخدم المستهدف بناءً على هذا التوقع. والمبدأ الأساسي هو أنه إذا تصرف المستخدم المستهدف بشكل مشابه لهذه المجموعة في الماضي، فمن المحتمل أن يتصرف بشكل مشابه مع العناصر غير المرئية. يتم حساب دالة التشابه بين المستخدمين عبر الصفوف في مصفوفة تفاعل المستخدم مع العنصر.6
  • إن التصفية القائمة على العناصر توصي بعناصر جديدة للمستخدم المستهدف بناءً على سلوكه تجاه عناصر مماثلة. ومع ذلك، لا يقارن النظام التعاوني بين ميزات العناصر (كما في التصفية القائمة على المحتوى)، بل يقارن كيفية تفاعل المستخدمين مع تلك العناصر.على سبيل المثال، في نظام توصية الأفلام، قد تحدد الخوارزمية أفلامًا متشابهة بناءً على الارتباطات بين جميع تقييمات المستخدمين لكل فيلم، مع تصحيح متوسط تقييم كل مستخدم. ثم يوصي النظام بفيلم جديد للمستخدم المستهدف بناءً على التقييمات المترابطة.بمعنى أنه إذا قام المستخدم المستهدف بتقييم الفيلمين أ و ب بدرجة عالية ولكنه لم يشاهد الفيلم ج، وقام مستخدمون آخرون، ممن قيّموا الفيلمين أ وب بدرجة عالية، بتقييم الفيلم ج بدرجة عالية أيضًا، فسيوصي النظام بالفيلم ج للمستخدم المستهدف. وبهذه الطريقة، تحسب التصفية القائمة على العناصر تشابه العناصر من خلال سلوك المستخدمين. يتم حساب دالة التشابه بين العناصر عبر الأعمدة في مصفوفة تفاعل المستخدم مع العنصر.7

القائمة على النموذج

في بعض الأحيان، تشير الأدبيات إلى الأساليب القائمة على الذاكرة باعتبارها أساليب تعلم تعتمد على الأمثلة، حيث يعكس ذلك كيفية قيام التصفية القائمة على المستخدم والعنصر بإجراء تنبؤات لحالة معينة من تفاعل المستخدم مع العنصر، مثل تقييم المستخدم المستهدف لفيلم لم يشاهده بعد.

وعلى النقيض من ذلك، فإن الأساليب القائمة على النموذج تنشئ نموذجًا تنبؤيًا للتعلم الآلي يعتمد على البيانات. يستخدم النموذج القيم الحالية في مصفوفة تفاعل المستخدم مع العنصر كمجموعة بيانات تدريب، ثم ينتج تنبؤات للقيم المفقودة بناءً على النموذج المُدرَّب. وبالتالي تستخدم الأساليب القائمة على النماذج تقنيات علم البيانات وخوارزميات التعلم الآلي مثل أشجار القرار ومصنفات Bayes والشبكة العصبية للتوصية بالعناصر للمستخدمين.8

يُعد تحليل المصفوفة إحدى طرق التصفية التعاونية التي نوقشت على نطاق واسع، وغالبًا ما يُصنَّف كنموذج من نماذج العوامل الكامنة. وباعتبار تحليل المصفوفة إلى عوامل هو أحد نماذج العوامل الكامنة، يفترض أن التشابه بين المستخدمين أو بين العناصر يمكن تحديده من خلال عدد محدد من الميزات. على سبيل المثال، يمكن التنبؤ بتقييم المستخدم لكتاب معين باستخدام بيانات مثل نوع الكتاب وعمر المستخدم أو جنسه فقط. وبالتالي يهدف هذا التمثيل منخفض الأبعاد إلى تفسير، على سبيل المثال، تقييمات الكتب من خلال تصنيف العناصر والمستخدمين بناءً على عدد محدود من الميزات المستمدة من بيانات تعليقات المستخدمين.9 نظرًا لأنه يقلل من عدد الميزات في مساحة متجهة معينة، يعمل تحليل المصفوفة أيضًا كطريقة لتقليل الأبعاد.10

Mixture of Experts | بودكاست

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضم إلى لجنة عالمية المستوى من المهندسين والباحثين وقادة المنتجات وغيرهم وهم يجتازون طريق الذكاء الاصطناعي لتزويدك بأحدث أخباره والمعارف المتعلقة به.

مميزات التصفية التعاونية وعيوبها

المزايا

مقارنةً بأنظمة التصفية القائمة على المحتوى، تُعَد التصفية التعاونية أكثر فعالية في تقديم توصيات جديدة للمستخدمين. وتستخلص الأساليب التعاونية التوصيات من مجموعة مستخدمين يشاركون نفس الاهتمامات مع مستخدم واحد مستهدف. فعلى سبيل المثال، إذا أعجبت مجموعة من المستخدمين نفس مجموعة العناصر التي أعجبت المستخدم المستهدف، ولكنهم أُعجبوا أيضًا بعنصر إضافي غير معروف للمستخدم المستهدف لعدم اشتراكه في أي ميزات مع العناصر السابقة، فإن نظام التصفية التعاونية يوصي المستخدم بهذا العنصر الجديد. ويمكن للتصفية التعاونية أن توصي بعناصر قد لا يكون المستخدم المستهدف قد نظر إليها من قبل، ولكنها تروق إلى نوعية المستخدمين ذات الاهتمامات المشابهة لاهتماماته.11

العيوب

مشكلة البداية الباردة ربما تُعَد أكثر العيوب شيوعًا لأنظمة التصفية التعاونية. وتحدث هذه المشكلة عندما يدخل مستخدم جديد (أو حتى عنصر جديد) إلى النظام، حيث يؤدي افتقار ذلك المستخدم إلى وجود سجل تفاعل سابق مع العناصر إلى عدم قدرة النظام على تقييم مدى تشابهه أو ارتباطه مع المستخدمين الحاليين. وعلى النقيض من ذلك، تكون أنظمة التصفية القائمة على المحتوى أكثر قدرة على التعامل مع العناصر الجديدة، رغم أنها أيضًا تواجه صعوبة في تقديم توصيات للمستخدمين الجدد.12

ويُشكل تفرُّق البيانات مشكلة رئيسة أخرى قد تؤثر سلبًا على أنظمة التوصيات التعاونية. وكما ذُكر، تفتقر أنظمة التوصيات عادةً إلى البيانات الخاصة بتفضيلات المستخدمين لمعظم العناصر في النظام. ويعني هذا أن معظم مساحة الخصائص في النظام تكون فارغة، وهي حالة تُعرف باسم تفرُّق البيانات. ومع زيادة تفرُّق البيانات، تصبح نقاط المتجه متباينة بدرجة كبيرة، مما يجعل النماذج التنبؤية أقل فعالية في تحديد الأنماط التفسيرية.13 وهذا هو السبب الرئيس لشيوع استخدام تحليل المصفوفة إلى عوامل-وأساليب العوامل الكامنة ذات الصلة مثل تحليل القيمة المفردة (SVD)-في التصفية التعاونية، إذ يخفف هذا من تفرُّق البيانات من خلال تقليل الميزات. وقد تشمل أيضًا الأساليب الأخرى المستخدمة لحل هذه المشكلة قيام المستخدمين أنفسهم بتقييم اهتماماتهم وتقديم معلومات بشأنها، والتي يمكن للنظام استخدامها بعد ذلك لتصفية التوصيات.

الأبحاث الحديثة

بينما تناولت الدراسات السابقة التوصيات بوصفها مشكلة تنبؤ أو تصنيف، تشير مجموعة كبيرة من الأبحاث الحديثة إلى أنها تُفهم على أنها مشكلة تسلسلية لاتخاذ القرار. وفي هذا النموذج، قد يكون التعلم المعزز أكثر ملاءمة لمعالجة التوصية. يعتمد هذا النهج على أن التوصيات تُحدَّث آنيًّا بناءً على تفاعل المستخدم مع العناصر المُقتَرَحة؛ فمع تخطي المستخدم العناصر المُقتَرَحة، أو النقر عليها، أو تقييمها، أو شرائها، يطور النموذج سياسة مثلى من هذا التفاعل للتوصية بعناصر جديدة.14 تقترح الدراسات الحديثة مجموعة متنوعة من تطبيقات التعلم المعزز لمعالجة اهتمامات المستخدمين المتغيرة على المدى الطويل، وهي تحديَّاتٌ تواجه كلًا من التصفية القائمة على المحتوى والتصفية التعاونية.15

حلول ذات صلة
IBM watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai
حلول الذكاء الاصطناعي

استفِد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها التي ستكون بجانبك.

استكشف حلول الذكاء الاصطناعي
الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. توصَّل إلى حلول ذكاء اصطناعي قوية باستخدام واجهات سهلة الاستخدام وتدفقات سير عمل سلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرمجيات وفق معايير الصناعة (SDKs).

استكشف watsonx.ai احجز عرضًا توضيحيًا مباشرًا
الحواشي

“Collaborative Filtering,” Encyclopedia of Machine Learning and Data Mining, Springer, 2017. Mohamed Sarwat and Mohamed Mokbel, “Collaborative Filtering,” Encyclopedia of Database Systems, Springer, 2018.

2 Prem Melville and Vikas Sindhwani, “Recommender Systems,” Encyclopedia of Machine learning and Data Mining, Springer, 2017.

3 YUE SHI, MARTHA LARSON, and ALAN HANJALIC, “Collaborative Filtering beyond the User-Item Matrix: A Survey of the State of the Art and Future Challenges,” ACM Computing Surveys, vol. 47, no. 1, 2014, https://dl.acm.org/doi/10.1145/2556270. Kim Falk, Practical Recommender Systems, Manning Publications, 2019.

4 Elsa Negre, Information and Recommender Systems, Vol. 4, Wiley-ISTE, 2015. Sachi Nandan Mohanty, Jyotir Moy Chatterjee, Sarika Jain, Ahmed A. Elngar, and Priya Gupta, Recommender System with Machine Learning and Artificial Intelligence, Wiley-Scrivener, 2020.

5 Kim Falk, Practical Recommender Systems, Manning Publications, 2019. J. Ben Schafer, Dan Frankowski, Jon Herlocker, and Shilad Sen, “Collaborative Filtering Recommender Systems,” The Adaptive Web: Methods and Strategies of Web Personalization, Springer, 2007.

6 Charu Aggarwal, Recommender Systems: The Textbook, Springer, 2016. Prem Melville and Vikas Sindhwani, “Recommender Systems,” Encyclopedia of Machine Learning and Data Mining, Springer, 2017.

7 Charu Aggarwal, Recommender Systems: The Textbook, Springer, 2016. Kim Falk, Practical Recommender Systems, Manning Publications, 2019.

8 Charu Aggarwal, Recommender Systems: The Textbook, Springer, 2016.

9 Prem Melville and Vikas Sindhwani, “Recommender Systems,” Encyclopedia of Machine Learning and Data Mining, Springer, 2017. Yehuda Koren, Steffen Rendle, and Robert Bell, “Advances in Collaborative Filtering,” Recommender Systems Handbook, 3rd edition, Springer, 2022.

10 Charu Aggarwal, Recommender Systems: The Textbook, Springer, 2016.

11 Sachi Nandan Mohanty, Jyotir Moy Chatterjee, Sarika Jain, Ahmed A. Elngar, and Priya Gupta, Recommender System with Machine Learning and Artificial Intelligence, Wiley-Scrivener, 2020. Charu Aggarwal, Recommender Systems: The Textbook, Springer, 2016.

12 Charu Aggarwal, Recommender Systems: The Textbook, Springer, 2016. Ian Goodfellow, Yoshua Bengio, and Aaron Courville, Deep Learning, MIT Press, 2016.

13 Ian Goodfellow, Yoshua Bengio, and Aaron Courville, Deep Learning, MIT Press, 2016.

14 Guy Shani, David Heckerman, Ronen I. Brafman, “An MDP-Based Recommender System,” Journal of Machine Learning Research, Vol. 6, No. 43, 2005, pp. 1265−1295, https://www.jmlr.org/papers/v6/shani05a.html. Yuanguo Lin, Yong Liu, Fan Lin, Lixin Zou, Pengcheng Wu, Wenhua Zeng, Huanhuan Chen, and Chunyan Miao, “A Survey on Reinforcement Learning for Recommender Systems,” IEEE Transactions on Neural Networks and Learning Systems, 2023, https://ieeexplore.ieee.org/abstract/document/10144689. M. Mehdi Afsar, Trafford Crump, and Behrouz Far, Reinforcement Learning based Recommender Systems: A Survey,” ACM Computing Survey, Vol. 55, No. 7, 2023, https://dl.acm.org/doi/abs/10.1145/3543846.

15 Xinshi Chen, Shuang Li, Hui Li, Shaohua Jiang, Yuan Qi, Le Song, “Generative Adversarial User Model for Reinforcement Learning Based Recommendation System,” Proceedings of the 36th International Conference on Machine LearningPMLR, No. 97, 2019, pp. 1052-1061, http://proceedings.mlr.press/v97/chen19f.html. Liwei Huang, Mingsheng Fu, Fan Li,Hong Qu, Yangjun Liu, and Wenyu Chen, “A deep reinforcement learning based long-term recommender system,” Knowledge-Based Systems, Vol. 213, 2021, https://www.sciencedirect.com/science/article/abs/pii/S0950705120308352.