التصفية التعاونية هي أحد أساليب أنظمة التوصية، حيث تجمع المستخدمين في مجموعات بناءً على سلوكياتهم المتشابهة، ثم توصي بعناصر جديدة وفقًا لخصائص كل مجموعة.
التصفية التعاونية هي طريقة لاسترجاع المعلومات ترشح العناصر للمستخدمين استنادًا إلى طريقة تفاعل مستخدمين آخرين ذوي تفضيلات وسلوكيات مماثلة مع تلك العناصر. وبعبارة آخر، تضع خوارزميات التصفية التعاونية المستخدمين في مجموعات بناءً على سلوكهم، ثم تستخدم الخصائص العامة لكل مجموعة للتوصية بالعناصر للمستخدم المستهدف. وتعتمد أنظمة التوصية التعاونية على مبدأ أن المستخدمين المتشابهين (من حيث السلوك) يميلون إلى مشاركة اهتمامات وأذواق متشابهة.1
التصفية التعاونية هي أحد النوعين الرئيسيين لأنظمة التوصية، والنوع الآخر هو أنظمة التوصية القائمة على المحتوى. وتستخدم هذه الطريقة الأخيرة ميزات العنصر للتوصية بعناصر مشابهة لتلك التي تفاعل معها المستخدم بشكل إيجابي في السابق.2 وبينما تركز التصفية التعاونية على تشابه المستخدمين للتوصية بالعناصر، فإن التصفية القائمة على المحتوى توصي بالعناصر بناءً فقط على الميزات الواردة في توصيف العنصر. كما أن التصفية القائمة على المحتوى تقدم توصيات مخصصة لمستخدم معين بناءً على تفضيلاته الشخصية بدلًا من الاعتماد على مجموعة معينة أو نوع معين كما هو الحال في التصفية التعاونية.
شهد كلا الأسلوبين العديد من التطبيقات العملية في السنوات الأخيرة، بدءًا من التجارة الإلكترونية مثل Amazon مرورًا بوسائل التواصل الاجتماعي، ووصولًا إلى خدمات البث. وتعمل الأنظمة التعاونية وأنظمة التوصية القائمة على المحتوى معًا لتشكيل أنظمة توصية هجينة. في الواقع، تبنت Netflix في عام 2009 نظام توصية هجين من خلال مسابقة جائزة Netflix.
تستخدم التصفية التعاونية مصفوفة لتعيين سلوك المستخدم لكل عنصر في نظامها. ومن ثم، يستخرج النظام القيم من هذه المصفوفة وتمثيلها كنقاط بيانات في الفضاء المتجهي. وتُستخدم مقاييس متنوعة لقياس المسافة بين النقاط بهدف حساب تشابه المستخدم مع المستخدم وتشابه العنصر مع العنصر.
في الإعداد القياسي للتصفية التعاونية، لدينا مجموعة n من المستخدمين ومجموعة x من العناصر. يتم عرض تفضيل كل مستخدم لكل عنصر في مصفوفة تفاعل المستخدم مع العنصر (تسمى أحيانا مصفوفة تقييم المستخدم). في هذه المصفوفة، يتم تمثيل المستخدمين في الصفوف والعناصر في الأعمدة. وفي مصفوفة Rij ، تمثل قيمة معينة سلوك المستخدم u تجاه العنصر i. قد تكون هذه القيم أرقاما مطردة يقدمها المستخدمون (مثل التقييمات) أو قيما ثنائية تشير إلى ما إذا كان مستخدم معين قد شاهد العنصر أو اشتراه. فيما يلي مثال على مصفوفة وقت تفاعل المستخدم لموقع ويب لبيع الكتب:
تعرض هذه المصفوفة تقييمات المستخدمين للكتب المختلفة المتاحة. وتقارن خوارزمية التصفية التعاونية التقييمات التي يقدمها المستخدمون لكل كتاب. من خلال التعرف على المستخدمين أو العناصر المتشابهة بناءً على هذه التقييمات، تتوقع الخوارزمية تقييمات للكتب التي لم يطلع عليها المستخدم المستهدف-والممثلة بالقيم الفارغة (null) في المصفوفة-ثم تُوصي (أو لا توصي) بتلك الكتب إلى المستخدم المستهدف تبعًا لذلك.
والمصفوفة المستخدمة في هذا المثال مكتملة نظرًا لأنها تقتصر على أربعة مستخدمين وأربعة عناصر. ولكن في السيناريوهات الواقعية، غالبًا ما تكون تفضيلات المستخدمين المعروفة للعناصر محدودة، مما يؤدي إلى انخفاض الكثافة في مصفوفة تفاعل المستخدم مع العنصر.3
كيف تحدد خوارزمية التوصية التعاونية التشابه بين المستخدمين المختلفين؟ كما ذُكر، فإن القرب في الفضاء المتجهي هو أحد الأساليب الرئيسة، لكن المقاييس الخاصة المستخدمة لتحديد هذا القرب قد تختلف. ومن بين هذه المقاييس تشابه جيب التمام ومعامل ارتباط Pearson.
يشير تشابه جيب التمام إلى قياس الزاوية بين متجهين. وتتألف المتجهات المقارنة من مجموعة فرعية من التقييمات لمستخدم أو عنصر معين. ويمكن أن تكون درجة تشابه جيب التمام أي قيمة بين -1 و1. فكلما زادت درجة جيب التمام، زاد تشابه العنصرين. توصي بعض المصادر بهذا المقياس لفضاءات الميزات عالية الأبعاد. في التصفية التعاونية، يتم استخراج نقاط المتجه مباشرةً من مصفوفة تفاعل المستخدم مع العنصر. ويُمَثَّل تشابه جيب التمام بهذه الصيغة، حيث يشير كل من x و y إلى متجهين في الفضاء المتجهي:4
يساعد معامل ارتباط Pearson (PCC) في قياس التشابه بين العناصر أو المستخدمين من خلال حساب الارتباط بين التقييمات الخاصة بمستخدميْن أو عنصرين. ويتراوح معامل ارتباط Pearson بين -1 و1، مما يشير إلى ارتباط سلبي أو متطابق. وعلى عكس تشابه جيب التمام، يستخدم معامل ارتباط Pearson جميع التقييمات المتاحة لمستخدم أو عنصر معين. على سبيل المثال، عند حساب معامل ارتباط Pearson بين مستخدمين، فإننا نستخدم الصيغة التالية، حيث يمثل a وb مستخدميْن مختلفيْن، وrai وrbi تقييم المستخدم للعنصر i:5
هناك نوعان رئيسان من أنظمة التصفية التعاونية: أنظمة التوصية القائمة على الذاكرة وأنظمة التوصية القائمة على النموذج.
أنظمة التوصية القائمة على الذاكرة، أو الأنظمة القائمة على الجار، هي امتدادات لمصنِّفات/خوارزميات الجار الأقرب (KNN)، لأنها تحاول توقع سلوك المستخدم المستهدف تجاه عنصر معين بناءً على مستخدمين مماثلين أو مجموعة عناصر مماثلة. ويمكن تقسيم الأنظمة القائمة على الذاكرة إلى نوعين فرعيين:
في بعض الأحيان، تشير الأدبيات إلى الأساليب القائمة على الذاكرة باعتبارها أساليب تعلم تعتمد على الأمثلة، حيث يعكس ذلك كيفية قيام التصفية القائمة على المستخدم والعنصر بإجراء تنبؤات لحالة معينة من تفاعل المستخدم مع العنصر، مثل تقييم المستخدم المستهدف لفيلم لم يشاهده بعد.
وعلى النقيض من ذلك، فإن الأساليب القائمة على النموذج تنشئ نموذجًا تنبؤيًا للتعلم الآلي يعتمد على البيانات. يستخدم النموذج القيم الحالية في مصفوفة تفاعل المستخدم مع العنصر كمجموعة بيانات تدريب، ثم ينتج تنبؤات للقيم المفقودة بناءً على النموذج المُدرَّب. وبالتالي تستخدم الأساليب القائمة على النماذج تقنيات علم البيانات وخوارزميات التعلم الآلي مثل أشجار القرار ومصنفات Bayes والشبكة العصبية للتوصية بالعناصر للمستخدمين.8
يُعد تحليل المصفوفة إحدى طرق التصفية التعاونية التي نوقشت على نطاق واسع، وغالبًا ما يُصنَّف كنموذج من نماذج العوامل الكامنة. وباعتبار تحليل المصفوفة إلى عوامل هو أحد نماذج العوامل الكامنة، يفترض أن التشابه بين المستخدمين أو بين العناصر يمكن تحديده من خلال عدد محدد من الميزات. على سبيل المثال، يمكن التنبؤ بتقييم المستخدم لكتاب معين باستخدام بيانات مثل نوع الكتاب وعمر المستخدم أو جنسه فقط. وبالتالي يهدف هذا التمثيل منخفض الأبعاد إلى تفسير، على سبيل المثال، تقييمات الكتب من خلال تصنيف العناصر والمستخدمين بناءً على عدد محدود من الميزات المستمدة من بيانات تعليقات المستخدمين.9 نظرًا لأنه يقلل من عدد الميزات في مساحة متجهة معينة، يعمل تحليل المصفوفة أيضًا كطريقة لتقليل الأبعاد.10
مقارنةً بأنظمة التصفية القائمة على المحتوى، تُعَد التصفية التعاونية أكثر فعالية في تقديم توصيات جديدة للمستخدمين. وتستخلص الأساليب التعاونية التوصيات من مجموعة مستخدمين يشاركون نفس الاهتمامات مع مستخدم واحد مستهدف. فعلى سبيل المثال، إذا أعجبت مجموعة من المستخدمين نفس مجموعة العناصر التي أعجبت المستخدم المستهدف، ولكنهم أُعجبوا أيضًا بعنصر إضافي غير معروف للمستخدم المستهدف لعدم اشتراكه في أي ميزات مع العناصر السابقة، فإن نظام التصفية التعاونية يوصي المستخدم بهذا العنصر الجديد. ويمكن للتصفية التعاونية أن توصي بعناصر قد لا يكون المستخدم المستهدف قد نظر إليها من قبل، ولكنها تروق إلى نوعية المستخدمين ذات الاهتمامات المشابهة لاهتماماته.11
مشكلة البداية الباردة ربما تُعَد أكثر العيوب شيوعًا لأنظمة التصفية التعاونية. وتحدث هذه المشكلة عندما يدخل مستخدم جديد (أو حتى عنصر جديد) إلى النظام، حيث يؤدي افتقار ذلك المستخدم إلى وجود سجل تفاعل سابق مع العناصر إلى عدم قدرة النظام على تقييم مدى تشابهه أو ارتباطه مع المستخدمين الحاليين. وعلى النقيض من ذلك، تكون أنظمة التصفية القائمة على المحتوى أكثر قدرة على التعامل مع العناصر الجديدة، رغم أنها أيضًا تواجه صعوبة في تقديم توصيات للمستخدمين الجدد.12
ويُشكل تفرُّق البيانات مشكلة رئيسة أخرى قد تؤثر سلبًا على أنظمة التوصيات التعاونية. وكما ذُكر، تفتقر أنظمة التوصيات عادةً إلى البيانات الخاصة بتفضيلات المستخدمين لمعظم العناصر في النظام. ويعني هذا أن معظم مساحة الخصائص في النظام تكون فارغة، وهي حالة تُعرف باسم تفرُّق البيانات. ومع زيادة تفرُّق البيانات، تصبح نقاط المتجه متباينة بدرجة كبيرة، مما يجعل النماذج التنبؤية أقل فعالية في تحديد الأنماط التفسيرية.13 وهذا هو السبب الرئيس لشيوع استخدام تحليل المصفوفة إلى عوامل-وأساليب العوامل الكامنة ذات الصلة مثل تحليل القيمة المفردة (SVD)-في التصفية التعاونية، إذ يخفف هذا من تفرُّق البيانات من خلال تقليل الميزات. وقد تشمل أيضًا الأساليب الأخرى المستخدمة لحل هذه المشكلة قيام المستخدمين أنفسهم بتقييم اهتماماتهم وتقديم معلومات بشأنها، والتي يمكن للنظام استخدامها بعد ذلك لتصفية التوصيات.
بينما تناولت الدراسات السابقة التوصيات بوصفها مشكلة تنبؤ أو تصنيف، تشير مجموعة كبيرة من الأبحاث الحديثة إلى أنها تُفهم على أنها مشكلة تسلسلية لاتخاذ القرار. وفي هذا النموذج، قد يكون التعلم المعزز أكثر ملاءمة لمعالجة التوصية. يعتمد هذا النهج على أن التوصيات تُحدَّث آنيًّا بناءً على تفاعل المستخدم مع العناصر المُقتَرَحة؛ فمع تخطي المستخدم العناصر المُقتَرَحة، أو النقر عليها، أو تقييمها، أو شرائها، يطور النموذج سياسة مثلى من هذا التفاعل للتوصية بعناصر جديدة.14 تقترح الدراسات الحديثة مجموعة متنوعة من تطبيقات التعلم المعزز لمعالجة اهتمامات المستخدمين المتغيرة على المدى الطويل، وهي تحديَّاتٌ تواجه كلًا من التصفية القائمة على المحتوى والتصفية التعاونية.15
لقد استطلعنا آراء 2000 مجموعة حول مبادرات الذكاء الاصطناعي لديها لمعرفة ما ينجح وما لا ينجح وكيف يمكنك المضي قدمًا.
IBM Granite هي مجموعة من نماذج الذكاء الاصطناعي المفتوحة والموثوق بها وذات الأداء العالي والتي صُمِمَت خصيصًا للأعمال وجرى الارتقاء بها على النحو الأمثل لتوسيع نطاق تطبيقات الذكاء الاصطناعي لديك. استكشف خيارات اللغة والتعليمات البرمجية والسلاسل الزمنية والدرابزين.
اطّلع على كتالوجنا الشامل الذي يضم أكثر من 100 دورة تدريبية عبر الإنترنت من خلال شراء اشتراك فردي أو متعدد المستخدمين اليوم، سيتيح لك هذا توسيع نطاق مهاراتك عبر مجموعة من منتجاتنا، وكل ذلك بسعر واحد مُغرٍ.
وقد صُمم المنهج، الذي يقوده كبار قادة الفكر لدى IBM، لمساعدة قادة الأعمال على اكتساب المعرفة اللازمة لتحديد أولويات استثمارات الذكاء الاصطناعي التي يمكن أن تدفع عجلة النمو.
هل ترغب في زيادة عائد استثماراتك في الذكاء الاصطناعي؟ تعرّف على كيفية تأثير توسيع نطاق الذكاء الاصطناعي التوليدي في المجالات الرئيسية، من خلال مساعدة أفضل العقول لديك على وضع حلول مبتكرة جديدة وطرحها.
تعرّف على كيفية دمج الذكاء الاصطناعي التوليدي والتعلّم الآلي بثقة في أعمالك
تعمّق في العناصر الثلاثة ذات الأهمية البالغة لإستراتيجية الذكاء الاصطناعي القوية: إنشاء ميزة تنافسية، وتوسيع نطاق الذكاء الاصطناعي عبر الأعمال، وتطوير الذكاء الاصطناعي الجدير بالثقة.
1 “Collaborative Filtering,” Encyclopedia of Machine Learning and Data Mining, Springer, 2017. Mohamed Sarwat and Mohamed Mokbel, “Collaborative Filtering,” Encyclopedia of Database Systems, Springer, 2018.
2 Prem Melville and Vikas Sindhwani, “Recommender Systems,” Encyclopedia of Machine learning and Data Mining, Springer, 2017.
3 YUE SHI, MARTHA LARSON, and ALAN HANJALIC, “Collaborative Filtering beyond the User-Item Matrix: A Survey of the State of the Art and Future Challenges,” ACM Computing Surveys, vol. 47, no. 1, 2014, https://dl.acm.org/doi/10.1145/2556270. Kim Falk, Practical Recommender Systems, Manning Publications, 2019.
4 Elsa Negre, Information and Recommender Systems, Vol. 4, Wiley-ISTE, 2015. Sachi Nandan Mohanty, Jyotir Moy Chatterjee, Sarika Jain, Ahmed A. Elngar, and Priya Gupta, Recommender System with Machine Learning and Artificial Intelligence, Wiley-Scrivener, 2020.
5 Kim Falk, Practical Recommender Systems, Manning Publications, 2019. J. Ben Schafer, Dan Frankowski, Jon Herlocker, and Shilad Sen, “Collaborative Filtering Recommender Systems,” The Adaptive Web: Methods and Strategies of Web Personalization, Springer, 2007.
6 Charu Aggarwal, Recommender Systems: The Textbook, Springer, 2016. Prem Melville and Vikas Sindhwani, “Recommender Systems,” Encyclopedia of Machine Learning and Data Mining, Springer, 2017.
7 Charu Aggarwal, Recommender Systems: The Textbook, Springer, 2016. Kim Falk, Practical Recommender Systems, Manning Publications, 2019.
8 Charu Aggarwal, Recommender Systems: The Textbook, Springer, 2016.
9 Prem Melville and Vikas Sindhwani, “Recommender Systems,” Encyclopedia of Machine Learning and Data Mining, Springer, 2017. Yehuda Koren, Steffen Rendle, and Robert Bell, “Advances in Collaborative Filtering,” Recommender Systems Handbook, 3rd edition, Springer, 2022.
10 Charu Aggarwal, Recommender Systems: The Textbook, Springer, 2016.
11 Sachi Nandan Mohanty, Jyotir Moy Chatterjee, Sarika Jain, Ahmed A. Elngar, and Priya Gupta, Recommender System with Machine Learning and Artificial Intelligence, Wiley-Scrivener, 2020. Charu Aggarwal, Recommender Systems: The Textbook, Springer, 2016.
12 Charu Aggarwal, Recommender Systems: The Textbook, Springer, 2016. Ian Goodfellow, Yoshua Bengio, and Aaron Courville, Deep Learning, MIT Press, 2016.
13 Ian Goodfellow, Yoshua Bengio, and Aaron Courville, Deep Learning, MIT Press, 2016.
14 Guy Shani, David Heckerman, Ronen I. Brafman, “An MDP-Based Recommender System,” Journal of Machine Learning Research, Vol. 6, No. 43, 2005, pp. 1265−1295, https://www.jmlr.org/papers/v6/shani05a.html. Yuanguo Lin, Yong Liu, Fan Lin, Lixin Zou, Pengcheng Wu, Wenhua Zeng, Huanhuan Chen, and Chunyan Miao, “A Survey on Reinforcement Learning for Recommender Systems,” IEEE Transactions on Neural Networks and Learning Systems, 2023, https://ieeexplore.ieee.org/abstract/document/10144689. M. Mehdi Afsar, Trafford Crump, and Behrouz Far, Reinforcement Learning based Recommender Systems: A Survey,” ACM Computing Survey, Vol. 55, No. 7, 2023, https://dl.acm.org/doi/abs/10.1145/3543846.
15 Xinshi Chen, Shuang Li, Hui Li, Shaohua Jiang, Yuan Qi, Le Song, “Generative Adversarial User Model for Reinforcement Learning Based Recommendation System,” Proceedings of the 36th International Conference on Machine Learning, PMLR, No. 97, 2019, pp. 1052-1061, http://proceedings.mlr.press/v97/chen19f.html. Liwei Huang, Mingsheng Fu, Fan Li,Hong Qu, Yangjun Liu, and Wenyu Chen, “A deep reinforcement learning based long-term recommender system,” Knowledge-Based Systems, Vol. 213, 2021, https://www.sciencedirect.com/science/article/abs/pii/S0950705120308352.