ما المقصود بالتصفية التعاونية؟

المؤلفين

Jacob Murel Ph.D.

Senior Technical Content Creator

Business Development + Partnerships

IBM Research

ما المقصود بالتصفية التعاونية؟

التصفية التعاونية هي نوع من أنظمة التوصية. وهي تضع المستخدمين في مجموعات بناءً على السلوكيات المماثلة، وتوصي بعناصر جديدة وفقًا لخصائص المجموعة.

التصفية التعاونية هي طريقة لاسترجاع المعلومات ترشح العناصر للمستخدمين استنادًا إلى طريقة تفاعل مستخدمين آخرين ذوي تفضيلات وسلوكيات مماثلة مع تلك العناصر. وبعبارة آخر، تضع خوارزميات التصفية التعاونية المستخدمين في مجموعات بناءً على السلوك وتستخدم خصائص المجموعة العامة للتوصية بعناصر لمستخدم مستهدف. وتعمل أنظمة التوصية التعاونية على مبدأ أن المستخدمين المتشابهين (من حيث السلوك) يتشاركون اهتمامات وأذواقًا مشابهة.¹

مقارنة بين التصفية التعاونية والتصفية القائمة على المحتوى

التصفية التعاونية هي نوع من النوعين الرئيسين لأنظمة التوصية، والنوع الآخر هو أنظمة التوصية القائمة على المحتوى. وتستخدم هذه الطريقة الأخيرة ميزات العنصر للتوصية بعناصر مشابهة لتلك التي تفاعل معها مستخدم معين بشكل إيجابي في الماضي.² وفي حين تركِّز التصفية التعاونية على تشابه المستخدمين للتوصية بالعناصر، فإن التصفية القائمة على المحتوى توصي بالعناصر حصريًّا بناءً على الميزات الواردة في توصيف العنصر. وتستهدف التصفية القائمة على المحتوى تقديم توصيات موجَّهة لتفضيلات مستخدم محدد واحد بدلًا من مجموعة أو نوع كما في التصفية التعاونية.

شهدت كلتا الطريقتين كثير من التطبيقات العملية في السنوات الأخيرة، بدءًا من التجارة الإلكترونية مثل Amazon وصولًا إلى وسائل التواصل الاجتماعي وخدمات البث. وتعمل الأنظمة التعاونية وأنظمة التوصيات القائمة على المحتوى معًا لتشكيل أنظمة توصية هجينة. في الواقع، تبنت Netflix في عام 2009 نظام توصية هجين من خلال مسابقة جائزة Netflix.

أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء

احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.

كيفية عمل التصفية التعاونية

تستخدم التصفية التعاونية مصفوفة لتعيين سلوك المستخدم لكل عنصر في نظامها. ومن ثم، يستخرج النظام القيم من هذه المصفوفة لتحديدها كنقاط بيانات في الفضاء المتجهي. وتُستخدم مقاييس متنوعة لقياس المسافة بين النقاط كوسيلة لحساب تشابه المستخدم-المستخدم والعنصر-العنصر.

مصفوفة تفاعل المستخدم مع العنصر

في إعداد تقليدي للتصفية التعاونية، لدينا مجموعة من المستخدمين n ومجموعة من العناصر x. يُعرَض تفضيل كل مستخدم لكل عنصر في مصفوفة المستخدم-العنصر (يُشار إليها أحيانًا بمصفوفة تصنيف المستخدم). وهنا يتم تمثيل المستخدمين في الصفوف والعناصر في الأعمدة. في مصفوفة R_ij ، تمثل القيمة المعطاة سلوك المستخدم u تجاه العنصر i. قد تكون هذه القيم أرقامًا مطردة يقدمها المستخدمون (مثل التقييمات)، أو قيمًا ثنائية تشير إلى ما إذا كان المستخدم قد شاهد العنصر أو اشتراه. إليك مثال لمصفوفة المستخدم-العنصر لموقع إلكتروني لبيع الكتب:

تعرض هذه المصفوفة تقييمات المستخدمين للكتب المختلفة المتاحة. وتقارن خوارزمية التصفية التعاونية التقييمات التي يقدِّمها المستخدمين لكل كتاب. ومن خلال التعرُّف على المستخدمين أو العناصر المتشابهة بناءً على هذه التقييمات، تتوقع الخوارزمية تقييمات للكتب التي لم يشاهدها المستخدم المستهدف-والتي تتم تطبيقها بالقيم الفارغة في المصفوفة- ويُوصي (أو لا توصي) بتلك الكتب إلى المستخدم المستهدف تبعًا لذلك.

والمصفوفة المستخدمة في هذا المثال مكتملة نظرًا لأنها تقتصر على أربعة مستخدمين وأربعة عناصر. ومع ذلك، في السيناريوهات الواقعية، غالبًا ما تكون تفضيلات المستخدمين المعروفة للعناصر محدودة، ما يجعل مصفوفة المستخدم-العنصر متناثرة.³

مقاييس التشابه

كيف تحدد خوارزمية التوصية التعاونية التشابه بين المستخدمين المختلفين؟ كما ذُكر، فإن القرب في الفضاء المتجهي هو أحد الأساليب الرئيسة. ولكن قد تختلف المقاييس الخاصة المستخدمة لتحديد هذا القرب. من هذه المقاييس اثنان هما تشابه جيب التمام ومعامل ارتباط Pearson.

تشابه جيب التمام

يشير تشابه جيب التمام إلى قياس الزاوية بين متجهين. وتتألف المتجهات الخاضعة للمقارنة من مجموعة فرعية من التقييمات لمستخدم أو عنصر معين، حيث يمكن أن تكون درجة تشابه جيب التمام أي قيمة بين -1 و1. وكلما زادت درجة جيب التمام، زاد تشابه العنصرين. تُوصي بعض المصادر بهذا المقياس لفضاءات الميزات عالية الأبعاد. في التصفية التعاونية، يتم استخراج نقاط المتجه مباشرةً من مصفوفة المستخدم-العنصر. يتم تمثيل تشابه جيب التمام بهذه الصيغة، حيث يشير x وy إلى متجهين في الفضاء المتجه:⁴

معامل ارتباط Pearson (PCC)

يساعد معامل ارتباط Pearson (PCC) في قياس التشابه بين العناصر أو المستخدمين من خلال حساب الارتباط بين التقييمات ذات الصلة لاثنين من المستخدمين أو العناصر. ويتراوح معامل ارتباط Pearson بين -1 و1، وهو ما يشير إلى ارتباط سلبي أو متطابق. وعلى عكس تشابه جيب التمام، يستخدم معامل ارتباط Pearson جميع التقييمات لمستخدم أو عنصر معين. على سبيل المثال، عند حساب معامل الارتباط بيرسون (PCC) بين مستخدمين، نستخدم الصيغة التالية، حيث إن a وb هما مستخدمان مختلفان، وr_ai وr_bi تمثِّل ^{تقييم كل مستخدم للعنصر i}.

أنواع أنظمة التوصية التعاونية

هناك نوعان رئيسان من أنظمة التصفية التعاونية: القائمة على الذاكرة والقائمة على النموذج.

القائمة على الذاكرة

تُعَد أنظمة التوصية القائمة على الذاكرة، أو الأنظمة القائمة على الجار، امتدادًا لمصنِّفات/خوارزميات k-أقرب الجيران لأنها تحاول توقع سلوك المستخدم المستهدف تجاه عنصر معين بناءً على مستخدمين مماثلين أو مجموعة عناصر مماثلة. ويمكن تقسيم الأنظمة القائمة على الذاكرة إلى نوعين فرعيين:

تُوصي التصفية القائمة على المستخدم بعناصر لمستخدم مستهدف بناءً على تفضيلات مستخدمين آخرين ذوي سلوك مشابه. وتقارِن خوارزمية التوصية السلوك السابق للمستخدم المستهدف مع مستخدمين آخرين. وعلى وجه التحديد، يعيِّن النظام لكل مستخدم قيمة تمثِّل التشابه المتصور مع المستخدم المستهدف - يُعرَف هؤلاء بجيران المستخدم المستهدف. ثم يختار النظام n من المستخدمين بأعلى قيمة ويحسب تنبؤًا بسلوك المستخدم المستهدف (على سبيل المثال، تقييم الفيلم، الشراء، عدم الإعجاب، وما إلى ذلك) بناءً على متوسط مرجَّح لسلوك الجيران المختارين. بعد ذلك، يوصي النظام بالعناصر للمستخدم المستهدف بناءً على هذا التنبؤ. وتكمن الفكرة في أنه إذا تصرَّف المستخدم المستهدف بشكل مشابه لهذه المجموعة في الماضي، فسيتصرف بطريقة مماثلة مع العناصر التي لم يشاهدها بعد. تُحسب دوال التشابه القائمة على المستخدم بين الصفوف في مصفوفة user-item.⁶
توصي التصفية القائمة على العناصر بعناصر جديدة لمستخدم مستهدف بناءً على سلوكه تجاه عناصر مماثلة. ولكن لاحِظ أنه عند مقارنة العناصر، لا يقارن النظام التعاوني بين ميزات العناصر (كما هو الحال في التصفية القائمة على المحتوى) بل يقارن كيفية تفاعل المستخدمين مع هذه العناصر. على سبيل المثال، في أحد أنظمة توصية الأفلام، قد تحدِّد الخوارزمية أفلامًا مشابهة بناءً على العلاقات بين جميع تقييمات المستخدمين لكل فيلم (مع تصحيح متوسط تقييم كل مستخدم). ثم يوصي النظام بفيلم جديد للمستخدم المستهدف بناءً على التقييمات المرتبطة. بمعنى آخر، إذا كان المستخدم المستهدف قد قيّم فيلمي a وb بتقييمات عالية ولكنه لم يشاهد الفيلم c بعد، وكان المستخدمون الآخرون الذين قيّموا الفيلمين السابقين بتقييمات عالية قد قيّموا الفيلم c تقييمًا عاليًّا أيضًا، فسوف يوصي النظام المستخدم المستهدف بمشاهدة الفيلم c. وبهذه الطريقة تحسب التصفية القائمة على العنصر تشابه العناصر من خلال سلوك المستخدمين. وتُحسَب دوال التشابه القائمة على العناصر بين الأعمدة في مصفوفة المستخدم-العنصر (user-item).⁷

القائمة على النموذج

في بعض الأحيان، تشير الأدبيات إلى الأساليب القائمة على الذاكرة باعتبارها أساليب تعلم تعتمد على الأمثلة، حيث يشير هذا إلى كيفية إجراء التصفية القائمة على المستخدم والعنصر تنبؤات خاصة بحالة معينة من تفاعل المستخدم-العنصر، مثل تقييم المستخدم المستهدف لفيلم لم يشاهده بعد.

على النقيض من ذلك، فإن الأساليب القائمة على النماذج تُنشئ نموذج تعلُّم آلي تنبؤي للبيانات، حيث يستخدم النموذج القيم الحالية في مصفوفة المستخدم-العنصر كمجموعة بيانات تدريبية، ويُنتج تنبؤات للقيم المفقودة باستخدام النموذج الناتج. وبالتالي، تستخدم الأساليب القائمة على النماذج تقنيات علم البيانات وخوارزميات التعلم الآلي مثل شجرة القرار ومصنِّف Bayes، والشبكات العصبية لتوصية العناصر للمستخدمين.⁸

يُعَد تحليل المصفوفة إلى عوامل هو أحد أكثر أساليب التصفية التعاونية التي تحظى بنقاش واسع، وغالبًا ما تُصَنَّف كنوع من نماذج العوامل الكامنة. وباعتبار تحليل المصفوفة إلى عوامل هو أحد نماذج العوامل الكامنة، يفترض أنه يمكن الوقوف على التشابه بين المستخدمين أو العناصر من خلال عدد محدد من الميزات. على سبيل المثال، يمكن التنبؤ بتقييم المستخدم لكتاب معين باستخدام بيانات مثل نوع الكتاب وعمر المستخدم أو جنسه فقط. وبذلك يهدف هذا التمثيل ذو الأبعاد الأدنى إلى تفسير، على سبيل المثال، تقييمات الكتب عن طريق تصنيف العناصر والمستخدمين بناءً على عدد قليل من الخصائص المختارة المُستَخلَصة من بيانات تعليقات المستخدمين.⁹ نظرًا لأنه يقلل من ميزات مساحة متجه معينة، فإن تحليل المصفوفة إلى عوامل يعمل أيضًا كطريقة لتقليل الأبعاد.¹⁰

Mixture of Experts | 12 ديسمبر، الحلقة 85

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

شاهد جميع حلقات برنامج Mixture of Experts

مميزات التصفية التعاونية وعيوبها

المزايا

مقارنةً بأنظمة التصفية القائمة على المحتوى، تُعَد التصفية التعاونية أكثر فاعلية في تقديم توصيات جديدة للمستخدمين. وتستخلص الأساليب التعاونية التوصيات من مجموعة مستخدمين يشاركون الاهتمامات نفسها مع مستخدم واحد مستهدف. فعلى سبيل المثال، إذا أُعجبت مجموعة من المستخدمين بنفس مجموعة العناصر التي أعجبت المستخدم المستهدف، ولكن أيضًا أعجبهم عنصرًا إضافيًا غير معروف للمستخدم المستهدف لأنه لا يشترك في أي ميزات مع مجموعة العناصر السابقة، فإن نظام التصفية التعاونية يوصي المستخدم بهذا العنصر الجديد. ويمكن للتصفية التعاونية أن توصي بعناصر قد لا يكون المستخدم المستهدف قد أولى لها اعتبارًا من قبل، ولكنها تروق إلى نوعية المستخدمين ذوي الاهتمامات المشابهة لاهتماماته.¹¹

العيوب

مشكلة البدء البارد ربما تُعَد أكثر العيوب شيوعًا لأنظمة التصفية التعاونية. وتحدث هذه المشكلة عندما يدخل مستخدم جديد (أو حتى عنصرًا جديدًا) إلى النظام، حيث يؤدي افتقار ذلك المستخدم إلى وجود سجل تاريخي من التفاعل مع العناصر إلى منع تمكُّن النظام من تقييم مدى تشابهه أو ارتباطه مع المستخدمين الحاليين. وعلى النقيض من ذلك، تكون أنظمة التصفية القائمة على المحتوى أكثر قدرة على التعامل مع العناصر الجديدة، على الرغم من أنها أيضًا تواجه صعوبة في تقديم توصيات للمستخدمين الجُدُد.¹²

ويُعَد تفرُّق البيانات مشكلة رئيسة أخرى قد تؤثِّر سلبًا في أنظمة التوصيات التعاونية. وكما ذُكر، تفتقر أنظمة التوصيات عادةً إلى البيانات الخاصة بتفضيلات المستخدمين لمعظم العناصر في النظام. ويعني هذا أن معظم مساحة الميزات في النظام تكون فارغة، وهي حالة تُعرَف باسم تفرُّق البيانات. ومع زيادة تفرُّق البيانات، تصبح نقاط المتجه متباينة بدرجة كبيرة، ما يجعل النماذج التنبؤية أقل فاعلية في تحديد الأنماط التفسيرية.¹³ وهذا هو السبب الرئيس لشيوع استخدام تحليل المصفوفة إلى عوامل -وأساليب العوامل الكامنة ذات الصلة مثل تحليل القيمة المفردة (SVD)- في التصفية التعاونية، إذ يخفف هذا من تفرُّق البيانات من خلال تقليل الميزات. وقد تشمل أيضًا الأساليب الأخرى المستخدمة لحل هذه المشكلة قيام المستخدمين أنفسهم بتقييم اهتماماتهم وتقديم معلومات بشأنها، والتي يمكن للنظام استخدامها بعد ذلك لتصفية التوصيات.

الأبحاث الحديثة

بينما تناولت الدراسات السابقة التوصيات بوصفها مسألة تنبؤية أو تصنيفية، تدفع مجموعة كبيرة من الأبحاث الحديثة بأنه يتعيَّن فهمها على أنها مشكلة تخص اتخاذ القرار المتسلسل. وفي هذا النموذج، قد يكون التعلم المعزز أكثر ملاءمة لمعالجة التوصية. يعمل هذا النهج على تحديث التوصيات في الوقت الفعلي وفقًا لتفاعل المستخدم مع العناصر؛ فعندما يتخطى المستخدم العناصر المقترحة أو ينقر عليها أو يُقيّمها أو يشتريها، يطوِّر النموذج سياسة مثالية مستمدة من هذه التعليقات من أجل التوصية بعناصر جديدة.¹⁷ تقترح الدراسات الحديثة مجموعة متنوعة من تطبيقات التعلم المعزز التي تُلبي اهتمامات المستخدم المتغيرة على المدى الطويل، والتي تشكِّل تحديات لكلٍّ من التصفية القائمة على المحتوى والتصفية الجماعية.¹⁸

علم البيانات وعمليات التعلم الآلي لقادة البيانات

تعاوَن مع قادة آخرين لتعزيز الركائز الثلاث الأساسية لعمليات التعلم الآلي (MLOps) والذكاء الاصطناعي الجدير بالثقة: الثقة في البيانات والثقة في النماذج والثقة في العمليات.

الموارد

طوِّر مستوى خبرتك في التعلم الآلي

تعلّم المفاهيم الأساسية وطوّر مهاراتك من خلال المختبرات العملية والدورات التدريبية والمشاريع الموجهة والتجارب وغيرها.

أطلق العنان لقوة الذكاء الاصطناعي التوليدي والتعلم الآلي (ML)

تعرّف على كيفية دمج الذكاء الاصطناعي التوليدي والتعلّم الآلي بثقة في أعمالك

شرح التعلم الآلي

يشرح كتاب Techsplainers من IBM أساسيات التعلم الآلي، من المفاهيم الرئيسية إلى حالات الاستخدام الواقعية. حلقات واضحة وقصيرة تساعدك على تعلُّم الأساسيات بسرعة.

التفعيل المثمر للذكاء الاصطناعي: جني الأرباح وعائد الاستثمار باستخدام الذكاء الاصطناعي التوليدي

هل ترغب في زيادة عائد استثماراتك في الذكاء الاصطناعي؟ تعرّف على كيفية تأثير توسيع نطاق الذكاء الاصطناعي التوليدي في المجالات الرئيسية، من خلال مساعدة أفضل العقول لديك على وضع حلول مبتكرة جديدة وطرحها.

كيفية اختيار نموذج الأساس المناسب

تعرّف على كيفية اختيار نموذج أساس الذكاء الاصطناعي الأكثر ملاءمة لحالة الاستخدام الخاصة بك.

استكشف IBM Granite

تُعَد IBM® Granite مجموعة من نماذج الذكاء الاصطناعي المفتوحة والموثوق بها وذات الأداء العالي والتي تم تصميمها خصيصًا للأعمال وجرى الارتقاء بها على النحو الأمثل لتوسيع نطاق تطبيقات الذكاء الاصطناعي لديك. استكشِف خيارات اللغة والتعليمات البرمجية والسلاسل الزمنية وآليات الحماية.

كيف تزدهر في عصر الذكاء الاصطناعي الجديد بثقة وثبات

تعمّق في العناصر الثلاثة ذات الأهمية البالغة لإستراتيجية الذكاء الاصطناعي القوية: إنشاء ميزة تنافسية، وتوسيع نطاق الذكاء الاصطناعي عبر الأعمال، وتطوير الذكاء الاصطناعي الجدير بالثقة.

حلول ذات صلة

IBM watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai

حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي

الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي

اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. تمكَّن من إنتاج حلول ذكاء اصطناعي قوية بفضل الواجهات سهلة الاستخدام وعمليات سير العمل السلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرامج القياسية في الصناعة.

ما المقصود بالتصفية التعاونية؟

ما المقصود بالتصفية التعاونية؟

مقارنة بين التصفية التعاونية والتصفية القائمة على المحتوى

أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء

شكرًا لك! لقد اشتركت بنجاح.

كيفية عمل التصفية التعاونية

مصفوفة تفاعل المستخدم مع العنصر

مقاييس التشابه

تشابه جيب التمام

معامل ارتباط Pearson (PCC)

أنواع أنظمة التوصية التعاونية

القائمة على الذاكرة

القائمة على النموذج

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

مميزات التصفية التعاونية وعيوبها

المزايا

العيوب

الأبحاث الحديثة

الموارد