التصفية القائمة على المحتوى هي أحد نوعين أساسيين لأنظمة التوصية. فهي توصي بالعناصر للمستخدمين وفقًا لميزات كل منتج على حدة.
التصفية القائمة على المحتوى هي أحد أساليب استرجاع المعلومات وتستخدم أوصاف العناصر لاختيار العناصر ذات الصلة باستعلام المستخدم وعرضها. غالبًا ما يراعي هذا الأسلوب أوصاف العناصر الأخرى التي يعبر المستخدم عن اهتمامه بها.1 لكن تسمية الأسلوب بالقائم على المحتوى هي تسمية خاطئة بعض الشيء. بعض خوارزميات التوصية القائمة على المحتوى تتطابق مع العناصر حسب العناصر الوصفية (على سبيل المثال، البيانات الوصفية) المرتبطة بها بدلاً من المحتوى الفعلي للعنصر.2 ومع ذلك، فإن العديد من الأساليب القائمة على المحتوى - مثل البحث القائم على المحتوى عن الصور أو تطبيقات معالجة اللغة الطبيعية - تُطابق العناصر وفقًا لسمات العناصر الجوهرية.
التصفية القائمة على المحتوى هي أحد نوعين أساسيين من أنواع أنظمة التوصية. أما النوع الآخر فهو أسلوب التصفية الجماعية. ويقسم هذا النهج الأخير المستخدمين إلى مجموعات مختلفة بناءً على سلوكهم. وباستخدام خصائص المجموعة العامة، فإنه يعرض عناصرًا معينة للمجموعة بأكملها على أساس أن المستخدمين المتشابهين (من حيث السلوك) يهتمون بالعناصر المتشابهة.3
شهد كلا الأسلوبين كثير من التطبيقات العملية في السنوات الأخيرة، بدءًا من التجارة الإلكترونية مثل Amazon وصولًا إلى وسائل التواصل الاجتماعي وخدمات البث. وتعمل الأنظمة التعاونية وأنظمة التوصيات القائمة على المحتوى معًا لتشكيل أنظمة توصية هجينة. في الواقع، تبنت Netflix في عام 2009 نظام توصية هجين من خلال مسابقة جائزة Netflix.
تدمج أنظمة التوصية القائمة على المحتوى (CBRS) خوارزميات التعلم الآلي وتقنيات علوم البيانات للتوصية بعناصر جديدة والإجابة على الاستفسارات.
في أنظمة التوصية القائمة على المحتوى (CBRS)، يقارن محرك التوصية بشكل أساسي بين ملف تعريف المستخدم وملف تعريف العنصر للتنبؤ بتفاعل المستخدم مع العنصر وتقديم توصيات بالعناصر وفقًا لذلك.
في كثير من الأحيان تمثل أنظمة التوصية القائمة على المحتوى (CBR) العناصر والمستخدمين كتضمينات في فضاء متجهي. وتُحوَّل العناصر إلى متجهات باستخدام الأوصاف التي تقدمها البيانات الوصفية أو المواصفات الداخلية كميزات. على سبيل المثال، لنفترض أننا نبني ملفات تعريف للعنصر للتوصية بروايات جديدة للمستخدمين كجزء من متجر كتب على الإنترنت. ثم ننشئ ملفات تعريف لكل رواية باستخدام البيانات الوصفية الممثلة لها مثل المؤلف والنوع الأدبي وما إلى ذلك. يمكن تمثيل القيمة الخاصة بالرواية لفئة معينة باستخدام القيم المنطقية (Boolean)، حيث تشير القيمة 1 إلى أن الرواية تندرج ضمن تلك الفئة، والقيمة 0 إلى عدم وجودها. وباستخدام هذا النظام، يمكننا تمثيل مجموعة صغيرة من الروايات وفقًا للنوع الأدبي:
فهنا يمثل كل نوع أدبي بُعدًا مختلفًا في الفضاء المتجهي الخاص بنا، وتُعبر القيم الخاصة بكل رواية عن موقعها في ذلك الفضاء المتجهي. على سبيل المثال، توجد رواية "Little Women [نساء صغيرات]" عند (1,0,1)، ورواية "Northanger Abbey [دير نورثانجر]" عند (0,0,1)، وهكذا. ويمكننا تصور هذا الفضاء المتجهي للعينة على النحو التالي:
كلما اقتربت متجهات الروايتين من بعضها في فضاء المتجهات، قدّر النظام أن تلك الروايتين أكثر تشابهًا وفقًا للأوصاف المقدمة.5 على سبيل المثال، تتشارك روايتا "Peter Pan [بيتر بان]" و"Treasure Island [جزيرة الكنز]" تمامًا في عناصرهما، حيث تقعان في النقطة المتجهية نفسها (1,1,0). ووفقًا لنظامنا، فإنهما متطابقتان. وهما في الواقع تتشاركان العديد من عناصر الحبكة (مثل الجزر المعزولة والقراصنة) والأفكار (مثل النمو أو المقاومة). وعلى النقيض من ذلك، على الرغم من أن رواية Little Women هي أيضًا رواية موجهة للأطفال، فإنها ليست رواية مغامرات بل تُعد رواية تربوية (رواية تطور الشخصية). ورغم أن رواية Little Women تُعد رواية أطفال مثل رواية Peter Pan وTreasure Island، فإنها تفتقر إلى القيم الشكلية المتعلقة بالمغامرة، وتملك قيمة شكلية 1 كرواية تربوية، والتي تفتقر إليها الروايتان الأخريان. وهذا يجعل رواية Little Women أقرب إلى رواية Northanger Abbey في فضاء المتجهات، إذ تتشاركان نفس القيم الشكلية المتعلقة بالمغامرة والخصائص التربوية.
ونظرًا لتشابههما في هذا الفضاء، فإذا كان المستخدم قد اشترى رواية Peter Pan من قبل، فإن النظام سيوصي ذلك المستخدم بالروايات الأقرب إلى رواية Peter Pan – مثل Treasure Island – كشراء محتمل في المستقبل. ولاحظ أنه إذا أضفنا المزيد من الروايات والسمات القائمة على النوع (مثل الخيال، والقوطية، وما إلى ذلك)، فإن مواقع الرواية في الفضاء المتجهي ستتحرك. على سبيل المثال، إذا أضفنا بعدًا لنوع الخيال، فقد تتحرك روايتا Peter Pan وTreasure Island بشكل طفيف/هامشي عن بعضهما البعض، إذ تُعتبر الأولى رواية يغلب عليها الخيال بينما الثانية ليست كذلك.
لاحظ أيضًا أنه يمكن إنشاء متجهات للعناصر باستخدام المواصفات الداخلية للعناصر كمميزات. على سبيل المثال، يمكننا تحويل عناصر النصوص غير المنسقة (مثل المقالات الإخبارية) إلى تنسيق منظم وتحديد موقعها في فضاء متجهات، مثل "نموذج حقيبة الكلمات". وفي هذا النهج، تصبح كل كلمة مستخدمة في مجموعة النصوص ذات بُعد مختلف في فضاء المتجهات، وتظهر المقالات التي تتشابه كلماتها الرئيسية أقرب إلى بعضها في فضاء المتجهات.
كيف يحدد نظام التصفية القائم على المحتوى التشابه بين أي عدد من العناصر؟ كما ذُكر، فإن القرب في الفضاء المتجهي هو أحد الأساليب الرئيسة. ولكن قد تختلف المقاييس الخاصة المستخدمة لتحديد ذلك القرب. وتتضمن المقاييس الشائعة ما يلي:
يشير تشابه جيب التمام إلى قياس الزاوية بين متجهين. ويمكن أن تكون قيمته أي قيمة بين -1 و1. فكلما زادت درجة جيب التمام، دل ذلك على زيادة التشابه بين العنصرين. توصي بعض المصادر باستخدام هذا المقياس لفضاءات العناصر مرتفعة الأبعاد. يتمثل تشابه جيب التمام بالصيغة التالية، حيث تشير x وy إلى متجهين للعناصر في فضاء المتجهات:7
تقيس المسافة الإقليدية طول قطعة مستقيمة افتراضية تربط بين نقطتين من نقاط المتجهات. وقد تنخفض درجات المسافة الإقليدية حتى تصل إلى الصفر من دون حد أقصى. وكلما قلت المسافة الإقليدية بين متجهي عنصرين، زاد تشابههما. تُحسب المسافة الإقليدية بالصيغة التالية، حيث تشير x وy إلى متجهين للعناصر:8
الضرب القياسي هو حاصل ضرب جيب تمام الزاوية بين متجهين والمقدار الإقليدي لكل متجه من نقطة الأصل المحددة. بعبارة أخرى، هو جيب تمام متجهين مضروب في الطول المتوقع لكل منهما - الطول هو مقدار إزاحة المتجه عن نقطة الأصل المحددة، مثل النقطة (0،0). ويُعد الضرب القياسي هو الأفضل للاستخدام في مقارنة العناصر ذات المقادير المختلفة بشكل ملحوظ - على سبيل المثال عند التفكير في مقدار شعبية الكتب أو الأفلام. ويتمثل بالصيغة التالية، حيث يشير d وq مرة أخرى إلى متجهين للعناصر:9
لاحظ أن هذه المقاييس تتأثر بأوزان المتجهات المقارنة، حيث يمكن أن تؤثر الأوزان المختلفة بشكل كبير في دوال التقييم هذه.10 ومن المقاييس المحتملة أيضًا لتحديد مدى تشابه المتجهات هي معامل ارتباط Pearson (أو ارتباط بيرسون) وتشابه Jaccard ومؤشر النرد.11
تُنشئ أنظمة التوصية القائمة على المحتوى نموذج تصنيفي أو انحداري مستند إلى المستخدم لترشيح عناصر معينة لمستخدم معين. في البداية، تأخذ الخوارزمية الأوصاف والأوصاف المتعلقة بتلك العناصر التي أبدى مستخدم معين اهتمامًا بها في وقت سابق - وهذا هو ملف تعريف المستخدم. وتشكل هذه العناصر مجموعة البيانات التدريبية التي تُستَخدَم لإنشاء نموذج تصنيف أو انحدار خاص بذلك المستخدم. وفي هذا النموذج، تمثل سمات العناصر المتغيرات المستقلة، بينما يمثل سلوك المستخدم (مثل تقييمات المستخدم، والإعجابات، والمشتريات، وما إلى ذلك) المتغير التابع. يهدف النموذج المُدرّب على السلوك السابق إلى التنبؤ بسلوك المستخدم المستقبلي للعناصر الممكنة والتوصية بالعناصر حسب التنبؤ.12
تكمن مشكلة البداية الباردة بشكل أساسي في كيفية تعامل النظام مع المستخدمين الجدد أو العناصر الجديدة. إذ يشكل كل منهما تحديًّا في التصفية الجماعية، لأنها توصي بالعناصر عن طريق تقسيم المستخدمين إلى مجموعات بناءً على التشابهات المُستَنتَجة فيما يتعلق بالسلوك والتفضيلات. والمستخدمون الجدد لا يكون لديهم سجلاً يوضح تشابههم مع الآخرين، والعناصر الجديدة لم تحظى بالتفاعل الكافي من المستخدمين (مثل التقييمات) حتى يتم التوصية بها. وبينما تواجه التصفية القائمة على المحتوى صعوبة في التعامل مع المستخدمين الجدد، إلا إنها تتعامل ببراعة مع دمج العناصر الجديدة. ويرجع ذلك إلى أنها تعتمد في التوصية بالعناصر على الخصائص الداخلية أو البيانات الوصفية وليس على تفاعل المستخدم في وقت سابق.13
وتتيح التصفية القائمة على المحتوى درجة أعلى من الشفافية من خلال تقديم أوصاف قابلة للتفسير تشرح سبب التوصيات. فعلى سبيل المثال، قد يوضح نظام التوصية بالأفلام سبب التوصية بفيلم معين، مثل تشابه النوع أو الممثلين مع أفلام شاهدها المستخدم في وقت سابق. ومن ثَم، يمكن للمستخدم اتخاذ قرارات أكثر استنارة حول ما إذا كان سيشاهد الفيلم المقترح أم لا.14
ومن العيوب الرئيسة للتوصية القائمة على المحتوى محدودية العناصر. فالتوصيات القائمة على المحتوى مستمدة حصريًا من أوصاف العناصر. ومع ذلك، قد لا تعكس أوصاف العناصر الموجودة في النظام ما يفضله المستخدم. فمثلاً، إذا عدنا إلى مثال نظام التوصية بالأفلام، لنفترض أن مستخدمًا شاهد فيلم Gaslight الذي أُنتِج في عام 1944 وأعجبه. فقد يرشح نظام التوصية القائمة على المحتوى أفلامًا أخرى من إخراج George Cukor أو بطولة Ingrid Bergman، ولكن قد لا تكون هذه الأفلام مشابهة لفيلم Gaslight. وإذا كان المستخدم يفضل عنصرًا محددًا من الحبكة (على سبيل المثال، الزوج الخائن) أو عنصرًا في الإنتاج (مثل المصور السينمائي) غير موضح في ملف تعريف العناصر، فلن يقدم النظام توصيات مناسبة. لا يمكن تحقيق التمييز الدقيق بين ما قد يعجب المستخدم وما قد لا يعجبه بناءً على القليل من البيانات.15
ونظرًا إلى أن التوصية القائمة على المحتوى توصي بالعناصر بناءً على اهتمامات المستخدم المثبتة سابقًا فقط، فإن التوصيات غالبًا ما تكون مشابهة للعناصر التي أعجبت المستخدم في وقت سابق. وبعبارة أخرى، تفتقر أنظمة التوصية القائمة على المحتوى إلى وجود منهجية لاستكشاف الجديد وغير المتوقع. وهذا هو ما يُعرف بالتخصيص المفرط. في المقابل، وحيث أن الأساليب الجماعية تستمد التوصيات من مجموعة من المستخدمين الذين لديهم اهتمامات مشابهة لمستخدم معين، فإنها قد توصي بعناصر قد لا يكون المستخدم قد فكر فيها من قبل، وتتميز بخصائص تختلف عن العناصر التي أعجبت المستخدم في وقت سابق ولكنها تحتفظ بعنصر غير موضح يجذب شخصيات معينة من المستخدمين.16
بينما تناولت الدراسات السابقة التوصيات بوصفها مسألة تنبئية أو تصنيفية، تشير مجموعة كبيرة من الأبحاث الحديثة إلى أنه ينبغي النظر إليها على أنها مشكلة تخص اتخاذ القرارات المتسلسلة. وفي هذا النموذج، قد يكون التعلم المعزز أكثر ملاءمة لإجراء عملية التوصية. يقوم هذا النهج على تحديث التوصيات في الوقت الفعلي وفقًا لتفاعل المستخدم مع العناصر؛ فعندما يتخطى المستخدم العناصر المقترحة أو ينقر عليها أو يُقيّمها أو يشتريها، يطور النموذج سياسة مثالية مستمدة من هذه التعليقات من أجل التوصية بعناصر جديدة.17 تقترح الدراسات الحديثة مجموعة متنوعة من تطبيقات التعلم المعزز التي تُلبي اهتمامات المستخدم المتغيرة على المدى الطويل، والتي تُشكل تحديات لكل من التصفية القائمة على المحتوى والتصفية الجماعية.18
IBM® ™Granite هي مجموعة من نماذج الذكاء الاصطناعي المفتوحة والموثوقة وذات الأداء العالي والتي صُمِمَت خصيصًا للأعمال وجرى الارتقاء بها على النحو الأمثل لتوسيع نطاق تطبيقات الذكاء الاصطناعي لديك. استكشف خيارات اللغة والتعليمات البرمجية والسلاسل الزمنية وضوابط الحماية.
اكتشف كيف يمكن أن تساعدك معالجة اللغة الطبيعية على التحدث بشكل أكثر طبيعية مع أجهزة الكمبيوتر.
لقد قمنا باستطلاع آراء 2000 مؤسسة حول مبادرات الذكاء الاصطناعي لديها لمعرفة ما ينجح وما لا ينجح وكيف يمكنك المضي قدمًا.
استكشف الموقع الإلكتروني لمطوري IBM للوصول إلى المدونات والمقالات والنشرات الإخبارية وتعرف على المزيد عن الذكاء الاصطناعي القابل للتضمين من IBM.
تعلّم المفاهيم الأساسية وطوّر مهاراتك من خلال المختبرات العملية والدورات التدريبية والمشاريع الموجهة والتجارب وغيرها.
يمكنك بسهولة تصميم مساعدي ووكلاء الذكاء الاصطناعي القابلين للتوسع وأتمتة المهام المتكررة وتبسيط العمليات المعقدة باستخدام IBM watsonx Orchestrate.
تسريع قيمة الأعمال باستخدام مجموعة قوية ومرنة من مكتبات وخدمات وتطبيقات الذكاء الاصطناعي.
أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.
1 PPrem Melville وVikas Sindhwani، "أنظمة التوصية"، موسوعة التعلم الآلي واستخراج البيانات، Springer، عام 2017.
2 Charu Aggarwal، أنظمة التوصية: الدليل، Springer، عام 2016.
3 “Collaborative Filtering,” "التصفية الجماعية"، موسوعة التعلم الآلي واستخراج البيانات، Springer، عام 2017. Mohamed Sarwat وMohamed Mokbel، "التصفية الجماعية"، موسوعة أنظمة قواعد البيانات، Springer، عام 2018.
4 Michael J. Pazzani وDaniel Billsus، "أنظمة التوصية القائمة على المحتوى"، الويب التكيفي: أساليب وإستراتيجيات تخصيص الويب، Springer، عام 2007.
5 Elsa Negre، أنظمة المعلومات والتوصية، مجلد 4، Wiley-ISTE، عام 2015.
6 Michael J. Pazzani وDaniel Billsus، "أنظمة التوصية القائمة على المحتوى"، الويب التكيفي: أساليب وإستراتيجيات تخصيص الويب، Springer، عام 2007.
7 Elsa Negre، أنظمة المعلومات والتوصية، مجلد 4، Wiley-ISTE، عام 2015. Sachi Nandan Mohanty، وJyotir Moy Chatterjee، وSarika Jain، وAhmed A. Elngar، وPriya Gupta، نظام التوصية باستخدام التعلم الآلي والذكاء الاصطناعي، Wiley-Scrivener، عام 2020.
8 Rounak Banik، دليل أنظمة التوصية بلغة Python، Packt Publishing ، عام 2018. Elsa Negre، أنظمة المعلومات والتوصية، مجلد 4، Wiley-ISTE، عام 2015.
9 Max Kuhn و Kjell Johnson، النمذجة التنبئية التطبيقية، Springer، عام 2016.
10 Qiaozhu Mei وDragomir Radev، "استرجاع المعلومات"، دليل أكسفورد للغويات الحاسوبية، الطبعة الثانية، مطبعة جامعة أكسفورد، عام 2016.
11 Elsa Negre، أنظمة المعلومات والتوصية، مجلد 4، Wiley-ISTE، عام 2015. Sachi Nandan Mohanty، وJyotir Moy Chatterjee، وSarika Jain، وAhmed A. Elngar، وPriya Gupta، نظام التوصية باستخدام التعلم الآلي والذكاء الاصطناعي، Wiley-Scrivener، عام 2020.
12 Charu Aggarwal، أنظمة التوصية: الدليل، Springer، عام 2016. Ricci، دليل أنظمة التوصية، الطبعة الثالثة، Springer، عام 2022.
13 Charu Aggarwal، أنظمة التوصية: الدليل، Springer، عام 2016. Ian Goodfellow، وYoshua Bengio، وAaron Courville، التعلم العميق، مطبعة MIT Press، عام 2016.
14 Sachi Nandan Mohanty، وJyotir Moy Chatterjee، وSarika Jain، وAhmed A. Elngar، وPriya Gupta، نظام التوصية باستخدام التعلم الآلي والذكاء الاصطناعي، Wiley-Scrivener، عام 2020. Charu Aggarwal، أنظمة التوصية: الدليل، Springer، عام 2016.
15 Jaiwei Han، وMicheline Kamber، وJian Pei، استخراج البيانات: المفاهيم والتقنيات، الطبعة الثالثة، Elsevier، عام 2012. Sachi Nandan Mohanty، وJyotir Moy Chatterjee، وSarika Jain، وAhmed A. Elngar، وPriya Gupta، نظام التوصية باستخدام التعلم الآلي والذكاء الاصطناعي، Wiley-Scrivener، عام 2020.
16 Sachi Nandan Mohanty، وJyotir Moy Chatterjee، وSarika Jain، وAhmed A. Elngar، وPriya Gupta، نظام التوصية باستخدام التعلم الآلي والذكاء الاصطناعي، Wiley-Scrivener، عام 2020. Charu Aggarwal، أنظمة التوصية: الدليل، Springer، عام 2016.
17 Guy Shani، وDavid Heckerman، وRonen I. Brafman، "نظام التوصية القائم على MDP"، مجلة أبحاث التعلم الآلي، مجلد 6، العدد 43، عام 2005، ص. 1265-1295، https://www.jmlr.org/papers/v6/shani05a.html. Yuanguo Lin، وYong Liu، وFan Lin، وLixin Zou، وPengcheng Wu، وWenhua Zeng، وHuanhuan Chen، وChunyan Miao، "دراسة استقصائية حول التعلم المعزز لأنظمة التوصية"، مجلة IEEE Transactions on Intelligent Transportation Systems، عام 2023 ، https://ieeexplore.ieee.org/abstract/document/10144689. M. Mehdi Afsar، وTrafford Crump، وBehrouz Far، أنظمة التوصية القائمة على التعلم المعزز: دراسة استقصائية"، مجلة ACM Computing Survey، مجلد 55، العدد 7، عام 2023، https://dl.acm.org/doi/abs/10.1145/3543846.
18 Xinshi Chen، وShuang Li، وHui Li، وShaohua Jiang، وYuan Qi، وLe Song، "نموذج المستخدم المعاكس التوليدي لنظام التوصية القائم على التعلم المعزز"، وقائع المؤتمر الدولي السادس والثلاثين حول التعلم الآلي، مجلة PMLR، العدد 97، عام 2019، ص. 1052-1061، http://proceedings.mlr.press/v97/chen19f.html. Liwei Huang، وMingsheng Fu، وFan Li، وHong Qu، وYangjun Liu، وWenyu Chen، "نظام التوصية طويل الأمد القائم على التعلم المعزز العميق"، مجلة Knowledge-Based Systems، مجلد 213، عام 2021، https://www.sciencedirect.com/science/article/abs/pii/S0950705120308352.