ما خوارزمية أبريوري ؟

المؤلفين

Data Scientist

ما خوارزمية Apriori؟

خوارزمية أبريوري هي خوارزمية تعلم آلي غير خاضعة للإشراف تستخدم لتعلم قواعد الارتباط. وتعلم قواعد الارتباط هو تقنية من تقنيات استخراج البيانات التي تحدد الأنماط المتكررة والاتصالات والتبعيات بين مجموعات مختلفة من العناصر تسمى مجموعات العناصر في البيانات. تتمثل بعض حالات الاستخدام الشائعة في أنظمة التنبؤ بالأمراض والتوصية مثل تحليل سلة السوق لمنصات التجارة الإلكترونية.

تم تقديم الاسم في عام 1994 من قِبَل Rakesh Agrawal and Ramakrishnan Srikant، ويَعترف "Apriori" بالمعرفة المسبقة بمجموعات العناصر المتكررة التي تستخدمها الخوارزمية في الحوسبة. تشغِّل الخوارزمية بتشغيل التكرارات على البيانات لتحديد مجموعات العناصر k، ما يعني أن عناصر k تتصاحب بشكل متكرر. ثم تستخدم مجموعات العناصر k لتحديد مجموعات عناصر k+1. تعتمد خوارزمية Apriori على فكرة أن إضافة عناصر إلى إحدى المجموعات التي تُشترى بشكل متكرر يمكن أن يجعلها أقل تكرارًا، وليس أكثر تكرارًا. تعتمد العملية على خاصية Apriori التي تنص على أنه إذا ظهرت مجموعة عناصر بشكل متكرر في مجموعة بيانات، فيجب أن تكون جميع مجموعاتها الفرعية متكررة أيضًا. على العكس من ذلك، إذا تم تحديد مجموعة عناصر على أنها نادرة، فستُعَد جميع مجموعاتها الفائقة نادرة كذلك.

يمكن تطبيق خوارزمية Apriori على جميع أنواع مجموعات البيانات، وخاصة تلك التي تُنشأ بواسطة قواعد بيانات المعاملات، وغالبًا ما تستخدم لتحليل سلة السوق لدعم أنظمة التوصية. على سبيل المثال، عند استخدام منصة تجارة إلكترونية تبيع الملابس والأحذية، يبحث المتسوق عن الأحذية ويقرر إضافة زوج من الأحذية السوداء الرسمية إلى عربة التسوق الخاصة به. ويلاحظ المتسوق بعد ذلك أن الواجهة تُوصي بشراء عناصر أخرى، مثل الجوارب. إحدى الطرق التي يعمل بها نظام التوصية هذا هي التعرُّف على أنماط شراء العملاء وربط العناصر التي عادة ما تُشترى معًا.

إحدى أكبر مزايا استخدام خوارزمية أبريوري هي بساطتها وقدرتها على التكيف. ومع ذلك، فإن خوارزميات أبريوري لا تعمل بالفعالية نفسها عند التعامل مع مجموعات البيانات الكبيرة. قد تصبح عملية التكرار المتعدد لتوليد مجموعات العناصر المرشحة عملية مكلفة حسابيًا كما أنها تستهلك الكثير من الذاكرة. ومن ثَمَّ غالبًا ما يُدمج أبريوري مع تقنيات أخرى للتخفيف من هذه المشكلات.

لقد دُمجت دالة أبريوري في العديد من لغات البرمجة الشائعة بما في ذلك Python وJava وR، ما يجعل من السهل دمج توليد قواعد الارتباط عالية الجودة إلى جانب مجموعات العناصر المتكررة في التطبيقات أو الأنظمة الحالية.

كيف تعمل خوارزمية أبريوري

تعمل كل خطوة من الخطوات الرئيسية في خوارزمية أبريوري على تحديد مجموعات العناصر وجميع مجموعاتها الفائقة الممكنة بحثًا عن المجموعات الأكثر شيوعًا لإنشاء قواعد الارتباط.

الخطوة 1: توليد مجموعات العناصر المتكررة

تحدد الخوارزمية العناصر الفريدة أولاً -والتي يشار إليها أحيانًا باسم مجموعات العناصر 1- في مجموعة البيانات جنبًا إلى جنب مع تكراراتها. بعد ذلك، تدمج العناصر التي تظهر مع بعضها باحتمالية أعلى من حد مقرر في مجموعات العناصر المرشحة وتصفي مجموعات العناصر غير المتكررة لتقليل تكلفة الحساب في خطوات أخرى. إن هذه العملية، المعروفة باسم التنقيب المتكرر عن مجموعات العناصر، تبحث فقط عن مجموعات العناصر ذات الترددات الهادفة.

الخطوة 2: توسيع مجموعات العناصر ثم تقليمها

باستخدام خاصية أبريوري، تجمع الخوارزمية مجموعات العناصر المتكررة لتكوين مجموعات عناصر أكبر. تُقلَّم تراكيب مجموعات العناصر الأكبر ذات الاحتمالية الأقل. ويقلل هذا من مساحة البحث ويجعل الحساب أكثر كفاءة.

الخطوة 3: تكرار الخطوتين 1 و2

تكرر الخوارزمية الخطوتين 1 و2 حتى يتم الإنشاء الشامل لجميع مجموعات العناصر المتكررة التي تلبي احتمال الحد المحدد. وينتج عن كل تكرار اقترانات أكثر تعقيدًا وشمولية في مجموعات العناصر.

بمجرد أن تنشئ أبريوري مجموعات العناصر، يمكن التحقيق في قوة الارتباطات والعلاقات التي أُنشأت.

الرسالة الإخبارية الخاصة بالمجال

أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء

احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.

قياس مجموعات العناصر

تستخدم خوارزمية أبريوري مقاييس الدعم والثقة والرفع لتحديد معايير التشغيل الخاصة بها وتحسين كفاءة الأداء.

الدعم

يُعرَّف الدعم بأنه نسبة عدد مرات ورود أحد العناصر في المعاملات إلى إجمالي عدد المعاملات. ومن ثَمَّ يحدد هذا المقياس احتمالية ورود كل عنصر فردي في المعاملات. يمكن توسيع نطاق المنطق نفسه ليشمل مجموعات العناصر.

$S (I_{A}) = \frac{O c c (I_{A})}{T o t a l T r a n s a c t i o n s}$

حيث يكون I_Aهو العنصر A، وOcc(I_A) هو عدد مرات ورود العنصر A، وS(I_A) = دعم العنصر A

على سبيل المثال، في أحد متاجر البيع بالتجزئة، قد تتضمن 250 معاملة من أصل 2000 معاملة على مدار اليوم شراء التفاح. باستخدام الصيغة:

$S (I_{A p p l e s}) = \frac{250}{2000} = 0.125$

تشير هذه النتيجة إلى وجود احتمال بنسبة 12.5% أن يكون قد تم شراء التفاح في ذلك اليوم.

يمكنك الإشارة إلى الحد الأدنى المطلوب من الدعم عند تطبيق خوارزمية أبريوري. ويعني هذا أن أي عنصر أو مجموعة عناصر تتمتع بدعم أقل من الحد الأدنى المحدد للدعم ستُعد نادرة.

الثقة

يحدد مقياس الثقة احتمالية ورود العناصر أو مجموعات العناصر في مجموعات العناصر معًا. على سبيل المثال، إذا كان هناك بندان في معاملة ما، فيُفترض أن وجود عنصر واحد يؤدي إلى وجود الآخر. العنصر الأول أو مجموعة العناصر تكون السابقة، والثانية تكون التالية. وهكذا تُعرف الثقة بأنها نسبة عدد المعاملات التي توجد بها السابقة واللاحقة، إلى عدد المعاملات التي توجد بها السابقة فقط. يتمثل هذا السيناريو على النحو التالي:

$C (A, B) = \frac{O c c (A \cap B)}{O c c (A)}$

حيث A هو السابق، وB هو التالي، وC(A,B) هي الثقة بأن A يؤدي إلى B.

وبتوسيع نطاق المثال السابق، افترض أن هناك 150 معاملة تم فيها شراء التفاح والموز معًا. يتم احتساب الثقة على النحو التالي:

$C (A p p l e s, B a n a n a s) = \frac{150}{250} = 0.6$

تشير هذه النتيجة إلى احتمالية بنسبة 60% أن يؤدي شراء التفاح إلى شراء الموز. وبالمثل، بافتراض ما مجموعه 500 معاملة للموز، فإن الثقة في أن شراء الموز يؤدي إلى شراء التفاح يتم حسابه كالتالي:

$C (B a n a n a s, A p p l e s) = \frac{150}{500} = 0.3$

هنا، توجد احتمالية بنسبة 30% فقط أن يؤدي شراء الموز إلى شراء التفاح.

في حين أن الثقة هي مقياس جيد للاحتمالية، إلا أنها ليست ضمانًا لارتباط واضح بين العناصر. قد تكون قيمة الثقة عالية لأسباب أخرى. لهذا السبب، يُطبق حد أدنى من الثقة لتصفية الارتباطات المحتملة الضعيفة أثناء التنقيب بقواعد الارتباط.

الرفع

الرفع هو العامل الذي تكون فيه احتمالية أن يؤدي العنصر A إلى العنصر B أعلى من احتمالية العنصر A. يحدد هذا المقياس قوة الارتباط بين A و B، ويمكن أن يساعد في توضيح ما إذا كانت هناك علاقة حقيقية بين العناصر الموجودة في مجموعة العناصر أم يتم تجميعها معًا عن طريق المصادفة.

$L (A, B) = \frac{C (A, B)}{S (A)}$  

لما كان L_A,B هو الرفع للعنصر A المؤدي إلى العنصر B وC_A,B هي الثقة في أن العنصر A يؤدي إلى العنصر B، فإن S_A هو الدعم للعنصر A.

في المثال الوارد أعلاه، يمكننا أن نرى ما يلي:

$L (A p p l e s, B a n a n a s) = \frac{0.6}{0.125} = 4.8$

تشير قيمة الرفع العالية إلى أن احتمالية شراء التفاح والموز معًا أعلى بمعدل 4.8 مرة من احتمالية شراء التفاح وحده. كما يمكن ملاحظة ما يلي:

$L (B a n a n a s, A p p l e s) = \frac{0.3}{0.25} = 1.2$

تشير قيمة الرفع المنخفضة هنا إلى أن عملية شراء الموز التي تؤدي إلى شراء التفاح قد تكون مجرد مصادفة.

Mixture of Experts | 12 ديسمبر، الحلقة 85

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

شاهد جميع حلقات برنامج Mixture of Experts

الجمع بين Apriori والتقنيات الأخرى

في كثير من الحالات، قد يكون تطبيق نهج القوة الغاشمة (الرابط موجود خارج موقع ibm.com) لاحتساب حدود الدعم والثقة لكل قاعدة ثم تقليم القواعد التي لا تُلبي الحد الأدنى من الناحية الحسابية. ولزيادة كفاءة تطبيق خوارزمية Apriori، غالبًا ما تُدمج مع تقنيات استخراج قواعد الارتباط الأخرى. اثنان من أكثر الطرق شيوعًا هي خوارزمية نمو FP ومتغيرها FP-Max لتقليل قيود الذاكرة والحوسبة. يمكن أيضًا دمج خوارزمية Apriori مع أشجار القرار، حيث تحدِّد خوارزمية Apriori مجموعات العناصر المتكررة، وتساعد تقنية شجرة القرار على تحديد قواعد الارتباط.

هناك متغيّر شائع آخر لخوارزمية Apriori وهو العد الديناميكي لمجموعة العناصر (DIC) والذي يبدأ بعدّ مجموعات العناصر المحتملة مبكرًا، دون انتظار تسجيل جميع المعاملات. يقسِّم العد الديناميكي لمجموعات العناصر (DIC) مجموعة البيانات إلى شرائح أصغر ويعالج كل جزء على حدة. يُتيح هذا التقسيم التوقف المبكر عندما تكون الخوارزمية غير قادرة على تحديد أي عناصر متكررة، ولكن تقسيم البيانات يساعد أيضًا على تقليل تكلفة الحوسبة بشكل كبير.

يمكن أن تكون خوارزميات Apriori مفيدة أيضًا في تطبيقات الذكاء الاصطناعي القائمة على التعلم غير الخاضع للإشراف، وكذلك على خوارزميات التجميع عندما تدعمها البيانات. ويساعد على تحديد العلاقات والارتباطات بين الكيانات التي تبدو مستقلة، وتجميعها في مجموعات محتملة.

حالات استخدام خوارزمية أبريوري

توجد تطبيقات متعددة لاكتشاف مجموعات العناصر وتجميعها، ويشار أحيانًا إلى خوارزمية أبريوري على أنها أول ما يجربه منقبو البيانات بسبب تعدد استخداماتها. لنلقِ نظرة على بعض حالات الاستخدام الشائعة في مختلف الصناعات.

تحليل سلة السوق

أحد التطبيقات الأكثر شيوعًا لخوارزمية أبريوري هو إجراء تحليل سلة السوق. يقوم تجار التجزئة بتحليل تاريخ مشتريات العملاء وتحسين طريقة ترتيب المتاجر عن طريق وضع العناصر التي تُشترى بشكل متكرر بالقرب من بعضها أو على الرف نفسه. تستخدم منصات التجارة الإلكترونية خوارزميات أبريوري لدراسة العلاقات القائمة على المنتج بناءً على تفضيلات المستخدم وتحليل تعدين نمط الشراء لإنشاء أنظمة توصية فعالة للعملاء. يمكن استخدام نوع التحليل نفسه لتحسين شراء الخدمات، مثل اختيار الدورات التدريبية من كتالوج، أو التوصية بأنواع أخرى من التغطية عند اختيار الخطة التأمينية.

الرعاية الصحية

يمكن استخدام خوارزمية Apriori لإيجاد قواعد ارتباط قوية بين الأعراض والأمراض لتحسين كفاءة التشخيص ووضع خطط علاجية مستهدفة. على سبيل المثال، المرضى الذين من المحتمل أن يصابوا بمرض السكري أو الدور الذي يؤديه النظام الغذائي أو نمط الحياة في المرض. ويمكن أن يساعد أيضًا على تحديد العوامل المرتبطة بالتفاعلات الدوائية الضارة.

تحليلات الويب

كما يمكن تطبيق خوارزميات أبريوري في قواعد البيانات غير المتعلقة بالمعاملات. غالبًا ما يستخدم محللو البيانات خوارزميات أبريوري للتنقيب عن استخدام الويب، لتحليل بيانات تدفق النقرات، وتفسير سلوك المستخدمين.

الشؤون المالية

أحد التطبيقات الشائعة الأخرى لخوارزمية أبريوري هو تحديد الأنماط الاحتيالية في المعاملات المالية. حيث إن تحديد أنماط شراء معينة على أنها قد تكون احتيالية يسمح للمؤسسة المالية بالتصرف بسرعة لتعليق المعاملات أو الاتصال بصاحب الحساب.

أطلق العنان لقوة الذكاء الاصطناعي التوليدي والتعلم الآلي (ML)

تعرّف على كيفية دمج الذكاء الاصطناعي التوليدي والتعلّم الآلي بثقة في أعمالك

الموارد

طوِّر مستوى خبرتك في التعلم الآلي

تعلّم المفاهيم الأساسية وطوّر مهاراتك من خلال المختبرات العملية والدورات التدريبية والمشاريع الموجهة والتجارب وغيرها.

أطلق العنان لقوة الذكاء الاصطناعي التوليدي والتعلم الآلي (ML)

تعرّف على كيفية دمج الذكاء الاصطناعي التوليدي والتعلّم الآلي بثقة في أعمالك

التفعيل المثمر للذكاء الاصطناعي: جني الأرباح وعائد الاستثمار باستخدام الذكاء الاصطناعي التوليدي

هل ترغب في زيادة عائد استثماراتك في الذكاء الاصطناعي؟ تعرّف على كيفية تأثير توسيع نطاق الذكاء الاصطناعي التوليدي في المجالات الرئيسية، من خلال مساعدة أفضل العقول لديك على وضع حلول مبتكرة جديدة وطرحها.

كيفية اختيار نموذج الأساس المناسب

تعرّف على كيفية اختيار نموذج أساس الذكاء الاصطناعي الأكثر ملاءمة لحالة الاستخدام الخاصة بك.

استكشف IBM Granite

IBM Granite هي مجموعة من نماذج الذكاء الاصطناعي المفتوحة والموثوق بها وذات الأداء العالي والتي صُمِمَت خصيصًا للأعمال وجرى الارتقاء بها على النحو الأمثل لتوسيع نطاق تطبيقات الذكاء الاصطناعي لديك. استكشف خيارات اللغة والتعليمات البرمجية والسلاسل الزمنية والدرابزين.

كيف تزدهر في عصر الذكاء الاصطناعي الجديد بثقة وثبات

تعمّق في العناصر الثلاثة الهامة لاستراتيجية الذكاء الاصطناعي القوية: إنشاء ميزة تنافسية، وتوسيع نطاق الذكاء الاصطناعي عبر الأعمال، وتطوير الذكاء الاصطناعي الجدير بالثقة.

تقرير AI in Action

لقد قمنا باستطلاع آراء 2000 مؤسسة حول مبادرات الذكاء الاصطناعي لديها لمعرفة ما ينجح وما لا ينجح وكيف يمكنك المضي قدمًا.

حلول ذات صلة

IBM watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai

حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي

الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي

اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. تمكَّن من إنتاج حلول ذكاء اصطناعي قوية بفضل الواجهات سهلة الاستخدام وعمليات سير العمل السلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرامج القياسية في الصناعة.

استكشف watsonx.ai

احجز عرضًا توضيحيًا مباشرًا