ما المقصود بالتعلم الموحد؟

2 أبريل 2025

المؤلفون

Cole Stryker

Editorial Lead, AI Models

ما المقصود بالتعلم الموحد؟

التعلم الموحد هو نهج لامركزي لتدريب نماذج التعلم الآلي . تقوم كل عقدة عبر الشبكة الموزعة بتدريب نموذج عالمي باستخدام بياناتها المحلية، حيث يقوم خادم مركزي بتجميع تحديثات العقدة لتحسين النموذج العالمي.

تتطلب نماذج الذكاء الاصطناعي كميات هائلة من البيانات. ويتم تجميع مجموعات البيانات هذه عادةً في مكان واحد لتدريب النموذج، ما يتيح فرصًا لكشف أي معلومات تعريف شخصية (PII) موجودة في مجموعات البيانات أثناء النقل أو التخزين.

يساعد التعلم الموحد على معالجة هذه المخاوف حيث تظل المعلومات الحساسة على العقدة، ما يحافظ على خصوصية البيانات. كما يسمح أيضًا بالتعلم التعاوني، مع مساهمة الأجهزة أو الخوادم المتنوعة في تحسين نماذج الذكاء الاصطناعي.

طريقة عمل التعلم الموحد

يتضمن التعلم الموحد 4 مراحل رئيسية:

● التهيئة

● التدريب المحلي

● التجميع العالمي

● التكرار

التهيئة

يبدأ التعلم الموحد بتهيئة نموذج تعلم آلي عالمي على خادم مركزي. هذا النموذج هو الأساس الذي تبدأ منه عملية التعلّم الموحد.

يوزع الخادم المركزي النموذج العالمي على العقد العميلة المتصلة، والتي يمكن أن تكون خوادم أخرى أو أجهزة الحافة مثل الهواتف الذكية وأجهزة إنترنت الأشياء (IoT). ويقوم أيضًا بنقل المعلومات ذات الصلة، بما في ذلك متغيرات التكوين مثل المعايير الفائقة وعدد الدورات أو الممرات الكاملة عبر بيانات التدريب.

التدريب المحلي

عند استلام النموذج العالمي وجميع التفاصيل اللازمة، تشرع كل عقدة عميلة في التدريب. عملية التدريب تشبه أي شبكة عصبية، حيث تقوم عقدة العميل بتدريب النموذج باستخدام بياناتها الموجودة على الجهاز أو البيانات المحلية فقط.

عند إكمال عدد الدورات التدريبية، تقوم العقد العميلة بإرسال معايير النموذج المحدثة أو المتدرجات إلى الخادم المركزي - دون إرسال نماذج محلية مدرَّبة بالكامل أو بيانات غير منسقة

التجميع العالمي

يقوم الخادم المركزي بتجميع كافة تحديثات عقد العميل. وهناك أشكال مختلفة من التجميع، ولكن هناك طريقة شائعة هي حساب المتوسط الموحد، الذي يحسب المتوسط المرجح لجميع التحديثات. ومن ثم يتم دمج هذه التحديثات المجمعة في النموذج العالمي.

التكرار

يوزع الخادم المركزي مرة أخرى النموذج العالمي الجديد على العقدة المتصلة، وتتكرر عملية التعلم الموحد حتى يصل النموذج إلى التقارب الكامل أو يتم تدريبه بالكامل.

أنواع التعلم الموحد

يمكن أن يختلف التعلم الموحد بناء على بنية مجموعة البيانات أو طبيعة العقدة. يتم تصنيفها عادة إلى هذه الفئات:

● عبر الأجهزة

● عبر الصوامع

● أفقي

● عمودي

عبر الأجهزة

يستخدم التعلم الموحد عبر الأجهزة أجهزة ذات اتصال متقلب وموارد حوسبية محدودة، مثل الهواتف المحمولة وأجهزة إنترنت الأشياء (IOT). يحتاج هذا النوع من التعلم الموحد إلى مراعاة اتصالات الشبكة غير الموثوقة، ولأن عقد العميل لا يمكنها التعامل إلا مع مجموعة البيانات الصغيرة، فعادة ما تكون هناك حاجة إلى العديد من الأجهزة للتدريب المحلي1

يمكن لشركات التجارة الإلكترونية، على سبيل المثال، تدريب محرك توصيات على بيانات المستخدم عبر أجهزة متعددة لتقديم توصيات أكثر تخصيصا للمنتج.1

صوامع متقابلة

على عكس نهج التعلم الموحد عبر الأجهزة، يستلزم التعلم عبر الصوامع عددًا محدودًا من الخوادم أو مراكز البيانات ذات الاتصال المستقر والموارد القوية بما يكفي لتخزين ومعالجة كميات هائلة من البيانات. تُعتبر عقدة العميل صومعة تحتفظ بالبيانات الشخصية، ويجب ألا تترك هذه البيانات النظام أو تتم مشاركتها خارجيًا بسبب مخاوف تتعلق بالخصوصية.1

يمكن أن يكون التعلم الموحد عبر الصوامع ذا قيمة في الصناعات مثل التمويل والرعاية الصحية. فعلى سبيل المثال، يمكن لاتحاد من المستشفيات تدريب نموذج مشترك على بيانات المرضى الخاصة بهم لتعزيز التشخيص أو التنبؤ بأمراض معينة. وبالمثل، يمكن لتحالف من البنوك التدريب على خوارزمية التعلم الآلي المشتركة باستخدام سجلات المعاملات الخاصة بهم لتحسين الكشف عن الغش.1

أفقي

في التعلم الموحد الأفقي، تشترك مجموعات بيانات عقدة العميل في نفس الميزات أو البنية ولكن لها عينات مختلفة. فعلى سبيل المثال، يمكن للعيادات تدريب نموذج تحليلي مشترك لأن كل واحدة منها لديها نفس المتغيرات لبيانات التجارب السريرية الخاصة بها ولكن بقيم مختلفة للمرضى المشاركين في التجارب.

رَأسِيّ

وعلى العكس من ذلك، يتضمن التعلم الموحد الرأسي مجموعات بيانات عُقد العميل التي تشترك في نفس العينات ولكن لها بنية أو ميزات مختلفة. فعلى سبيل المثال، قد يدخل بائع تجزئة وبنك في شراكة للحصول على عروض أكثر تخصيصًا للعملاء، ويمكنهما تدريب محرك توصيات مشترك لأنهما قد يكون لديهما نفس بيانات العميل ولكن معلومات الشراء والمعلومات المالية متنوعة.

فوائد تعلم الفيدرالي

توفر الطبيعة اللامركزية للتعلم الموحد هذه المزايا الرئيسية:

● الكفاءة

● خصوصية البيانات المحسنة

● تحسين الامتثال

الفاعلية

يلغي التعلم الموحد الحاجة إلى الوصول إلى مجموعات البيانات الكبيرة أو نقلها. يؤدي ذلك إلى تقليل زمن الانتقال وتقليل عرض النطاق الترددي المطلوب لتدريب نماذج التعلم الآلي.

خصوصية البيانات المحسنة

تعني بنية الحفاظ على الخصوصية لأنظمة التعلم الموحدة أن البيانات الحساسة لا تغادر الجهاز أبدا. يساعد هذا على تقليل مخاطر الهجمات الإلكترونية أو عمليات اختراق أمن البيانات.

تطبق معظم أنظمة التعلم الموحد أيضًا تقنيات التشفير بما في ذلك الخصوصية التفاضلية والحساب الآمن متعدد الأطراف (SMPC) لتعزيز خصوصية البيانات.

تقوم الخصوصية التفاضلية بإضافة ضوضاء إلى تحديثات النموذج قبل نقلها إلى الخادم المركزي، في حين تمكّن الحوسبة الآمنة متعددة الأطراف (SMPC) الخادم من تنفيذ عمليات تجميع مشفرة بشكل آمن. تجعل هذه الأساليب من الصعب إجراء هندسة عكسية أو التمييز بين العقدة التي ساهمت في التحديث، ما يعزز أمان البيانات.

تحسين الامتثال

نظرًا لأن البيانات يتم حفظها ومعالجتها محليًا، فإن التعلم الموحد يمكن أن يساعد المؤسسات على الامتثال للوائح حماية البيانات. يعد الامتثال أمرا بالغ الأهمية لقطاعات مثل التمويل والرعاية الصحية، التي تتعامل مع البيانات الخاصة.

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر معارف وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

التحديات التي تواجه التعلم الفدرالي

يشير التعلم الموحد إلى تحول تحويلي في تدريب نماذج الذكاء الاصطناعي ولكنه يأتي أيضاً مصحوباً بقيود. فيما يلي بعض التحديات المرتبطة بالتعلم الموحد:

● الهجمات العدائية

● نفقات الاتصال العامة

● التباين

الهجمات العدائية

التعلم الموحد معرض لهجمات تسميم البيانات ، حيث يقوم عنصر التهديد بحقن بيانات ضارة أثناء التدريب المحلي أو تغيير تحديثات النموذج للنقل من أجل المساس بالنموذج المركزي أو إتلافه.

يمكن أن تساعد تقنيات كشف الشذوذ، والتدريب ضد الهجمات، وضوابط الوصول الصارمة، وغيرها من تدابير الأمان في الحماية من هذه الهجمات.

النفقات العامة للاتصالات

يمكن أن تؤدي التبادلات المنتظمة بين عقدة العميل والخادم المركزي إلى اختناقات كبيرة. من أجل تحسين كفاءة الاتصال، يمكن اعتماد استراتيجيات مثل ضغط تحديثات النموذج قبل الإرسال واستخدام التكميم والتخفيف لنقل التحديثات الضرورية فقط.. يجب موازنة هذه الإستراتيجية مع أي انخفاض في الدقة مصاحب لها.

التباين

يمكن أن تعزز البنية اللامركزية للتعلم الفيدرالي تنوع البيانات، ما يساعد في التخفيف من التحيز. ومع ذلك، فإن هذا يعني أيضًا أن البيانات ليست موزعة بشكل متماثل ويمكن أن تكون غير متوازنة. فقد تحتوي بعض الأجهزة على بيانات أكثر من غيرها، ما يؤدي إلى انحراف النموذج العام نحو هذه العقدة ذات البيانات الثقيلة.

تتضمن بعض الطرق لمعالجة هذا التباين الإحصائي منهجيات أو تقنيات أخذ العينات التي تأخذ في الاعتبار التباين في التوزيع، وتجميع العقد ذات التوزيعات البيانية المتشابهة أثناء تدريب النموذج وخوارزميات التحسين مثل  FedProx والتي تستهدف الشبكات غير المتجانسة.

يعد عدم تجانس الأنظمة مشكلة أيضا، حيث تتمتع الأجهزة بقدرات حوسبة مختلفة. ويمكن تطبيق التدريب المحلي التكيفي لتصميم تدريب نموذجي وفقا لما يمكن للعقدة التعامل معه.

حالات استخدام التعلم الفدرالي

يبشر التعلّم الموحد بالمساعدة في حل مشاكل العالم الحقيقي، حيث تتضافر جهود مجموعة حتى عبر الحدود والمناطق الجغرافية. وفيما يلي بعض القطاعات التي يمكن أن تحقق فائدة من التعلم الموحد:

● التمويل

● الرعاية الصحية

● البيع بالتجزئة والتصنيع

● الإدارة الحضرية

الشؤون المالية

يمكن للمؤسسات المالية العمل معًا لتنويع البيانات الخاصة بنماذج التقييم لمخاطر الائتمان، ما يسمح بوصول أفضل للائتمان للفئات المحرومة من الخدمات الائتمانية. يمكنهم أيضا استخدام التعلم الموحد لتقديم المزيد من النصائح المصرفية والاستثمارية الشخصية، وبالتالي تحسين تجربة المستخدم.

الرعاية الصحية

يمكن للمستشفيات ومؤسسات البحث تدريب نماذج التعلم العميق المشتركة التي تساعد في اكتشاف الأدوية للأمراض النادرة. يمكن أن تساعد أنظمة التعلم الموحدة أيضًا في إيجاد استراتيجية أفضل وتحسين نتائج المرضى للمجتمعات الممثلة تمثيلاً ناقصًا.

البيع بالتجزئة والتصنيع

يمكن لتجار التجزئة استخدام التعلم الموحد لتتبع المبيعات والمخزون عبر مواقع متعددة دون الكشف عن أي بيانات للعملاء، ما يسمح لهم بزيادة مستويات المخزون وتقليل الهدر. وفي الوقت نفسه، يمكن للمصنعين تجميع البيانات من أجزاء مختلفة من سلسلة التوريد لتحسين الخدمات اللوجستية.

الإدارة الحضرية

يمكن للمدن الذكية الاستفادة من التعلم الموحد لاستخلاص الرؤى من عدد لا يحصى من الأجهزة وأجهزة الاستشعار المنتشرة في جميع أنحاء المناطق الحضرية مع الحفاظ على خصوصية بيانات المقيمين. يمكن استخدام هذه الرؤى لتوجيه حركة المرور، على سبيل المثال، أو لمراقبة الظروف البيئية مثل تلوث الهواء والماء. 

إطارات التعلم الموحد

قد يكون تنفيذ التعلم الموحد للتطبيقات في العالم الحقيقي أمرًا معقدًا، ولكن توجد العديد من الإطارات للتدريب على النماذج على البيانات اللامركزية وتبسيط سير عمل الخادم والعميل. فيما يلي بعض أطر التعلم الموحدة الشائعة:

● Flower

● التعلم الموحد من IBM

● NVIDIA FLARE

● OpenFL

● TensorFlow موحد

Flower

Flower هو إطار عمل مفتوح المصدر للذكاء الاصطناعي التعاوني و علم البيانات. يمكن استخدامه لإنشاء أنظمة الذكاء الاصطناعي الفيدرالية مع عدد كبير من العملاء المتصلين. إنه متوافق مع معظم إطار العمل للتعلم الآلي وقابل للتشغيل البيني مع مختلف منصات الأجهزة وأنظمة التشغيل.

التعلم الموحد من IBM

التعلم الموحد من IBM هو إطار عمل للتعلم الفيدرالي في بيئات المؤسسات. وهو يعمل مع خوارزميات مختلفة للتعلم الآلي، بما في ذلك Decision Trees ومصنِّفات Naïve Bayes والشبكات العصبية والتعلم المعزز.

كما يأتي التعلم الموحد من IBM مع مكتبة ثرية بأساليب الدمج لدمج تحديثات النماذج ودعم تقنيات الإنصاف المختلفة للمساعدة في مكافحة تحيز الذكاء الاصطناعي.

NVIDIA FLARE

NVIDIA FLARE (بيئة وقت التشغيل لتطبيق التعلم الموحد) عبارة عن مجموعة تطوير برمجيات مصدر مفتوح وغير مرتبطة بمجال معين للتعلم الفيدرالي.

تضم سير عمل مدمجًا للتدريب والتقييم، وخوارزميات تحافظ على الخصوصية وخوارزميات تعلم للمتوسطات الموحدة وFedProx. كما تحتوي NVIDIA FLARE أيضًا على أدوات إدارة للتنسيق والمراقبة.

OpenFL

OpenFL هو إطار العمل تعليمي مفتوح المصدر يعتمد على Python تم إنشاؤه في الأصل بواسطة Intel وهو الآن ضمن مؤسسة ®Linux . يعمل OpenFL مع إطارات التعلم العميق مثل PyTorch والتعلم الآلي بما في ذلك TensorFlow. وتتضمن ميزات الأمان الخاصة به الخصوصية التفاضلية ودعمًا لبيئات التنفيذ الموثوقة المستندة إلى الأجهزة.

TensorFlow الموحد

TensorFlow Federated (TFF) هو إطار عمل مصدر مفتوح تم تطويره بواسطة Google للتعلم الآلي على البيانات اللامركزية. تنقسم واجهات برمجة التطبيقات (APIs) الخاصة بـ TensorFlow Federated إلى طبقتين:

● واجهة برمجة تطبيقات التعلم الموحد هي الطبقة عالية المستوى التي تسهل تنفيذ مهام التعلم الموحد مثل التدريب أو التقييم باستخدام نماذج التعلم الآلي الحالية.

● واجهة برمجة التطبيقات الأساسية الموحدة هي الطبقة منخفضة المستوى لبناء خوارزميات تعلم موحدة جديدة.

 

Mixture of Experts | 25 أبريل، الحلقة 52

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضم إلى لجنة عالمية المستوى من المهندسين والباحثين وقادة المنتجات وغيرهم في أثناء سعيهم للتغلب على الفوضى والضوضاء المحيطة بالذكاء الاصطناعي لتزويدك بأحدث أخباره والرؤى المتعلقة به.

الحواشي

كل الروابط موجودة خارج موقع ibm.com

1 Cross-silo and cross-device federated learning on Google Cloud, Google Cloud, 3 June 2024.

حلول ذات صلة
IBM watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai
حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي
الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. تمكَّن من إنتاج حلول ذكاء اصطناعي قوية بفضل الواجهات سهلة الاستخدام وعمليات سير العمل السلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرامج القياسية في الصناعة.

استكشف watsonx.ai احجز عرضًا توضيحيًا مباشرًا