ما المقصود بتعلُّم وكلاء الذكاء الاصطناعي؟

المؤلفون

Cole Stryker

Staff Editor, AI Models

IBM Think

كيف يتعلَّم وكلاء الذكاء الاصطناعي ويتكيفون بمرور الزمن؟

يشير تعلُّم وكلاء الذكاء الاصطناعي إلى العملية التي يقوم من خلالها وكيل الذكاء الاصطناعي بتحسين أدائه مع مرور الوقت من خلال التفاعل مع البيئة، ومعالجة البيانات، وتحسين آلية اتخاذ القرار. تمكِّن عملية التعلُّم هذه الوكلاء المستقلين من التكيُّف، وتحسين الكفاءة، والتعامل مع المهام المعقدة في بيئات ديناميكية. يُعَد التعلم عنصرًا أساسيًا في العديد من أنظمة الذكاء الاصطناعي الوكيل.

ليست كل أنواع وكلاء الذكاء الاصطناعي قادرة على التعلم. فبعضهم مجرد وكلاء انعكاسيين بسيطين، يتلقّون البيانات بشكل سلبي، ويؤدّون إجراءات مبرمجة تفاعليًا دون امتلاك قدرات تعلُّم.

وهناك وكلاء انعكاسيون قائمون على نماذج يمكنهم الاستدلال حول بيئتهم، ووكلاء استباقيون قائمون على الأهداف قادرون على السعي إلى تحقيق أهداف محددة، لكنهم لا يتعلمون. ولا يستطيع وكلاء المنفعة أيضًا التعلم، رغم أنهم يستخدمون وظيفة منفعة لتقييم الخيارات واختيار الإجراءات التي تحقِّق أقصى فائدة ممكنة.

يعمل الوكيل المتعلم على تحسين أدائه بمرور الوقت من خلال التكيف مع التجارب والبيانات الجديدة. يعمل بعض وكلاء الذكاء الاصطناعي وفق قواعد أو نماذج محددة مسبقًا، في حين يقوم الوكلاء المتعلمون بتحديث سلوكهم باستمرار بناءً على التعليقات من البيئة.

وهذا يمكِّنهم من تعزيز قدراتهم على اتخاذ القرار والأداء بشكل أفضل في المواقف الديناميكية وغير المؤكَّدة. يمثِّل الوكلاء المتعلمون الإمكانات الكاملة لأدوات الذكاء الاصطناعي في التعامل مع مهام حل المشكلات متعددة الخطوات بأقل تدخل بشري ممكن.

يتكون الوكلاء المتعلمون عادةً من أربعة عناصر رئيسية:

  1. عنصر الأداء: يتخذ قرارات مبسَّطة استنادًا إلى قاعدة معرفية.

  2. عنصر التعلم: يضبط ويعزز معرفة الوكيل بناءً على التعليقات و التجربة.

  3. الناقد: يقيِّم تصرفات الوكيل ويقدِّم التعليقات، غالبًا في شكل مكافآت أو عقوبات.

  4. مولِّد المشكلات: يقترح إجراءات استكشافية لمساعدة الوكيل على اكتشاف استراتيجيات جديدة وتحسين عملية التعلم.

أحدث الأخبار التقنية، مدعومة برؤى خبراء

ابقَ على اطلاع دومًا بأهم—اتجاهات المجال وأكثرها إثارة للفضول—بشأن الذكاء الاصطناعي والأتمتة والبيانات وغيرها الكثير مع نشرة Think الإخبارية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! أنت مشترك.

سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.

أنواع تعلُّم وكلاء الذكاء الاصطناعي

يشكِّل التعلم الآلي العمود الفقري لأنواع مختلفة من تعلُّم وكيل الذكاء الاصطناعي. وهو يمكِّن الوكلاء من تحديد الأنماط ووضع التوقعات وتحسين الأداء استنادًا إلى البيانات.

التقنيات الثلاث الأساسية في التعلم الآلي التي تُستخدم في وكلاء الذكاء الاصطناعي هي التعلم الخاضع للإشراف، والتعلم غير الخاضع للإشراف، والتعلم المعزز. بشكل أكثر تحديدًا، تُعَد هذه تقنيات تعلُّم عميق تستخدم شبكات عصبية معقدة متعددة الطبقات لمعالجة كميات هائلة من البيانات وتعلُّم أنماط دقيقة.

التعلم تحت الإشراف

يتضمن التعلم الخاضع للإشراف تدريب خوارزميات التعلم الآلي على مجموعات بيانات مصنَّفة، حيث يتوافق كل إدخال مع ناتج معروف. يستخدم الوكيل هذه المعلومات لإنشاء نماذج تنبؤية.

على سبيل المثال، يمكن تدريب روبوت المحادثة المدعوم بالذكاء الاصطناعي على محادثات خدمة العملاء والحلول المقابلة لتقديم ردود متوقعة. يتم استخدام هذا النهج على نطاق واسع في التعرُّف على الصور، وتحويل الصوت إلى نص، والتشخيص الطبي.

يُتيح التعلم بالنقل لوكلاء الذكاء الاصطناعي استخدام المعرفة المكتسبة من مهمة واحدة وتطبيقها على مهمة أخرى. على سبيل المثال، يمكن ضبط نموذج لغوي كبير تم تدريبه على مجموعة بيانات عامة لمجال محدد، مثل معالجة النصوص القانونية أو الطبية.

تعليم دون إشراف

على النقيض من ذلك، يسمح التعلم غير الخاضع للإشراف لوكلاء الذكاء الاصطناعي بإجراء تحليل البيانات غير المصنَّفة للعثور على الأنماط والهياكل دون إشراف بشري.

هذه الطريقة مفيدة في مهام مثل تجميع سلوك العملاء لتحسين الاستراتيجية التسويقية، واكتشاف الحالات الشاذة في الأمن الإلكتروني وأنظمة التوصيات مثل تلك المستخدمة في خدمات البث المباشر.

يستخدم التعلم الخاضع للإشراف الذاتي تقنيات التعلم غير الخاضع للإشراف لتنفيذ مهام تتطلب عادةً تعلُّمًا خاضعًا للإشراف. بدلاً من الاعتماد على مجموعات البيانات المصنَّفة لإشارات الإشراف، تعمل نماذج الذكاء الاصطناعي الخاضعة للإشراف الذاتي على توليد تسميات ضمنية من بيانات غير منظمة.

يُعَد التعلم الذاتي مفيدًا في مجالات مثل رؤية الكمبيوتر ومعالجة اللغة الطبيعية (NLP)، والتي تتطلب كميات كبيرة من بيانات التدريب المصنَّفة.

تعزيز التعلم

التعلم المعزز هو عملية في التعلم الآلي تركِّز على سير عمل اتخاذ القرار لدى الوكلاء المستقلين. وهو يركِّز على عمليات اتخاذ القرار المتسلسلة في بيئات تتسم بعدم اليقين.

وعلى عكس التعلم الخاضع للإشراف، لا يستخدم التعلم المعزز أمثلة مصنَّفة للسلوك الصحيح أو الخاطئ. لكن التعلم المعزز يختلف كذلك عن التعلم غير الخاضع للإشراف، إذ إن التعلم المعزز يتعلم من خلال التجربة والخطأ ووظيفة المكافأة وليس من خلال استخراج معلومات الأنماط الخفية.2يختلف التعلم المعزز أيضًا عن التعلم الخاضع للإشراف الذاتي، لأنه لا يُنتج تسميات شبه حقيقية ولا يُقارَن بحقيقة مرجعية؛ فهو ليس أسلوب تصنيف بل أسلوب تعلُّم قائمًا على اتخاذ الأفعال.

يعتمد وكلاء الذكاء الاصطناعي الذين يستخدمون التعلم المعزز على أسلوب التجربة والخطأ، حيث يتخذون إجراءات داخل بيئة معينة، ويراقبون النتائج، ثم يضبطون استراتيجياتهم بناءً على ذلك. تتضمن عملية التعلم تحديد سياسة تربط الحالات بالإجراءات، وتحقيق الاستفادة القصوى من المكافآت التراكمية على المدى الطويل بدلًا من المكاسب الفورية.

بمرور الوقت، يتمكَّن الوكيل من تحسين قدراته في صناعة القرار من خلال التفاعلات المتكررة، ما يؤدي إلى تحسين قدرته على أداء المهام المعقدة بفاعلية. وهذا النهج مفيد في البيئات الديناميكية حيث قد لا تكون القواعد المحددة مسبقًا كافية لتحقيق الأداء الأمثل.

تستخدم المركبات ذاتية القيادة التعلم المعزز لتعلُّم السلوكيات المُثلى للقيادة. من خلال التجربة والخطأ، يعمل الذكاء الاصطناعي على تحسين قدرته على التنقل على الطرق وتجنُّب العقبات واتخاذ قرارات القيادة في الوقت الفعلي. تعمل روبوتات المحادثة المدعومة بالذكاء الاصطناعي على تحسين قدراتها الحوارية من خلال التعلم من تفاعلات المستخدم وتحسين الاستجابات لتعزيز المشاركة.

التعلم المستمر

يُشير التعلم المستمر في وكلاء الذكاء الاصطناعي إلى قدرة نظام الذكاء الاصطناعي على التعلم والتكيُّف بمرور الوقت، ودمج البيانات وتجارب جديدة دون نسيان المعرفة السابقة.

على عكس التعلم الآلي التقليدي، الذي يتضمن عادةً التدريب على مجموعة بيانات ثابتة، يُتيح التعلم المستمر للذكاء الاصطناعي تحديث نماذجه باستمرار عند مواجهة معلومات جديدة أو تغييرات في بيئته. وهذا يسمح للوكيل بتحسين الأداء في الوقت الفعلي، والتكيُّف مع الأنماط الجديدة، والمواقف المتغيرة، والظروف الديناميكية.

التعلم المستمر مهم في التطبيقات الواقعية حيث تتغير البيانات باستمرار ويجب أن يظل الذكاء الاصطناعي محدثًا بإدخال جديد ليظل فعَّالًا. يساعد ذلك على منع "النسيان الكارثي"، حيث ينسى النموذج المعرفة السابقة عند تعلُّم معلومات جديدة، كما يضمن قدرة النظام على التعامل مع مجموعة متغيرة باستمرار من المهام والتحديات.

التعلم والتعاون متعدد الوكلاء

إحدى فوائد وكلاء الذكاء الاصطناعي هي قدرتهم على العمل معًا. في الهياكل متعددة الوكلاء، يتعلَّم وكلاء الذكاء الاصطناعي من خلال التعاون والتنافس. في التعلم التعاوني، يتبادل الوكلاء المعرفة بهدف تحقيق هدف مشترك، كما هو الحال في الروبوتات الجماعية.

ومع ذلك، يحدث التعلم التنافسي عندما يقوم الوكلاء بتحسين الاستراتيجية من خلال التنافس في بيئات عدائية، مثل الذكاء الاصطناعي في التداول المالي.

تخيَّل شبكة من وكلاء الذكاء الاصطناعي يعملون على تحسين رعاية المرضى، وتبسيط سير العمل، وتعزيز الالتزام بالاعتبارات الأخلاقية، وتحسين تخصيص الموارد ضمن شبكة مستشفيات.

في أطر العمل متعددة الوكلاء هذه، يتولى أحيانًا وكيل تعلُّم أكثر تقدمًا، مزود بالذكاء الاصطناعي التوليدي، الإشراف على وكلاء أبسط يعتمدون على ردود الفعل أو على تحقيق أهداف محددة. في هذا الاستخدام، يمكن أن يمثِّل كل وكيل دورًا أو مهمة مختلفة داخل نظام الرعاية الصحية، حيث يتعاون الوكلاء ويتبادلون المعلومات بهدف تحسين نتائج المرضى وكفاءة العمليات.

وكلاء الذكاء الاصطناعي

5 أنواع من وكلاء الذكاء الاصطناعي: الوظائف الذاتية والتطبيقات الواقعية

اكتشِف كيف يتكيّف الذكاء الاصطناعي القائم على الأهداف والمنفعة مع سير العمل والبيئات المعقدة.

آليات التعليقات

من خلال آليات التعليقات، يتلقى نظام الذكاء الاصطناعي معلومات حول نتائج أفعاله أو تنبؤاته، ما يُتيح له تقييم دقة أو فاعلية سلوكه.

هذه التعليقات، التي قد تكون إيجابية (لتعزيز السلوك الصحيح) أو سلبية (لمعاقبة السلوك الخاطئ)، ضروريةً لتوجيه قرارات النظام وتحسين أدائه. تُعَد التعليقات مكونًا أساسيًا يمكِّن الذكاء الاصطناعي من التعلم، لكنها لا تمثِّل عملية التعلم بأكملها.

تُعَد التعليقات في الوقت الفعلي أمرًا بالغ الأهمية لوكلاء الذكاء الاصطناعي الذين يعملون في بيئات ديناميكية. تجمع الأنظمة المستقلة، مثل السيارات ذاتية القيادة وأتمتة العمليات الآلية (RPA)، بيانات الاستشعار بشكل مستمر وتُعدّل سلوكها بناءً على التعليقات الفورية. يُتيح لهم ذلك التكيف مع الظروف المتغيرة وتحسين قدرتهم على اتخاذ القرارات في الوقت الفعلي.

تعليقات التعلم غير الخاضع للإشراف

في التعلم غير الخاضع للإشراف، لا يتم تقديم تعليقات بشكل صريح عبر بيانات معنونة أو إشراف مباشر. بدلًا من ذلك، يبحث وكيل الذكاء الاصطناعي عن الأنماط أو الهياكل أو العلاقات داخل البيانات نفسها.

على سبيل المثال، في مهام المجموعة أو تقليل الأبعاد، تحدُث التعليقات بشكل ضمني عندما يقوم الوكيل بتعديل نموذجه ليعكس بشكل أفضل البنية الأساسية للبيانات.

ويعمل النموذج على تحسين فهمه للبيانات من خلال المقاييس مثل تقليل الأخطاء، على سبيل المثال، تقليل خطأ إعادة البناء في أجهزة الترميز التلقائي أو تحسين معيار محدد، مثل زيادة تشابه البيانات في المجموعة.

في نظام إدارة سلسلة التوريد الذي يحتاج إلى توقُّع الطلب على المنتجات وتحسين مستويات المخزون عبر العديد من المستودعات والمخازن، يمكن لوكيل الذكاء الاصطناعي استخدام تقنيات التعلم غير الخاضع للإشراف، مثل التجميع أو كشف الحالات الشاذة، لتحليل كميات كبيرة من بيانات المبيعات التاريخية، دون الحاجة إلى تسميات صريحة أو فئات محددة مسبقًا.

التعليقات من التعلم الخاضع للإشراف

في التعلم الخاضع للإشراف، تكون التعليقات صريحة وتأتي في شكل بيانات مصنَّفة. يتم تدريب وكيل الذكاء الاصطناعي باستخدام أزواج الإدخال/الإخراج (على سبيل المثال، صورة ذات تسمية مقابلة). بعد أن يُجري الوكيل تنبؤاته، يتم تقديم التعليقات من خلال مقارنة ناتجه بالتسمية الصحيحة (الحقيقة المرجعية).

يتم حساب الفرق بين الناتج المتوقع والحقيقي (الخطأ)، غالبًا باستخدام دالة الخسارة. ثم يتم استخدام هذه التعليقات لضبط مَعلمات النموذج بحيث يمكن للنموذج تحسين تنبؤاته بمرور الوقت.

يمكن لوكلاء الذكاء الاصطناعي استخدام التعلم الخاضع للإشراف للتنبؤ بالمنتجات أو الخدمات التي من المرجَّح أن يهتم بها العميل، بناءً على سلوكه السابق أو سجل مشترياته أو تفضيلاته كمستخدم.

على سبيل المثال، يمكن لحل الذكاء الاصطناعي لمنصة التجارة الإلكترونية استخدام البيانات التاريخية مثل المشتريات السابقة والتقييمات كأمثلة مصنَّفة لتدريب نموذج يتنبأ بالمنتجات التي قد يريد العميل شراءها بعد ذلك، ما يؤدي إلى تحسين تجارب العملاء.

يُعَد التعلم الخاضع للإشراف من أنواع التعلم التي تتضمن الإنسان في الحلقة (HITL)؛ لأن وكلاء الذكاء الاصطناعي يدمجون التعليقات البشرية لتحسين نماذجهم، وتعزيز اتخاذ القرار، والتكيُّف مع المواقف الجديدة.

تجمع هذه الطريقة بين التعلم الآلي والخبرة البشرية، ما يُتيح للذكاء الاصطناعي التعامل مع المهام المعقدة بشكل أكثر فاعلية مع تقليل الأخطاء والتحيُّزات إلى الحد الأدنى. يمكن أيضًا دمج HITL كآلية للتعليقات في أنواع أخرى من التعلم، ولكنها لا تكون جزءًا لا يتجزأ من عملية التعلم الذاتي إلا في حالة التعلم الذاتي الخاضع للإشراف.

تعليقات التعلم المعزز

في التعلم المعزز (RL)، يتم تقديم التعليقات في شكل مكافآت أو عقوبات. يتفاعل وكيل التعلم المعزز مع بيئة ما، وينفِّذ إجراءات تؤدي إلى نتائج مختلفة. بعد كل إجراء، يتلقى الوكيل تعليقات في شكل مكافأة أو عقوبة قياسية تشير إلى مدى جودة أو سوء النتيجة مقارنةً بالهدف.

يستخدم الوكيل هذه التعليقات لتعديل سياسته أو استراتيجية صناعة القرار، بهدف زيادة المكافآت التراكمية بمرور الوقت. تُتيح حلقة التعليقات هذه للوكيل تعلُّم الإجراءات المُثلى أو الاستراتيجية من خلال التجربة والخطأ، وتحسين سلوكه أثناء استكشافه للبيئة.

تعليقات التعلم الخاضع للإشراف الذاتي

في التعلم الخاضع للإشراف الذاتي، يُنشئ الوكيل تسميات خاصة به انطلاقًا من البيانات، ما يؤدي إلى إنتاج شكل من أشكال التعليقات من البنية الداخلية للبيانات نفسها. يستخدم النموذج أجزاءً من البيانات للتنبؤ بأجزاء أخرى، مثل التنبؤ بالكلمات المفقودة في جملة أو التنبؤ بالإطارات المستقبلية في مقطع فيديو.

تأتي التعليقات من مقارنة تنبؤات النموذج بالبيانات الفعلية المفقودة أو المستقبلية. يتعلم الوكيل عن طريق تقليل خطأ التنبؤ إلى الحد الأدنى، وتحسين تمثيلاته الداخلية بناءً على التعليقات التي يولِّدها بنفسه.

حلول ذات صلة
وكلاء الذكاء الاصطناعي للأعمال

يمكنك إنشاء مساعدين ووكلاء ذكاء اصطناعي ووكلاء أقوياء يعملون على أتمتة مهام سير العمل والعمليات باستخدام الذكاء الاصطناعي التوليدي ونشرها وإدارتها.

    استكشف watsonx Orchestrate
    حلول وكلاء الذكاء الاصطناعي من IBM

    يمكنك بناء مستقبل عملك باستخدام حلول الذكاء الاصطناعي الجديرة بالثقة.

    استكشف حلول وكلاء الذكاء الاصطناعي
    خدمات الذكاء الاصطناعي لدى IBM Consulting

    تساعد خدمات IBM Consulting AI في إعادة تصور طريقة عمل الشركات باستخدام حلول الذكاء الاصطناعي من أجل النهوض بأعمالها.

    استكشف خدمات الذكاء الاصطناعي
    اتخِذ الخطوة التالية

    سواء اخترت تخصيص التطبيقات والمهارات المُعدّة مسبقًا أو إنشاء خدمات مخصصة مستندة إلى وكلاء ونشرها باستخدام استوديو الذكاء الاصطناعي، فإن منصة IBM watsonx تُلبي احتياجاتك.

    استكشف watsonx Orchestrate استكشف watsonx.ai