ما المقصود بالنموذج التوليدي؟

11 نوفمبر 2024

المؤلفين

Ivan Belcic

Staff writer

ما المقصود بالنموذج التوليدي؟ 

النموذج التوليدي هو نموذج تعلم آلي مصمم لإنشاء بيانات جديدة مشابهة لبيانات التدريب الخاصة به. تتعلم نماذج الذكاء الاصطناعي (AI) التوليدي أنماط بيانات التدريب وتوزيعاتها، ثم تطبّق هذه المفاهيم لتوليد محتوى جديد استجابةً لبيانات المدخلات الجديدة.

عملية توليد المحتوى هي التي تفصل نماذج الذكاء الاصطناعي التوليدي عن الأنواع الأخرى من الذكاء الاصطناعي. النماذج التوليدية هي شبكات عصبية متقدمة تحاكي بنية الدماغ البشري وتطبق خوارزميات التعلم الآلي المعقدة لمعالجة بيانات التدريب وإنشاء نواتج جديدة. 

وقد قادت نماذج الذكاء الاصطناعي التوليدي ومطوروها بشكل رئيسي روح العصر في مجال الذكاء الاصطناعي في السنوات العديدة الماضية. ولا تزال النماذج التوليدية تحظى بمعظم التغطية الإخبارية المتعلقة بالذكاء الاصطناعي وتستحوذ على اهتمام واستثمارات كبيرة. 

ما المقصود بالذكاء الاصطناعي التوليدي؟ 

الذكاء الاصطناعي التوليدي هو نوع من الذكاء الاصطناعي يستخدم نماذج متطورة لتوليد محتوى جديد وفقًا لمطلب إدخال. النموذج التوليدي هو البرنامج الحاسوبي الذي يستخدم البيانات والخوارزميات لتسهيل ممارسة الذكاء الاصطناعي التوليدي. وتشمل حالات استخدام الذكاء الاصطناعي التوليدي تلخيص النصوص وتوليد النصوص وتوليد الصور، بالإضافة إلى وضع نماذج ثلاثية الأبعاد وإنشاء الصوت. 

كيف تعمل النماذج التوليدية؟ 

تعمل النماذج التوليدية من خلال تحديد الأنماط والتوزيعات في بيانات التدريب الخاصة بها ثم تطبيق هذه النتائج على توليد بيانات جديدة بناءً على مدخلات المستخدم. تُعلم عملية التدريب النموذج التعرف على التوزيعات الاحتمالية المشتركة للميزات في مجموعة بيانات التدريب. ثم يعتمد النموذج على ما تعلمه لإنشاء عينات بيانات جديدة مشابهة لبيانات التدريب. 

عادةً ما تُدرب النماذج التوليدية باستخدام تقنيات التعلم غير الخاضع للإشراف: عند تغذيتها بكمية من البيانات غير المصنفة وتترك لتصنيفها بنفسها. تكتشف النماذج توزيع البيانات، وهي الطريقة التي تطور من خلالها المنطق الداخلي الذي تستخدمه بعد ذلك لإنشاء بيانات جديدة. 

في أثناء التدريب، يطبق النموذج دالة خسارة لقياس الفجوة بين النتائج الحقيقية وتوقعات النموذج. ويتمثل الهدف من التدريب في تقليل دالة الخسارة إلى أدنى حد ممكن، ما يجعل النواتج التي تنشأ أقرب ما يمكن إلى الواقع. 

توليد المحتوى هو عملية احتمالية. لا تعرف النماذج التوليدية الأشياء بالطريقة نفسها التي يعرفها البشر. بدلاً من ذلك، يستخدم النموذج التوليدي معادلات رياضية معقدة للتنبؤ بالنواتج الأكثر احتمالاً بناءً على القواعد التي تعلمها في أثناء التدريب. 

مقارنة بين النماذج التوليدية وأنواع النماذج الأخرى 

تحاول النماذج التوليدية توليد بيانات جديدة من فئة معينة. تفصل النماذج التمييزية العناصر إلى مجموعات معروفة، بينما تكتشف النماذج التجميعية كيفية تجميع العناصر في مجموعة بيانات. وتضع النماذج التنبئية تقديرات حول الأحداث أو الحالات المستقبلية بناءً على البيانات القديمة.

  • تُستخدم النماذج التمييزية في مهام التعلم الخاضع للإشراف حيث تكون تصنيفات أو فئات البيانات معروفة. العديد من النماذج التمييزية هي مصنفات تحاول تحديد العلاقات بين الميزات والتصنيفات ومن ثم تعيين تصنيفات الفئات للبيانات الجديدة بناءً على الاحتمال الشرطي لتلك التصنيفات.

    على سبيل المثال، يمكن للنموذج التمييزي المدرب على التفريق بين صور الأسماك والطيور أن يخمن ما إذا كانت الصور من المرجح أن تكون أسماكًا أم طيورًا. يُعد التعرف على الصور، أحد أنواع التصنيف في التعلم الآلي، تطبيقًا شائعًا للنماذج التمييزية.

    في حين أن النماذج التوليدية والنماذج التمييزية لها اختلافات مميزة، فإنها غالبًا ما تعمل معًا، كما هو الحال في الشبكة التنافسية التوليدية (GAN).

  • تُستخدم نماذج التجميع في مهام التعلم غير الخاضع للإشراف لتجميع السجلات ضمن مجموعة بيانات في مجموعات. ويمكنها تحديد العناصر المتشابهة ومعرفة ما يفصل تلك العناصر عن المجموعات الأخرى في مجموعة البيانات.

    تفتقر نماذج التجميع إلى المعرفة المسبقة بالعناصر الموجودة في مجموعة البيانات، بما في ذلك معرفة عدد المجموعات التي قد تكون موجودة. قد يستخدم باحث السوق نموذج التجميع لتحديد شخصيات المشترين ضمن التركيبة السكانية المستهدفة.

  • تعالج النماذج التنبئية البيانات القديمة لوضع تنبؤات حول الأحداث المستقبلية باستخدام التعلم الآلي والتحليل الإحصائي. وغالبًا ما تُستخدم لمساعدة قادة الأعمال على اتخاذ قرارات قائمة على البيانات. تعمل النماذج التنبئية أيضًا على تشغيل خدمات النصوص التنبئية وبرامج التعرف على الوجوه واكتشاف الاحتيال وحلول إدارة سلسلة التوريد. 

  • تُزود النماذج التوليدية ببيانات غير مصنفة في أثناء التدريب. حيث تتولى هذه النماذج الهندسة العكسية لمعايير التصنيف. بالنظر إلى تصنيف محدد، ما الميزات التي تجعل نقطة البيانات تحصل على هذا التصنيف؟ تريد النماذج التوليدية التنبؤ بميزات التصنيف ثم استخدام تلك الميزات لتوليد أمثلة جديدة لتلك البيانات.

    يمكن للنموذج التوليدي المدرّب على توليد صور للحيوانات أن يحاول إنشاء صورة لسمكة بناءً على ما يعتقد أنه يجعل السمكة مختلفة عن الحيوانات الأخرى. توليد الصور هو حالة استخدام متكررة للنماذج التوليدية.

تصميم ثلاثي الأبعاد لكرات تتدحرج على مسار

أحدث الأخبار والرؤى حول الذكاء الاصطناعي 


تتوفر معارف وأخبار منسقة بمهارة حول الذكاء الاصطناعي والسحابة وغيرها في نشرة Think الإخبارية الأسبوعية. 

أنواع النماذج التوليدية

توجد أنواع عديدة من النماذج التوليدية، ولكل منها بنيته المميزة: هيكل النموذج الذي يحكم كيفية عمله. النماذج التوليدية العميقة هي نوع فرعي من النماذج التوليدية التي تستخدم هياكل شبكات عصبية متعددة الطبقات للتعلم العميق - الشبكات العصبية العميقة - لفهم العلاقات المعقدة والمتعددة الأوجه بين نقاط البيانات في مجموعة البيانات.

  • تنشئ نماذج الانتشار بيانات جديدة عن طريق إضافة الضوضاء تدريجيًا إلى مجموعة البيانات، ثم اكتشاف كيفية إزالة الضوضاء وإنتاج نواتج جديدة. 

  • تقرن الشبكات التنافسية التوليدية (GANs) نموذجًا تمييزيًا ونموذجًا توليديًا معًا في منافسة، والهدف من ذلك هو أن يُنشئ النموذج التوليدي نواتج تخدع النموذج التمييزي.

  • تتعلم النماذج القائمة على التدفق العلاقات بين التوزيعات البسيطة والمعقدة للبيانات من خلال عمليات رياضية عكسية.

النماذج الانحدارية التلقائية

تتنبأ النماذج الانحدارية التلقائية بالعنصر التالي في التسلسل بناءً على العناصر السابقة. فهي تقيّم المكونات في التسلسل لتحديد الارتباط الاحتمالي بينها، ثم تستخدم تلك المعلومات لتحديد المكون الجديد الذي من المحتمل أن يتبعه.

الانحدار التلقائي هو نوع من أنواع الانحدار الخطي، وهو أسلوب إحصائي يتنبأ بقيمة متغير بناءً على قيم متغير واحد أو أكثر. يضيّق الانحدار التلقائي التركيز على المتغيّر المستهدف لكنه يأخذ في الحسبان قيمه مع مرور الوقت. ويختلف الانحدار التلقائي أيضًا عن الانحدار اللوجستي في أنه يتنبأ بقيم محددة بينما ينتج الأخير نسبة مئوية لاحتمال وقوع حدث محدد.

تأخذ النماذج الانحدارية التلقائية شكل شبكات عصبية متكررة (RNNs) أو بنيات المحولات.

نماذج المحولات

ظهرت نماذج المحولات لأول مرة في عام 20171، وسرعان ما تفوقت نماذج المحولات على الشبكات العصبية المتكرر والتي كانت حتى ذلك الحين الشكل الرائد للنموذج الانحداري التلقائي. عالج المحول العديد من نقاط الضعف الصارخة في الشبكة العصبية المتكررة. وواجهت الشبكات العصبية المتكررة تحديات لالتقاط التبعيات بعيدة المدى - العلاقات بين العناصر المتباعدة في تسلسل ما - وكانت غير فعالة من الناحية الحسابية لأنها كانت تعالج العناصر بالتتابع، واحدًا تلو الآخر. 

قدمت المحولات ابتكارين قفزا بالبنية إلى ما بعد الشبكات العصبية المتكررة وجعلاها المعيار الفعلي للنماذج اللغوية الكبيرة (LLMs) في الذكاء الاصطناعي التوليدي: 

  • المعالجة المتوازية: تتعالج المحولات كل العناصر في تسلسل ما في وقت واحد، ما يحسن الكفاءة مقارنةً بالشبكات العصبية المتكررة المتسلسلة. يمكن تدريب المحولات في وقت أقل بكثير، خاصةً مع مجموعات البيانات واسعة النطاق المطلوبة للحصول على أفضل أداء للنماذج اللغوية الكبيرة. 

  • آليات الانتباه الذاتي: يمكن أن تأخذ المحولات في الحسبان الأهمية النسبية لكل العناصر في التسلسل عند معالجة العناصر. يُمكّن الانتباه الذاتي المحولات من التقاط العلاقات الرئيسية بين العناصر المتباعدة في السلسلة، ما يتيح فهمًا سياقيًا تفتقر إليه الشبكات العصبية المتكررة. وتقود القدرة على معالجة السياق عبر تسلسلات المدخلات الكبيرة المحولات إلى التفوق في مهام معالجة اللغات الطبيعية مثل توليد النصوص وترجمة اللغات. 

من بين الأنواع الثلاثة لنماذج المحولات - أدوات التشفير وأدوات فك التشفير وأدوات التشفير وفك التشفير - فإن النوعين الأخيرين يحتويان على مكونات انحدار تلقائي. تُعد أدوات فك التشفير هي المكون التوليدي وتستخدم الانحدار التلقائي لتوليد رموز مستندة إلى رموز منشأة مسبقًا. 

حالات استخدام النماذج الانحدارية التلقائية

تُستخدم النماذج الانحدارية التلقائية، وخاصة المحولات، على نطاق واسع اليوم. العديد من نماذج الذكاء الاصطناعي التوليدي الرائدة هي محولات، بما في ذلك GPT وGPT-4o من OpenAI، و Claude من Anthropic وLlama من Meta وGemini من Google وGranite من IBM. 

تشمل حالات استخدام النموذج الانحداري التلقائي ما يأتي:

  • معالجة اللغة الطبيعية: يمكن للمحولات معالجة استفسارات اللغة الطبيعية المعقدة والاستجابة بشكل حواري مع توليد نص آلي، ما يجعلها مثالية للاستخدام بمثابة روبوتات محادثة. على سبيل المثال، ChatGPT هو تطبيق روبوت المحادثة من OpenAI لنموذج GPT التوليدي الخاص بهم. وتشمل تطبيقات معالجة اللغة الطبيعية الأخرى تحليل المشاعر والتعرف على الكلام وتطبيقات تحويل النص إلى كلام (TTS) وتلخيص المستندات. 

  • دعم الترميز: إن القدرات الانحدارية التلقائية نفسها التي تُمكّن المحولات من التفوق في توليد النصوص تسمح لها أيضًا بتصحيح التعليمات البرمجية وتوليد مقاطع منها.

  • التنبؤ بالسلاسل الزمنية: يمكن تطبيق الانحدار التلقائي بسهولة على التنبؤ بالسلاسل الزمنية، حيث يتنبأ النموذج بالقيم المستقبلية بناءً على الاتجاهات السابقة. كثيرًا ما يُطبق التنبؤ بالسلاسل الزمنية على وضع النماذج المالية وتوقعات السوق والتنبؤ بالطقس.

  • التعلم المعزز: بدأت المحولات تُستخدم في التعلم المعزز، وهي تقنية تدريب على التعلم الآلي لتعليم اتخاذ القرارات بشكل مستقل. وتُطبق المحولات أيضًا على مهام التصنيف.

نماذج الانتشار

تشوه نماذج الانتشار بالتدريج بيانات المدخلات وتشتتها عن طريق إضافة ضوضاء، ثم تنقح الفوضى التي أنشأتها إلى بيانات جديدة مشابهة. فهي تولد بيانات جديدة من خلال تعلم تنقية الضوضاء إلى بيانات مشابهة لمجموعات بيانات التدريب الخاصة بها. تعمل نماذج الانتشار من خلال عملية من 3 مراحل:

  • الخطوة 1: الانتشار: في أثناء التدريب، يُدخل النموذج ضوضاء تدريجيًا إلى بيانات الإدخال الخاصة به حتى لا يمكن التعرف على البيانات. ويضيف النموذج كمية صغيرة من الضوضاء الجاوسية إلى البيانات في كل خطوة في عملية رياضية تُعرف باسم سلسلة ماركوف.

    تخيّل عملية الانتشار كعازف جيتار يرفع ببطء مقبض المكسب في مكبر الصوت حتى يصبح صوت الجيتار ضجيجًا عاليًا. هذه هي الطريقة التي يحصل بها عازفو جيتار الروك على صوت مشوه في موسيقاهم، وإن لم يكن عادةً إلى هذا الحد.

  • الخطوة 2: التعلم: يتتبع النموذج تطور البيانات التي دُمرت حاليًا لفهم كيف تغيرت من خلال عملية إضافة الضوضاء. تكرر نماذج الانتشار هذه العملية في كل مرحلة من مراحل إضافة الضوضاء.

  • الخطوة 3: الانتشار العكسي: من خلال فهم كيفية تغيير الضوضاء للبيانات، يتعلم نموذج الانتشار عكس عملية إضافة الضوضاء وإعادة بناء البيانات المدخلة. والهدف من الانتشار العكسي هو الانتقال إلى الوراء عبر سلسلة ماركوف، وإزالة الضوضاء الجاوسية حتى لا يتبقى سوى البيانات النقية. تلقى عازف الجيتار من الخطوة 1 توبيخًا شديدًا من زملائه في الفرقة الموسيقية ويعيد الآن ضبط مستوى الصوت إلى مستوى مقبول. 

تُطبق الخطوتين 1 و2 لتدريب نماذج الانتشار. بعد التدريب، تولد نماذج الانتشار البيانات عن طريق الانتشار العكسي للضوضاء العشوائية "للعثور" على البيانات المطلوبة من قِبل المستخدم.

حالات استخدام نموذج الانتشار

غالبًا ما تُستخدم نماذج الانتشار في توليد الصور، إلا أن نماذج الانتشار لها حالات استخدام بارزة أخرى أيضًا. تتضمن تطبيقات نموذج الانتشار ما يأتي:

  • توليد الصور: تعمل نماذج الانتشار على تشغيل أدوات توليد الصور وأدوات تركيب الصور الشائعة مثل Midjourney وStable Diffusion وDALL-E من OpenAI. تولد هذه النماذج صورًا استجابةً لمطالبات المستخدم. يمكن لنماذج الانتشار توليد صور واقعية عالية الجودة، بما في ذلك صور الوجوه البشرية.

    حكم مكتب حقوق الطبع والنشر الأمريكي في عام 2023 بأن الصور التي يولدها الذكاء الاصطناعي لا تخضع لحماية حقوق الطبع والنشر. وفي الوقت نفسه، ستحدد العديد من الدعاوى القضائية العديدة الجارية2 في نهاية المطاف ما إذا كانت الصور التي يُنشئها الذكاء الاصطناعي تُعد انتهاكات لحقوق الطبع والنشر.

  • الرسم الداخلي والخارجي: الرسم الداخلي هو عملية إضافة محتوى داخل الصورة أو إزالته، بينما يوسع الرسم الخارجي الصورة إلى ما وراء حدودها الأصلية.

  • وضع النماذج ثلاثية الأبعاد: يعد DreamFusion من Google وMagic3D من NVIDIA من نماذج الانتشار التي تنشئ نماذج ثلاثية الأبعاد من مدخلات نصية.

  • أبحاث السوق: تُظهر نماذج الانتشار كيف تتطور الأشياء بمرور الوقت، ما يجعلها مفيدة لفهم كيفية تفاعل المستهلكين مع المنتج.

  • اكتشاف حالات الخلل: نظرًا لقدرتها على معرفة كيفية تغير البيانات بمرور الوقت، يمكن لنماذج الانتشار تحديد متى لا تتناسب نقاط البيانات مع الاتجاهات الثابتة. وتشمل تطبيقات اكتشاف حالات الخلل الأمن الإلكتروني ومنع الاحتيال والكشف عن الأمراض.

أكاديمية الذكاء الاصطناعي

كن خبيرًا في الذكاء الاصطناعي

اكتسب المعرفة لتحديد أولويات استثمارات الذكاء الاصطناعي التي تدفع نمو الأعمال. ابدأ مع أكاديمية الذكاء الاصطناعي المجانية اليوم وتولَّ زمام المبادرة لتعزيز مستقبل الذكاء الاصطناعي في مؤسستك.

الشبكات التنافسية التوليدية (GANs)

طُرحت الشبكات التنافسية التوليدية (GANs) في عام 2014، وهي من بين أقدم أنواع نماذج الذكاء الاصطناعي التوليدي التي تقرن نموذجين معًا في منافسة. ينشئ النموذج التوليدي نواتج يجب على النموذج التمييزي أن يحدد ما إذا كانت أصلية أم مزيفة. والهدف من المنافسة هو أن يولد النموذج التوليدي محتوى يُعتبر أصليًا عند الحكم عليه من قِبل النموذج التمييزي.

إذا كان النموذج التوليدي مزورًا للأعمال الفنية، فإن النموذج التمييزي هو موثق الفني. قد يحصل تاجر الأعمال الفنية على عمل فني مزور ويحاول بيعه إلى متحف، ولكن ليس قبل أن يجتاز العمل الفني عملية التوثيق. وبينما يصبح المزور أفضل في تقليد كبار الفنانين، قد يجد الموثق صعوبة في اكتشاف الأعمال المزيفة التي تليه. وسرعان ما يستضيف المتحف معرضًا مليئًا بالأعمال المزورة.

يمكن أن تؤدي أيضًا عملية التدريب نفسها التي تؤدي إلى نواتج واقعية إلى انهيار الوضع: عندما يترك النموذج التوليدي بعض بيانات التدريب ويقتصر على نطاق ضيق من أنواع العينات. تتطلب الشبكات التنافسية التوليدية، وكذلك نماذج الانتشار والمحولات، مجموعات بيانات تدريبية ضخمة لتحقيق أداء فعال.

وغالبًا ما تكون كلتا الشبكتين في الشبكة الخصومية التوليدية شبكات عصبية تلافيفية (CNNs)، وهو نوع مبكر من الشبكات العصبية التي تتميز بأدائها القوي في مهام الرؤية الحاسوبية.

حالات استخدام الشبكة التنافسية التوليدية (GANs)

تُستخدم الشبكات التنافسية التوليدية بشكل أساسي في مجال الرؤية الحاسوبية والمهام الأخرى المتعلقة بالرسومات.

  • الرؤية الحاسوبية: الرؤية الحاسوبية هي استخدام التعلم الآلي لمعالجة المعلومات من الصور. وتتضمن مهام الرؤية الحاسوبية الشائعة اكتشاف الأجسام وتصنيفها والتعرف على الوجوه وترجمة لغة الإشارة وتتبع الأجسام.

  • توليد الصور: يمكن للشبكات التنافسية التوليدية أن تتفوق على نماذج الانتشار في توليد صور واقعية. كما أنها تتطلب وقتًا أقل في التدريب وأكثر كفاءة في الحوسبة، على الرغم من أن نماذج الانتشار توفر تحكمًا أدق وتنوعًا أكبر واستقرارًا أكبر. يُدرب إطار عمل Diffusion-GAN3 إحدى الشبكات التنافسية التوليدية باستخدام عملية الانتشار لتحقيق أقصى قدر من مزايا كلا النوعين من النماذج.
  • اكتشاف حالات الخلل: عند تدريبها على توليد مجموعات بيانات عادية، يمكن تطبيق الشبكات التنافسية التوليدية على مهام الكشف عن حالات الخلل. تُنشئ الشبكة التنافسية التوليدية مجموعة بيانات اصطناعية على غرار البيانات الحقيقة، ومن خلال المقارنة بين الاثنين، تبرز حالات الخلل في البيانات الحقيقة. يمكن للنموذج التمييزي أيضًا اكتشاف حالات الخلل من خلال الإعلان عن نقاط بيانات معينة من المرجح أن تكون مزيفة.
  • زيادة البيانات: يمكن لزيادة البيانات - أي استخدام البيانات الموجودة مسبقًا لإنشاء المزيد من عينات البيانات - أن تعزز أداء الرؤية الحاسوبية بشكل أكبر مع الشبكات العصبية التلافيفية. تختلف هذه العملية عن البيانات الاصطناعية في أنها تتوسع في البيانات الحقيقية، بدلاً من توليد شيء من الصفر.

برامج التشفير التلقائي المتغيرة (VAEs)

تضغط برامج التشفير التلقائي المتغيرة (VAEs) البيانات المدخلة، ثم توسع هذا الضغط أو تفك تشفيره لتوليد بيانات جديدة مشابهة. وتتعلم برامج التشفير التلقائي المتغيرة توزيع مجموعة بيانات التدريب وتطبق تلك التوقعات عند توليد بيانات جديدة من العينات المشفرة. مثل كل برامج التشفير التلقائي، تتألف برامج التشفير التلقائي المتغيرة من مكونين: أداة تشفير وأداة فك تشفير.

تتمثل مهمة أداة التشفير في تعلم المتغيرات الكامنة في مجموعة البيانات. ولا يمكن ملاحظة المتغيرات الكامنة بشكل مباشر ولكنها تؤدي دورًا مهمًا في توزيع البيانات. الفضاء الكامن هو الاسم الجماعي لكل المتغيرات الكامنة في مجموعة البيانات. تضع أداة التشفير نماذج الفضاء الكامن بطريقة تلتقط المعلومات اللازمة لإعادة بناء البيانات بدقة. وتُحذف كل المتغيرات الأخرى. 

تأخذ أداة فك التشفير التمثيل المضغوط للبيانات، والمعروف باسم عنق الزجاجة، وتستقرؤه مرة أخرى إلى الشكل الأصلي للبيانات. وتنتج أداة فك التشفير الفعالة نواتج مشابهة للبيانات الأصلية المضغوطة مسبقًا.

حالات استخدام برنامج التشفير التلقائي

تواجه برامج التشفير التلقائي المتغيرة (VAEs) صعوبةً في مهام توليد الصور مقارنةً بنماذج الانتشار وشبكات GAN، لكنها تتفوق في مجالات أخرى. 

  • توليد الصور: تُستخدم برامج التشفير التلقائي في توليد الصور، على الرغم من أن نماذج الانتشار قد حلت محلها على نطاق واسع في تطبيقات توليد الصور الشائعة. بالمقارنة مع نماذج توليد الصور الأخرى، تميل برامج التشفير التلقائي إلى إنتاج صور أكثر ضبابية بسبب "توسيطها" للفضاء الكامن.

  • علم الجينوم: تساعد برامج التشفير التلقائي علماء الوراثة في حساب قيم التكاثر - القيمة المتوقعة التي سيقدمها الحيوان مع نسله - بالإضافة إلى تعيين درجات مخاطر الأمراض.

  • اكتشاف حالات الخلل: تُعد برامج التشفير التلقائي أرخص وأسهل في التدريب من كل من الشبكات التنافسية التوليدية ونماذج الانتشار، ما يجعلها خيارًا جذابًا لمهام الكشف عن حالات الخلل. تُقارن البيانات المعاد إنشاؤها بالبيانات الأصلية لعزل الحالات التي تنحرف عن التوزيع المتوقع.

  • استكمال البيانات: يمكن لبرامج التشفير التلقائي إنشاء بيانات جديدة لاستبدال البيانات المفقودة واستعادة الملفات التالفة. وتتضمن الأمثلة على ذلك تنظيف الملفات الصوتية وإزالة التشويش من مقاطع الفيديو وكذلك التصوير الطبي. على الرغم من أن برامج التشفير التلقائي تميل إلى توليد صور ضبابية من الصفر، فإنها يمكن أن تستعيد الصور الضبابية الموجودة مسبقًا عن طريق إزالة الضبابية من الصورة.

  • التعلم شبه الخاضع للإشراف: تساعد برامج التشفير التلقائي على تدريب المصنفات من خلال التقاط توزيعات البيانات في مجموعات البيانات ذات التصنيف غير المكتمل. كما يمكن أيضًا أن تزيد برامج التشفير التلقائي البيانات لتوليد عينات تدريب إضافية للمصنف

النماذج القائمة على التدفق

تتعلم النماذج القائمة على التدفق توزيع البيانات من خلال سلسلة من التحويلات الرياضية القابلة للعكس. ويمكن أن تتقدم البيانات من دون خسارة من خلال سلسة العمليات هذه، المعروف باسم تدفق التعميم، في أي من الاتجاهين. في حين تقدر نماذج برامج التشفير التلقائي والشبكات التنافسية التوليدية توزيعات البيانات، تتعلم النماذج القائمة على التدفق بشكل صريح دالة الكثافة الاحتمالية لمجموعة البيانات.

في مجموعة بيانات معينة، تصف دالة الكثافة الاحتمالية كيفية توزيع البيانات. وتتدرج تدفقات التعميم من التوزيعات البسيطة إلى التوزيعات المعقدة حتى تُحدد دالة كثافة الاحتمالات للمتغير المستهدف.

يمكن للنماذج القائمة على التدفقات توليد عينات بيانات جديدة تحافظ على الخصائص الإحصائية نفسها لمجموعة البيانات الأولية. ومثل كل النماذج التوليدية، تعتمد العملية على مفهوم استخلاص عينات من بيانات التدريب وتطبيق رياضيات إحصائية معقدة لإنتاج نتائج متشابهة وجديدة.

حالات استخدام النماذج القائمة على التدفق

تتألق النماذج القائمة على التدفق في الحالات التي يكون فيها الحصول على تقييم دقيق لتوزيع البيانات أمرًا بالغ الأهمية.

  • توليد الصور: تعمل النماذج القائمة على التدفق على توليد الصور عن طريق تمرير ضوضاء مختارة بشكل عشوائي من خلال تدفقات التعميم لإنتاج صورة واضحة. PixelCNN هو نموذج بارز لتوليد الصور لعام 2016 يطبق الانحدار التلقائي على تسلسل التحويلات، ويمثل الصور بكسلاً بكسل.

  • تقدير دقيق للكثافة: إن تقدير الكثافة هو التحدي المتمثل في تحديد دالة الكثافة الاحتمالية لمجموعة بيانات استنادًا إلى بيانات يمكن ملاحظتها. وفي حين أن النماذج القائمة على التدفق يمكن أن تمثل بدقة توزيعات البيانات المعقدة، فإنها تواجه صعوبة في التقاط التبعيات بعيدة المدى عند مقارنتها بالمحولات. 

  • توليد الرسم البياني الجزيئي: استُخدمت النماذج القائمة على التدفق في توليد الرسم البياني الجزيئي، حيث توضع نماذج البنى الجزيئية الجديدة كرسوم بيانية من خلال نماذج الذكاء الاصطناعي التوليدي. ويُعد توليد الرسم البياني الجزيئي أداة مهمة في مساعدة العلماء والمهندسين في اكتشاف عقاقير ومواد جديدة.

النماذج التوليدية والهلوسات

العمليات نفسها التي غالبًا ما تؤدي إلى نتائج مبهرة هي أيضًا ما تجعل النماذج التوليدية تهلوس: عندما تنتج معلومات غير صحيحة أو مضللة. تحدث الهلوسات أو الأوهام عندما تتصور النماذج أنماطًا في مجموعات بيانات التدريب الخاصة بها غير موجودة في العالم الحقيقي. 

على سبيل المثال، عند طرح السؤال "في أي حلقة من مسلسل سينفيلد يذهب كرامر إلى بنجلاديش؟" على ChatGPT-4o mini، كانت الإجابة هي:

يسافر كرامر إلى بنجلاديش في الحلقة التي تحمل عنوان "جيري الصغير"، وهي الحلقة رقم 145 من مسلسل سينفيلد. تُعد هذه الحلقة رقم 145 [كما ورد] من المسلسل، وقد عُرضت لأول مرة خلال الموسم الثامن. في هذه الحلقة، يتورط كرامر في مخطط لاستيراد لعبة من بنجلاديش.

على الرغم من أن حلقة "جيري الصغير" هي الحلقة رقم 145 من مسلسل سينفيلد وبُثت خلال الموسم الثامن، فإنها تعرض كرامر وهو يشتري ديكًا ويدربه - وهو الديك الذي يحمل الاسم نفسه جيري الصغير. أدى تكرار السؤال نفسه على روبوت المحادثة إلى هلوسة ثانية مختلفة:

يذهب كرامر إلى بنجلاديش في الحلقة التي تحمل عنوان "جزر المالديف"، وهي الحلقة رقم 18 من الموسم التاسع. وفي هذه الحلقة، يحاول أن يبدأ حياة جديدة بعد رحلته، وتدور القصة حول فكرة أن يصبح صيادًا "بنجلاديشيًا".

في الواقع، الحلقة رقم 18 من الموسم التاسع من سينفيلد بعنوان "لعبة الضفدع"، وفيها يذهب كرامر إلى مركز الشرطة فقط. لا توجد حلقة من مسلسل سينفيلد تحمل اسم "جزر المالديف"، ولم يذهب كرامر إلى بنجلاديش في أي مرحلة من مراحل المسلسل بأكمله.

كما هو معروف أن نماذج الانحدار التلقائي مثل GPT تهلوس بحقائق مصطنعة، فإن أنواعًا أخرى من النماذج يمكن أن تهلوس بطرقها الخاصة. تصوّر نماذج الانتشار المستخدمة لتوليد الصور أحيانًا أجسام العالم الحقيقي بطرق لا تتطابق مع الواقع.

كيفية التخفيف من الهلوسات

على الرغم من أنه ليس من الممكن حتى الآن إزالة إمكانية أن تهلوس نماذج الذكاء الاصطناعي التوليدي بالكامل، فإن أفضل الممارسات للتخفيف من الهلوسة تشمل:

  • المطالبة الواضحة: كلما كانت مطالبة المستخدم أكثر وضوحًا، كلما كانت إجابة الذكاء الاصطناعي أكثر تركيزًا. امنح الذكاء الاصطناعي مساحة داخل المطالبة للإجابة بالتفاصيل.

  • التوجيه المركّز: يمكن أن يساعد إعطاء الذكاء الاصطناعي دورًا واضحًا وتوجيهه لتقديم معلومات صادقة يمكن التحقق منها على ضمان أن تعكس إجاباته الواقع بشكل أفضل.

  • بيانات عالية الجودة: كلما كانت بيانات التدريب الخاصة بنموذج الذكاء الاصطناعي حديثة وذات صلة، كلما قلت فرصة أن تكون إجاباته متحيزة.

  • التحقق البشري: يجب ألا تُستخدم النتائج التي يولدها الذكاء الاصطناعي من دون التحقق منها أولاً من قِبل البشر المطلعين.

  • التوليد المعزز بالاسترجاع (RAG) والضبط الدقيق: إن استخدام التوليد المعزز بالاسترجاع لتعزيز الذكاء الاصطناعي ببيانات موثوقة وضبط النماذج لتصبح أكثر تخصصًا في مجال معين كلاهما فعال في الحد من الهلوسات.

حلول ذات صلة
IBM watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai
حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي
خدمات الذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. تمكَّن من إنتاج حلول ذكاء اصطناعي قوية بفضل الواجهات سهلة الاستخدام وعمليات سير العمل السلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرامج القياسية في الصناعة.

استكشف watsonx.ai احجز عرضًا توضيحيًا مباشرًا