النموذج التوليدي هو نموذج تعلم آلي مصمم لإنشاء بيانات جديدة مشابهة لبيانات التدريب الخاصة به. تتعلم نماذج الذكاء الاصطناعي (AI) التوليدي أنماط بيانات التدريب وتوزيعاتها، ثم تطبّق هذه المفاهيم لتوليد محتوى جديد استجابةً لبيانات المدخلات الجديدة.
عملية توليد المحتوى هي التي تفصل نماذج الذكاء الاصطناعي التوليدي عن الأنواع الأخرى من الذكاء الاصطناعي. النماذج التوليدية هي شبكات عصبية متقدمة تحاكي بنية الدماغ البشري وتطبق خوارزميات التعلم الآلي المعقدة لمعالجة بيانات التدريب وإنشاء نواتج جديدة.
وقد قادت نماذج الذكاء الاصطناعي التوليدي ومطوروها بشكل رئيسي روح العصر في مجال الذكاء الاصطناعي في السنوات العديدة الماضية. ولا تزال النماذج التوليدية تحظى بمعظم التغطية الإخبارية المتعلقة بالذكاء الاصطناعي وتستحوذ على اهتمام واستثمارات كبيرة.
الذكاء الاصطناعي التوليدي هو نوع من الذكاء الاصطناعي يستخدم نماذج متطورة لتوليد محتوى جديد وفقًا لمطلب إدخال. النموذج التوليدي هو البرنامج الحاسوبي الذي يستخدم البيانات والخوارزميات لتسهيل ممارسة الذكاء الاصطناعي التوليدي. وتشمل حالات استخدام الذكاء الاصطناعي التوليدي تلخيص النصوص وتوليد النصوص وتوليد الصور، بالإضافة إلى وضع نماذج ثلاثية الأبعاد وإنشاء الصوت.
تعمل النماذج التوليدية من خلال تحديد الأنماط والتوزيعات في بيانات التدريب الخاصة بها ثم تطبيق هذه النتائج على توليد بيانات جديدة بناءً على مدخلات المستخدم. تُعلم عملية التدريب النموذج التعرف على التوزيعات الاحتمالية المشتركة للميزات في مجموعة بيانات التدريب. ثم يعتمد النموذج على ما تعلمه لإنشاء عينات بيانات جديدة مشابهة لبيانات التدريب.
عادةً ما تُدرب النماذج التوليدية باستخدام تقنيات التعلم غير الخاضع للإشراف: عند تغذيتها بكمية من البيانات غير المصنفة وتترك لتصنيفها بنفسها. تكتشف النماذج توزيع البيانات، وهي الطريقة التي تطور من خلالها المنطق الداخلي الذي تستخدمه بعد ذلك لإنشاء بيانات جديدة.
في أثناء التدريب، يطبق النموذج دالة خسارة لقياس الفجوة بين النتائج الحقيقية وتوقعات النموذج. ويتمثل الهدف من التدريب في تقليل دالة الخسارة إلى أدنى حد ممكن، ما يجعل النواتج التي تنشأ أقرب ما يمكن إلى الواقع.
توليد المحتوى هو عملية احتمالية. لا تعرف النماذج التوليدية الأشياء بالطريقة نفسها التي يعرفها البشر. بدلاً من ذلك، يستخدم النموذج التوليدي معادلات رياضية معقدة للتنبؤ بالنواتج الأكثر احتمالاً بناءً على القواعد التي تعلمها في أثناء التدريب.
تحاول النماذج التوليدية توليد بيانات جديدة من فئة معينة. تفصل النماذج التمييزية العناصر إلى مجموعات معروفة، بينما تكتشف النماذج التجميعية كيفية تجميع العناصر في مجموعة بيانات. وتضع النماذج التنبئية تقديرات حول الأحداث أو الحالات المستقبلية بناءً على البيانات القديمة.
تُستخدم النماذج التمييزية في مهام التعلم الخاضع للإشراف حيث تكون تصنيفات أو فئات البيانات معروفة. العديد من النماذج التمييزية هي مصنفات تحاول تحديد العلاقات بين الميزات والتصنيفات ومن ثم تعيين تصنيفات الفئات للبيانات الجديدة بناءً على الاحتمال الشرطي لتلك التصنيفات.
على سبيل المثال، يمكن للنموذج التمييزي المدرب على التفريق بين صور الأسماك والطيور أن يخمن ما إذا كانت الصور من المرجح أن تكون أسماكًا أم طيورًا. يُعد التعرف على الصور، أحد أنواع التصنيف في التعلم الآلي، تطبيقًا شائعًا للنماذج التمييزية.
في حين أن النماذج التوليدية والنماذج التمييزية لها اختلافات مميزة، فإنها غالبًا ما تعمل معًا، كما هو الحال في الشبكة التنافسية التوليدية (GAN).
تُستخدم نماذج التجميع في مهام التعلم غير الخاضع للإشراف لتجميع السجلات ضمن مجموعة بيانات في مجموعات. ويمكنها تحديد العناصر المتشابهة ومعرفة ما يفصل تلك العناصر عن المجموعات الأخرى في مجموعة البيانات.
تفتقر نماذج التجميع إلى المعرفة المسبقة بالعناصر الموجودة في مجموعة البيانات، بما في ذلك معرفة عدد المجموعات التي قد تكون موجودة. قد يستخدم باحث السوق نموذج التجميع لتحديد شخصيات المشترين ضمن التركيبة السكانية المستهدفة.
تعالج النماذج التنبئية البيانات القديمة لوضع تنبؤات حول الأحداث المستقبلية باستخدام التعلم الآلي والتحليل الإحصائي. وغالبًا ما تُستخدم لمساعدة قادة الأعمال على اتخاذ قرارات قائمة على البيانات. تعمل النماذج التنبئية أيضًا على تشغيل خدمات النصوص التنبئية وبرامج التعرف على الوجوه واكتشاف الاحتيال وحلول إدارة سلسلة التوريد.
تُزود النماذج التوليدية ببيانات غير مصنفة في أثناء التدريب. حيث تتولى هذه النماذج الهندسة العكسية لمعايير التصنيف. بالنظر إلى تصنيف محدد، ما الميزات التي تجعل نقطة البيانات تحصل على هذا التصنيف؟ تريد النماذج التوليدية التنبؤ بميزات التصنيف ثم استخدام تلك الميزات لتوليد أمثلة جديدة لتلك البيانات.
يمكن للنموذج التوليدي المدرّب على توليد صور للحيوانات أن يحاول إنشاء صورة لسمكة بناءً على ما يعتقد أنه يجعل السمكة مختلفة عن الحيوانات الأخرى. توليد الصور هو حالة استخدام متكررة للنماذج التوليدية.
توجد أنواع عديدة من النماذج التوليدية، ولكل منها بنيته المميزة: هيكل النموذج الذي يحكم كيفية عمله. النماذج التوليدية العميقة هي نوع فرعي من النماذج التوليدية التي تستخدم هياكل شبكات عصبية متعددة الطبقات للتعلم العميق - الشبكات العصبية العميقة - لفهم العلاقات المعقدة والمتعددة الأوجه بين نقاط البيانات في مجموعة البيانات.
تتنبأ النماذج الانحدارية التلقائية بنقطة البيانات التالية في تسلسل ما بناءً على مثيلات البيانات السابقة. تتفوق المحولات في مهام معالجة اللغة الطبيعية (NLP) نظرًا لقدرتها المعززة على معالجة السياق.
تنشئ نماذج الانتشار بيانات جديدة عن طريق إضافة الضوضاء تدريجيًا إلى مجموعة البيانات، ثم اكتشاف كيفية إزالة الضوضاء وإنتاج نواتج جديدة.
تقرن الشبكات التنافسية التوليدية (GANs) نموذجًا تمييزيًا ونموذجًا توليديًا معًا في منافسة، والهدف من ذلك هو أن يُنشئ النموذج التوليدي نواتج تخدع النموذج التمييزي.
تضغط برامج التشفير التلقائي المتغيرة (VAEs) البيانات المدخلة باستخدام أداة تشفير، ثم تعكس العملية باستخدام أداة فك تشفير لإنشاء بيانات جديدة مماثلة.
تتعلم النماذج القائمة على التدفق العلاقات بين التوزيعات البسيطة والمعقدة للبيانات من خلال عمليات رياضية عكسية.
تتنبأ النماذج الانحدارية التلقائية بالعنصر التالي في التسلسل بناءً على العناصر السابقة. فهي تقيّم المكونات في التسلسل لتحديد الارتباط الاحتمالي بينها، ثم تستخدم تلك المعلومات لتحديد المكون الجديد الذي من المحتمل أن يتبعه.
الانحدار التلقائي هو نوع من أنواع الانحدار الخطي، وهو أسلوب إحصائي يتنبأ بقيمة متغير بناءً على قيم متغير واحد أو أكثر. يضيّق الانحدار التلقائي التركيز على المتغيّر المستهدف لكنه يأخذ في الحسبان قيمه مع مرور الوقت. ويختلف الانحدار التلقائي أيضًا عن الانحدار اللوجستي في أنه يتنبأ بقيم محددة بينما ينتج الأخير نسبة مئوية لاحتمال وقوع حدث محدد.
تأخذ النماذج الانحدارية التلقائية شكل شبكات عصبية متكررة (RNNs) أو بنيات المحولات.
ظهرت نماذج المحولات لأول مرة في عام 20171، وسرعان ما تفوقت نماذج المحولات على الشبكات العصبية المتكرر والتي كانت حتى ذلك الحين الشكل الرائد للنموذج الانحداري التلقائي. عالج المحول العديد من نقاط الضعف الصارخة في الشبكة العصبية المتكررة. وواجهت الشبكات العصبية المتكررة تحديات لالتقاط التبعيات بعيدة المدى - العلاقات بين العناصر المتباعدة في تسلسل ما - وكانت غير فعالة من الناحية الحسابية لأنها كانت تعالج العناصر بالتتابع، واحدًا تلو الآخر.
قدمت المحولات ابتكارين قفزا بالبنية إلى ما بعد الشبكات العصبية المتكررة وجعلاها المعيار الفعلي للنماذج اللغوية الكبيرة (LLMs) في الذكاء الاصطناعي التوليدي:
المعالجة المتوازية: تتعالج المحولات كل العناصر في تسلسل ما في وقت واحد، ما يحسن الكفاءة مقارنةً بالشبكات العصبية المتكررة المتسلسلة. يمكن تدريب المحولات في وقت أقل بكثير، خاصةً مع مجموعات البيانات واسعة النطاق المطلوبة للحصول على أفضل أداء للنماذج اللغوية الكبيرة.
آليات الانتباه الذاتي: يمكن أن تأخذ المحولات في الحسبان الأهمية النسبية لكل العناصر في التسلسل عند معالجة العناصر. يُمكّن الانتباه الذاتي المحولات من التقاط العلاقات الرئيسية بين العناصر المتباعدة في السلسلة، ما يتيح فهمًا سياقيًا تفتقر إليه الشبكات العصبية المتكررة. وتقود القدرة على معالجة السياق عبر تسلسلات المدخلات الكبيرة المحولات إلى التفوق في مهام معالجة اللغات الطبيعية مثل توليد النصوص وترجمة اللغات.
من بين الأنواع الثلاثة لنماذج المحولات - أدوات التشفير وأدوات فك التشفير وأدوات التشفير وفك التشفير - فإن النوعين الأخيرين يحتويان على مكونات انحدار تلقائي. تُعد أدوات فك التشفير هي المكون التوليدي وتستخدم الانحدار التلقائي لتوليد رموز مستندة إلى رموز منشأة مسبقًا.
تُستخدم النماذج الانحدارية التلقائية، وخاصة المحولات، على نطاق واسع اليوم. العديد من نماذج الذكاء الاصطناعي التوليدي الرائدة هي محولات، بما في ذلك GPT وGPT-4o من OpenAI، و Claude من Anthropic وLlama من Meta وGemini من Google وGranite من IBM.
تشمل حالات استخدام النموذج الانحداري التلقائي ما يأتي:
معالجة اللغة الطبيعية: يمكن للمحولات معالجة استفسارات اللغة الطبيعية المعقدة والاستجابة بشكل حواري مع توليد نص آلي، ما يجعلها مثالية للاستخدام بمثابة روبوتات محادثة. على سبيل المثال، ChatGPT هو تطبيق روبوت المحادثة من OpenAI لنموذج GPT التوليدي الخاص بهم. وتشمل تطبيقات معالجة اللغة الطبيعية الأخرى تحليل المشاعر والتعرف على الكلام وتطبيقات تحويل النص إلى كلام (TTS) وتلخيص المستندات.
دعم الترميز: إن القدرات الانحدارية التلقائية نفسها التي تُمكّن المحولات من التفوق في توليد النصوص تسمح لها أيضًا بتصحيح التعليمات البرمجية وتوليد مقاطع منها.
التنبؤ بالسلاسل الزمنية: يمكن تطبيق الانحدار التلقائي بسهولة على التنبؤ بالسلاسل الزمنية، حيث يتنبأ النموذج بالقيم المستقبلية بناءً على الاتجاهات السابقة. كثيرًا ما يُطبق التنبؤ بالسلاسل الزمنية على وضع النماذج المالية وتوقعات السوق والتنبؤ بالطقس.
التعلم المعزز: بدأت المحولات تُستخدم في التعلم المعزز، وهي تقنية تدريب على التعلم الآلي لتعليم اتخاذ القرارات بشكل مستقل. وتُطبق المحولات أيضًا على مهام التصنيف.
تشوه نماذج الانتشار بالتدريج بيانات المدخلات وتشتتها عن طريق إضافة ضوضاء، ثم تنقح الفوضى التي أنشأتها إلى بيانات جديدة مشابهة. فهي تولد بيانات جديدة من خلال تعلم تنقية الضوضاء إلى بيانات مشابهة لمجموعات بيانات التدريب الخاصة بها. تعمل نماذج الانتشار من خلال عملية من 3 مراحل:
الخطوة 1: الانتشار: في أثناء التدريب، يُدخل النموذج ضوضاء تدريجيًا إلى بيانات الإدخال الخاصة به حتى لا يمكن التعرف على البيانات. ويضيف النموذج كمية صغيرة من الضوضاء الجاوسية إلى البيانات في كل خطوة في عملية رياضية تُعرف باسم سلسلة ماركوف.
تخيّل عملية الانتشار كعازف جيتار يرفع ببطء مقبض المكسب في مكبر الصوت حتى يصبح صوت الجيتار ضجيجًا عاليًا. هذه هي الطريقة التي يحصل بها عازفو جيتار الروك على صوت مشوه في موسيقاهم، وإن لم يكن عادةً إلى هذا الحد.
الخطوة 2: التعلم: يتتبع النموذج تطور البيانات التي دُمرت حاليًا لفهم كيف تغيرت من خلال عملية إضافة الضوضاء. تكرر نماذج الانتشار هذه العملية في كل مرحلة من مراحل إضافة الضوضاء.
الخطوة 3: الانتشار العكسي: من خلال فهم كيفية تغيير الضوضاء للبيانات، يتعلم نموذج الانتشار عكس عملية إضافة الضوضاء وإعادة بناء البيانات المدخلة. والهدف من الانتشار العكسي هو الانتقال إلى الوراء عبر سلسلة ماركوف، وإزالة الضوضاء الجاوسية حتى لا يتبقى سوى البيانات النقية. تلقى عازف الجيتار من الخطوة 1 توبيخًا شديدًا من زملائه في الفرقة الموسيقية ويعيد الآن ضبط مستوى الصوت إلى مستوى مقبول.
تُطبق الخطوتين 1 و2 لتدريب نماذج الانتشار. بعد التدريب، تولد نماذج الانتشار البيانات عن طريق الانتشار العكسي للضوضاء العشوائية "للعثور" على البيانات المطلوبة من قِبل المستخدم.
غالبًا ما تُستخدم نماذج الانتشار في توليد الصور، إلا أن نماذج الانتشار لها حالات استخدام بارزة أخرى أيضًا. تتضمن تطبيقات نموذج الانتشار ما يأتي:
توليد الصور: تعمل نماذج الانتشار على تشغيل أدوات توليد الصور وأدوات تركيب الصور الشائعة مثل Midjourney وStable Diffusion وDALL-E من OpenAI. تولد هذه النماذج صورًا استجابةً لمطالبات المستخدم. يمكن لنماذج الانتشار توليد صور واقعية عالية الجودة، بما في ذلك صور الوجوه البشرية.
حكم مكتب حقوق الطبع والنشر الأمريكي في عام 2023 بأن الصور التي يولدها الذكاء الاصطناعي لا تخضع لحماية حقوق الطبع والنشر. وفي الوقت نفسه، ستحدد العديد من الدعاوى القضائية العديدة الجارية2 في نهاية المطاف ما إذا كانت الصور التي يُنشئها الذكاء الاصطناعي تُعد انتهاكات لحقوق الطبع والنشر.
الرسم الداخلي والخارجي: الرسم الداخلي هو عملية إضافة محتوى داخل الصورة أو إزالته، بينما يوسع الرسم الخارجي الصورة إلى ما وراء حدودها الأصلية.
وضع النماذج ثلاثية الأبعاد: يعد DreamFusion من Google وMagic3D من NVIDIA من نماذج الانتشار التي تنشئ نماذج ثلاثية الأبعاد من مدخلات نصية.
أبحاث السوق: تُظهر نماذج الانتشار كيف تتطور الأشياء بمرور الوقت، ما يجعلها مفيدة لفهم كيفية تفاعل المستهلكين مع المنتج.
اكتشاف حالات الخلل: نظرًا لقدرتها على معرفة كيفية تغير البيانات بمرور الوقت، يمكن لنماذج الانتشار تحديد متى لا تتناسب نقاط البيانات مع الاتجاهات الثابتة. وتشمل تطبيقات اكتشاف حالات الخلل الأمن الإلكتروني ومنع الاحتيال والكشف عن الأمراض.
طُرحت الشبكات التنافسية التوليدية (GANs) في عام 2014، وهي من بين أقدم أنواع نماذج الذكاء الاصطناعي التوليدي التي تقرن نموذجين معًا في منافسة. ينشئ النموذج التوليدي نواتج يجب على النموذج التمييزي أن يحدد ما إذا كانت أصلية أم مزيفة. والهدف من المنافسة هو أن يولد النموذج التوليدي محتوى يُعتبر أصليًا عند الحكم عليه من قِبل النموذج التمييزي.
إذا كان النموذج التوليدي مزورًا للأعمال الفنية، فإن النموذج التمييزي هو موثق الفني. قد يحصل تاجر الأعمال الفنية على عمل فني مزور ويحاول بيعه إلى متحف، ولكن ليس قبل أن يجتاز العمل الفني عملية التوثيق. وبينما يصبح المزور أفضل في تقليد كبار الفنانين، قد يجد الموثق صعوبة في اكتشاف الأعمال المزيفة التي تليه. وسرعان ما يستضيف المتحف معرضًا مليئًا بالأعمال المزورة.
يمكن أن تؤدي أيضًا عملية التدريب نفسها التي تؤدي إلى نواتج واقعية إلى انهيار الوضع: عندما يترك النموذج التوليدي بعض بيانات التدريب ويقتصر على نطاق ضيق من أنواع العينات. تتطلب الشبكات التنافسية التوليدية، وكذلك نماذج الانتشار والمحولات، مجموعات بيانات تدريبية ضخمة لتحقيق أداء فعال.
وغالبًا ما تكون كلتا الشبكتين في الشبكة الخصومية التوليدية شبكات عصبية تلافيفية (CNNs)، وهو نوع مبكر من الشبكات العصبية التي تتميز بأدائها القوي في مهام الرؤية الحاسوبية.
تُستخدم الشبكات التنافسية التوليدية بشكل أساسي في مجال الرؤية الحاسوبية والمهام الأخرى المتعلقة بالرسومات.
الرؤية الحاسوبية: الرؤية الحاسوبية هي استخدام التعلم الآلي لمعالجة المعلومات من الصور. وتتضمن مهام الرؤية الحاسوبية الشائعة اكتشاف الأجسام وتصنيفها والتعرف على الوجوه وترجمة لغة الإشارة وتتبع الأجسام.
زيادة البيانات: يمكن لزيادة البيانات - أي استخدام البيانات الموجودة مسبقًا لإنشاء المزيد من عينات البيانات - أن تعزز أداء الرؤية الحاسوبية بشكل أكبر مع الشبكات العصبية التلافيفية. تختلف هذه العملية عن البيانات الاصطناعية في أنها تتوسع في البيانات الحقيقية، بدلاً من توليد شيء من الصفر.
تضغط برامج التشفير التلقائي المتغيرة (VAEs) البيانات المدخلة، ثم توسع هذا الضغط أو تفك تشفيره لتوليد بيانات جديدة مشابهة. وتتعلم برامج التشفير التلقائي المتغيرة توزيع مجموعة بيانات التدريب وتطبق تلك التوقعات عند توليد بيانات جديدة من العينات المشفرة. مثل كل برامج التشفير التلقائي، تتألف برامج التشفير التلقائي المتغيرة من مكونين: أداة تشفير وأداة فك تشفير.
تتمثل مهمة أداة التشفير في تعلم المتغيرات الكامنة في مجموعة البيانات. ولا يمكن ملاحظة المتغيرات الكامنة بشكل مباشر ولكنها تؤدي دورًا مهمًا في توزيع البيانات. الفضاء الكامن هو الاسم الجماعي لكل المتغيرات الكامنة في مجموعة البيانات. تضع أداة التشفير نماذج الفضاء الكامن بطريقة تلتقط المعلومات اللازمة لإعادة بناء البيانات بدقة. وتُحذف كل المتغيرات الأخرى.
تأخذ أداة فك التشفير التمثيل المضغوط للبيانات، والمعروف باسم عنق الزجاجة، وتستقرؤه مرة أخرى إلى الشكل الأصلي للبيانات. وتنتج أداة فك التشفير الفعالة نواتج مشابهة للبيانات الأصلية المضغوطة مسبقًا.
تواجه برامج التشفير التلقائي المتغيرة (VAEs) صعوبةً في مهام توليد الصور مقارنةً بنماذج الانتشار وشبكات GAN، لكنها تتفوق في مجالات أخرى.
توليد الصور: تُستخدم برامج التشفير التلقائي في توليد الصور، على الرغم من أن نماذج الانتشار قد حلت محلها على نطاق واسع في تطبيقات توليد الصور الشائعة. بالمقارنة مع نماذج توليد الصور الأخرى، تميل برامج التشفير التلقائي إلى إنتاج صور أكثر ضبابية بسبب "توسيطها" للفضاء الكامن.
علم الجينوم: تساعد برامج التشفير التلقائي علماء الوراثة في حساب قيم التكاثر - القيمة المتوقعة التي سيقدمها الحيوان مع نسله - بالإضافة إلى تعيين درجات مخاطر الأمراض.
اكتشاف حالات الخلل: تُعد برامج التشفير التلقائي أرخص وأسهل في التدريب من كل من الشبكات التنافسية التوليدية ونماذج الانتشار، ما يجعلها خيارًا جذابًا لمهام الكشف عن حالات الخلل. تُقارن البيانات المعاد إنشاؤها بالبيانات الأصلية لعزل الحالات التي تنحرف عن التوزيع المتوقع.
استكمال البيانات: يمكن لبرامج التشفير التلقائي إنشاء بيانات جديدة لاستبدال البيانات المفقودة واستعادة الملفات التالفة. وتتضمن الأمثلة على ذلك تنظيف الملفات الصوتية وإزالة التشويش من مقاطع الفيديو وكذلك التصوير الطبي. على الرغم من أن برامج التشفير التلقائي تميل إلى توليد صور ضبابية من الصفر، فإنها يمكن أن تستعيد الصور الضبابية الموجودة مسبقًا عن طريق إزالة الضبابية من الصورة.
التعلم شبه الخاضع للإشراف: تساعد برامج التشفير التلقائي على تدريب المصنفات من خلال التقاط توزيعات البيانات في مجموعات البيانات ذات التصنيف غير المكتمل. كما يمكن أيضًا أن تزيد برامج التشفير التلقائي البيانات لتوليد عينات تدريب إضافية للمصنف
تتعلم النماذج القائمة على التدفق توزيع البيانات من خلال سلسلة من التحويلات الرياضية القابلة للعكس. ويمكن أن تتقدم البيانات من دون خسارة من خلال سلسة العمليات هذه، المعروف باسم تدفق التعميم، في أي من الاتجاهين. في حين تقدر نماذج برامج التشفير التلقائي والشبكات التنافسية التوليدية توزيعات البيانات، تتعلم النماذج القائمة على التدفق بشكل صريح دالة الكثافة الاحتمالية لمجموعة البيانات.
في مجموعة بيانات معينة، تصف دالة الكثافة الاحتمالية كيفية توزيع البيانات. وتتدرج تدفقات التعميم من التوزيعات البسيطة إلى التوزيعات المعقدة حتى تُحدد دالة كثافة الاحتمالات للمتغير المستهدف.
يمكن للنماذج القائمة على التدفقات توليد عينات بيانات جديدة تحافظ على الخصائص الإحصائية نفسها لمجموعة البيانات الأولية. ومثل كل النماذج التوليدية، تعتمد العملية على مفهوم استخلاص عينات من بيانات التدريب وتطبيق رياضيات إحصائية معقدة لإنتاج نتائج متشابهة وجديدة.
تتألق النماذج القائمة على التدفق في الحالات التي يكون فيها الحصول على تقييم دقيق لتوزيع البيانات أمرًا بالغ الأهمية.
توليد الصور: تعمل النماذج القائمة على التدفق على توليد الصور عن طريق تمرير ضوضاء مختارة بشكل عشوائي من خلال تدفقات التعميم لإنتاج صورة واضحة. PixelCNN هو نموذج بارز لتوليد الصور لعام 2016 يطبق الانحدار التلقائي على تسلسل التحويلات، ويمثل الصور بكسلاً بكسل.
تقدير دقيق للكثافة: إن تقدير الكثافة هو التحدي المتمثل في تحديد دالة الكثافة الاحتمالية لمجموعة بيانات استنادًا إلى بيانات يمكن ملاحظتها. وفي حين أن النماذج القائمة على التدفق يمكن أن تمثل بدقة توزيعات البيانات المعقدة، فإنها تواجه صعوبة في التقاط التبعيات بعيدة المدى عند مقارنتها بالمحولات.
توليد الرسم البياني الجزيئي: استُخدمت النماذج القائمة على التدفق في توليد الرسم البياني الجزيئي، حيث توضع نماذج البنى الجزيئية الجديدة كرسوم بيانية من خلال نماذج الذكاء الاصطناعي التوليدي. ويُعد توليد الرسم البياني الجزيئي أداة مهمة في مساعدة العلماء والمهندسين في اكتشاف عقاقير ومواد جديدة.
العمليات نفسها التي غالبًا ما تؤدي إلى نتائج مبهرة هي أيضًا ما تجعل النماذج التوليدية تهلوس: عندما تنتج معلومات غير صحيحة أو مضللة. تحدث الهلوسات أو الأوهام عندما تتصور النماذج أنماطًا في مجموعات بيانات التدريب الخاصة بها غير موجودة في العالم الحقيقي.
على سبيل المثال، عند طرح السؤال "في أي حلقة من مسلسل سينفيلد يذهب كرامر إلى بنجلاديش؟" على ChatGPT-4o mini، كانت الإجابة هي:
يسافر كرامر إلى بنجلاديش في الحلقة التي تحمل عنوان "جيري الصغير"، وهي الحلقة رقم 145 من مسلسل سينفيلد. تُعد هذه الحلقة رقم 145 [كما ورد] من المسلسل، وقد عُرضت لأول مرة خلال الموسم الثامن. في هذه الحلقة، يتورط كرامر في مخطط لاستيراد لعبة من بنجلاديش.
على الرغم من أن حلقة "جيري الصغير" هي الحلقة رقم 145 من مسلسل سينفيلد وبُثت خلال الموسم الثامن، فإنها تعرض كرامر وهو يشتري ديكًا ويدربه - وهو الديك الذي يحمل الاسم نفسه جيري الصغير. أدى تكرار السؤال نفسه على روبوت المحادثة إلى هلوسة ثانية مختلفة:
يذهب كرامر إلى بنجلاديش في الحلقة التي تحمل عنوان "جزر المالديف"، وهي الحلقة رقم 18 من الموسم التاسع. وفي هذه الحلقة، يحاول أن يبدأ حياة جديدة بعد رحلته، وتدور القصة حول فكرة أن يصبح صيادًا "بنجلاديشيًا".
في الواقع، الحلقة رقم 18 من الموسم التاسع من سينفيلد بعنوان "لعبة الضفدع"، وفيها يذهب كرامر إلى مركز الشرطة فقط. لا توجد حلقة من مسلسل سينفيلد تحمل اسم "جزر المالديف"، ولم يذهب كرامر إلى بنجلاديش في أي مرحلة من مراحل المسلسل بأكمله.
كما هو معروف أن نماذج الانحدار التلقائي مثل GPT تهلوس بحقائق مصطنعة، فإن أنواعًا أخرى من النماذج يمكن أن تهلوس بطرقها الخاصة. تصوّر نماذج الانتشار المستخدمة لتوليد الصور أحيانًا أجسام العالم الحقيقي بطرق لا تتطابق مع الواقع.
على الرغم من أنه ليس من الممكن حتى الآن إزالة إمكانية أن تهلوس نماذج الذكاء الاصطناعي التوليدي بالكامل، فإن أفضل الممارسات للتخفيف من الهلوسة تشمل:
المطالبة الواضحة: كلما كانت مطالبة المستخدم أكثر وضوحًا، كلما كانت إجابة الذكاء الاصطناعي أكثر تركيزًا. امنح الذكاء الاصطناعي مساحة داخل المطالبة للإجابة بالتفاصيل.
التوجيه المركّز: يمكن أن يساعد إعطاء الذكاء الاصطناعي دورًا واضحًا وتوجيهه لتقديم معلومات صادقة يمكن التحقق منها على ضمان أن تعكس إجاباته الواقع بشكل أفضل.
بيانات عالية الجودة: كلما كانت بيانات التدريب الخاصة بنموذج الذكاء الاصطناعي حديثة وذات صلة، كلما قلت فرصة أن تكون إجاباته متحيزة.
التحقق البشري: يجب ألا تُستخدم النتائج التي يولدها الذكاء الاصطناعي من دون التحقق منها أولاً من قِبل البشر المطلعين.
التوليد المعزز بالاسترجاع (RAG) والضبط الدقيق: إن استخدام التوليد المعزز بالاسترجاع لتعزيز الذكاء الاصطناعي ببيانات موثوقة وضبط النماذج لتصبح أكثر تخصصًا في مجال معين كلاهما فعال في الحد من الهلوسات.
1. الانتباه هو كل ما تحتاجه، Vaswani وآخرون، 2 أغسطس 2023
2. الفنانون يحققون فوزًا كبيرًا في قضية حقوق الطبع والنشر ضد مولدات الأعمال الفنية بالذكاء الاصطناعي، Winston Cho، The Hollywood Reporter، 13 أغسطس 2024
3. Diffusion-GAN: تدريب الشبكات التنافسية التوليدية باستخدام عملية الانتشار، Wang وآخرون، 25 أغسطس 2023
تعلّم كيف يمكن للمديرين التنفيذيين تحقيق التوازن بين القيمة التي يمكن أن يقدمها الذكاء الاصطناعي مقابل الاستثمار الذي يتطلبه والمخاطر التي يثيرها.
تعلّم المفاهيم الأساسية وطوّر مهاراتك من خلال المختبرات العملية والدورات التدريبية والمشاريع الموجهة والتجارب وغيرها.
تعرّف على كيفية دمج الذكاء الاصطناعي التوليدي والتعلّم الآلي بثقة في أعمالك
هل ترغب في زيادة عائد استثماراتك في الذكاء الاصطناعي؟ تعرّف على كيفية تأثير توسيع نطاق الذكاء الاصطناعي التوليدي في المجالات الرئيسية، من خلال مساعدة أفضل العقول لديك على وضع حلول مبتكرة جديدة وطرحها.
لقد قمنا باستطلاع آراء 2000 مؤسسة حول مبادرات الذكاء الاصطناعي لديها لمعرفة ما ينجح وما لا ينجح وكيف يمكنك المضي قدمًا.
يُعَد IBM Granite مجموعة من نماذج الذكاء الاصطناعي المفتوحة والموثوق بها وذات الأداء العالي، وهي مصممة خصيصًا للأعمال ومُحسَّنة لتوسيع نطاق تطبيقات الذكاء الاصطناعي لديك. استكشف خيارات اللغة والتعليمات البرمجية والسلاسل الزمنية وضوابط الحماية.
تعرّف على كيفية اختيار نموذج أساس الذكاء الاصطناعي الأكثر ملاءمة لحالة الاستخدام الخاصة بك.
تعمّق في العناصر الثلاثة الهامة لاستراتيجية الذكاء الاصطناعي القوية: إنشاء ميزة تنافسية، وتوسيع نطاق الذكاء الاصطناعي عبر الأعمال، وتطوير الذكاء الاصطناعي الجدير بالثقة.
تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.
استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.
أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.