ما المقصود بالشبكات التنافسية التوليدية (GANs)؟

مؤلف

Jobit Varughese

Technical Content Writer

IBM

ما المقصود بشبكة GAN؟

الشبكة التنافسية التوليدية، أو GAN، هي نموذج تعلُّم آلي مُصمم لتوليد بيانات واقعية من خلال أنماط التعلم من مجموعات بيانات التدريب الموجودة. يعمل هذا النظام ضمن إطار عمل التعلم غير الخاضع للإشراف باستخدام تقنيات التعلم العميق، حيث تعمل شبكتان عصبيتان في تعارض - واحدة تولِّد البيانات، بينما تقيِّم الأخرى إذا ما كانت البيانات حقيقية أو تم إنشاؤها.

بينما أحرز التعلم العميق تقدمًا كبيرًا في مهام مثل تصنيف الصور والتعرُّف على الكلام، فإن توليد بيانات جديدة، بما في ذلك الصور أو النصوص الواقعية، كان أكثر تحديًا بسبب تعقيد العمليات الحسابية في النماذج التوليدية.

تقدِّم شبكات GAN، التي قدَّمها Ian Goodfellow في ورقته البحثية لعام 2014 بعنوان "Generative Adversarial Nets"، حلًا رائدًا لهذا التحدي.1 لقد غيَّر هذا الإطار المبتكر مجال النمذجة التوليدية، ما ساعد على تسهيل تطوير النماذج والخوارزميات القادرة على إنتاج بيانات واقعية عالية الجودة.

كيف تعمل شبكات GANs؟

تتكون بنية شبكة GAN من شبكتين عصبيتين عميقتين: شبكة التوليد وشبكة التمييز. تتضمن عملية تدريب شبكة GAN أن تبدأ شبكة التوليد بإدخال عشوائي (ضوضاء) ويُنشئ بيانات اصطناعية مثل الصور أو النصوص أو الصوت تحاكي البيانات الحقيقية من مجموعة التدريب المعطاة. تعمل شبكة التمييز على تقييم كلٍّ من العينات التي تم إنشاؤها والبيانات من مجموعة التدريب وتقرر إذا ما كانت حقيقية أم مزيفة. تُعطي درجة تتراوح بين 0 و1: الدرجة 1 تعني أن البيانات تبدو حقيقية، والدرجة 0 تعني أنها مزيفة. يتم بعد ذلك استخدام الانتشار الخلفي لتحسين كِلتا الشبكتين. هذا يعني أن تدرج دالة الخسارة يتم حسابه وفقًا لمَعلمات الشبكة، ويتم ضبط هذه المَعلمات لتقليل الخسارة. ثم تستخدم شبكة التوليد التعليقات من شبكة التمييز للتحسين، في محاولة لإنشاء بيانات أكثر واقعية.

بنية شبكة GAN

ينطوي تدريب بنية GAN على عملية تنافسية. يحاول نموذج التوليد خداع نموذج التمييز ليصنِّف البيانات المزيفة على أنها حقيقية، في حين يعمل نموذج التمييز على تحسين قدرته باستمرار على التمييز بين البيانات الحقيقية والمزيفة. تسترشد هذه العملية بدوال الخسارة التي تقيس أداء كل شبكة. تقيس خسارة التوليد مدى قدرة نموذج التوليد على خداع نموذج التمييز لجعل بياناته تبدو حقيقية. تعني خسارة التوليد المنخفضة أن نموذج التوليد يُنشئ بيانات واقعية بنجاح. تقيس خسارة التمييز مدى قدرة نموذج التمييز على التمييز بين البيانات المزيفة والبيانات الحقيقية. تُشير خسارة التمييز المنخفضة إلى أن نموذج التمييز يحدِّد البيانات المزيفة بنجاح.  

على سبيل المثال، في شبكة GAN المدرَّبة على إنشاء صور للكلاب، يحوِّل نموذج التوليد الضوضاء العشوائية إلى صور تشبه الكلاب، بينما يعمل نموذج التمييز على تقييم هذه الصور مقابل صور الكلاب الفعلية من مجموعة التدريب.

وبمرور الوقت، تدفع هذه العملية التنافسية كِلتا الشبكتين إلى التحسُّن. وتمكِّن نموذج التوليد من إنشاء بيانات مقنعة وواقعية تشبه إلى حد كبير مجموعة بيانات التدريب الأصلية بينما يحسّن نموذج التمييز قدرته على تحديد الاختلافات الدقيقة بين البيانات الحقيقية والمزيفة. 

أنواع شبكات GAN

الشبكات التنافسية التوليدية التقليدية (Vanilla GAN)

تُعَد شبكات Vanilla GAN هي الشكل الأساسي لشبكات التوليد التنافسية، وتتضمن نموذج توليد ونموذج تمييز يشاركان في لعبة تنافسية نموذجية. يُنشئ نموذج التوليد عينات مزيفة، ويهدف نموذج التمييز إلى التمييز بين عينات البيانات الحقيقية والمزيفة. تستخدم شبكات Vanilla GAN مستقبلات بسيطة متعددة الطبقات (MLPs) أو طبقات من الخلايا العصبية لكلٍّ من نموذج التوليد والتمييز، ما يجعلها سهلة التنفيذ. تعالج هذه مستقبلات MLPs هذه البيانات وتصنِّف المدخلات لتمييز الكائنات المعروفة في مجموعة البيانات. ومع ذلك، من المعروف أنها غير مستقرة أثناء التدريب وغالبًا ما تتطلب ضبطًا دقيقًا للمَعلمات الفائقة لتحقيق نتائج جيدة.

الشبكات التوليدية التنافسية المشروطة (cGAN)

شبكات cGAN هي نوع من الشبكات التوليدية التنافسية يتضمن معلومات إضافية، تُعرَف باسم "تصنيفات" أو "شروط"، لكلٍّ من نموذج التوليد والتمييز.2 توفِّر هذه التصنيفات سياقًا، ما يمكِّن نموذج التوليد من إنتاج بيانات ذات خصائص محددة بناءً على الإدخال المُعطى، بدلًا من الاعتماد فقط على الضوضاء العشوائية كما هو الحال في شبكات GAN التقليدية. هذا التوليد الخاضع للتحكم يجل شبكات cGANs مفيدة للمهام التي تتطلب تحكمًا دقيقًا في المخرجات. تُستخدَم شبكات cGAN على نطاق واسع لإنشاء الصور والنصوص والبيانات التركيبية المصممة خصيصًا لكائنات أو موضوعات أو أنماط معينة. على سبيل المثال، يمكن لشبكات cGAN تحويل صورة بالأبيض والأسود إلى صورة ملونة عن طريق تكييف نموذج التوليد لتحويل التدرج الرمادي إلى نموذج اللون الأحمر والأخضر والأزرق (RGB). وبالمثل، يمكنه توليد صورة من المدخلات النصية، مثل "إنشاء صورة لقط أبيض مغطى بالفرو"، لإنتاج مخرجات تتماشى مع الوصف المقدَّم.

الشبكات التنافسية التوليدية الالتفافية العميقة (DCGAN)

تستخدم شبكات DCGAN الشبكات العصبية التلافيفية (CNNs) لكلٍّ من نموذجَي التوليد والتمييز. يأخذ نموذج التوليد ضوضاء عشوائية كإدخال ويحوِّلها إلى بيانات منظمة، مثل الصور. يستخدم نموذج التوليد الالتفافات المعكوسة (أو الالتفاف العكسي) لتوسيع الضوضاء المدخلة إلى مخرجات أكبر وأكثر تفصيلًا، عن طريق "تقريب" الضوضاء لإنشاء صورة ذات معنى. يستخدم نموذج التمييز طبقات تلافيفية قياسية لتحليل بيانات الإدخال. تساعد هذه الطبقات نموذج التمييز على "التصغير" وإلقاء نظرة على الهيكل العام وتفاصيل البيانات لاتخاذ قرار. يجعل هذا النهج شبكات DCGAN فعَّالة لإنشاء الصور عالية الجودة والبيانات المنظمة الأخرى. 

الشبكات التنافسية التوليدية النمطية (StyleGAN)

تُعَد StyleGans نوعًا من الشبكات التوليدية التنافسية التي تُنتج صورًا عالية الدقة تصل حتى دقة 1024 × 1024. يتم تدريب StyleGans باستخدام مجموعة بيانات من الصور للكائن نفسه. تتكون شبكة التوليد من عدة طبقات، كل طبقة مسؤولة عن إضافة مستوى مختلف من التفاصيل إلى الصورة، بدءًا من الخصائص الأساسية ووصولًا إلى التركيبات المعقدة. تحتوي شبكة التمييز أيضًا على طبقات متعددة؛ لتقييم مستوى التفاصيل وتقييم الجودة الشاملة.

الشبكات التنافسية التوليدية الدورية (CycleGAN)

في CycleGAN، يتم تدريب نموذج التوليد ونموذج التمييز بطريقة دورية. تم تصميمها لترجمة صورة إلى صورة باستخدام مجموعات بيانات غير مقترنة. وهي تعمل عن طريق ترجمة صورة إلى نمط آخر مثل اللوحة باستخدام نموذج توليد ثم ترجمتها مرة أخرى إلى النمط الأصلي باستخدام نموذج توليد عكسي. تساعد هذه الطريقة على ضمان أن الصورة المُعاد بناؤها تشبه إلى حد كبير الصورة الأصلية من خلال عملية تُعرَف باسم تناسق الدورة. هذه النتائج مفيدة بشكل خاص لمهام مثل نقل نمط الصور وتحسين الصور. 

الشبكات التنفسية التوليدية القائمة على هرم لابلاس (LAPGAN)

تم تصميم شبكات LAPGAN لإنشاء صور عالية الجودة عن طريق تحسينها على مقاييس متعددة. تبدأ بإنشاء صورة منخفضة الدقة ثم تضيف تدريجيًا المزيد من التفاصيل بدقة أعلى باستخدام سلسلة من شبكات GAN. يُتيح هذا النهج متعدد المقاييس، المعروف باسم هرم لابلاس، لشبكات LAPGAN التعامل مع تعقيد توليد الصور عالية الدقة بشكل أكثر فاعلية.

شبكات DiscoGAN

يتم استخدام شبكات DiscoGAN لتعلم العلاقات عبر المجالات دون الحاجة إلى بيانات تدريب مقترنة. تستخدم شبكة DiscoGAN نموذجَي توليد ونموذجَي تمييز لتحويل الصور من نطاق معين إلى آخر ثم العودة، ما يساعد على ضمان أن الصورة المُعاد بناؤها تشبه الأصلية بفضل اتساق الدورة. وهذا يجعل شبكات DiscoGAN فعَّالة في مهام مثل ترجمة الصور إلى صور أخرى ونقل الأنماط وتحسين الصور، حتى عند استخدام مجموعات بيانات غير مقترنة. 

أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء

احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! لقد اشتركت بنجاح.

سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.

تطبيقات شبكات GAN

يمكن استخدام شبكات GAN في تطبيقات مختلفة لرؤية الكمبيوتر، مثل توليد الصور وكشف الكائنات وترجمة الصور إلى صور أخرى وتحويل النص إلى صورة والتنبؤ بالإطار التالي في الفيديو وغيرها.

إنشاء الصور

تُستخدَم شبكات GAN لتوليد صور فوتوغرافية لعينات لم تكن موجودة من قبل، ولإنشاء صور استنادًا إلى وصف نصي، ما يُتيح إنتاج صور وفقًا لسمات أو مشاهد محددة. تعمل شبكات BigGAN، المدرَّبة على مجموعات بيانات كبيرة، بتوليد بيانات استنادًا إلى فئات أو شروط محددة، وتحقق نتائج متقدمة جدًا في توليد الصور.3 يُستخدَم في تطبيقات متنوعة، بما في ذلك توليد الصور وتلوينها وإعادة بنائها. على سبيل المثال، يستخدم GAN-BVRM، وهو طريقة جديدة لإعادة البناء البصري تعتمد على GAN والنماذج البايزية، نموذج تصنيف لفك تشفير بيانات التصوير بالرنين المغناطيسي الوظيفي (fMRI). يعمل نموذج توليد BigGAN المدرَّب مسبقًا على إنتاج صور خاصة بالفئات، بينما تختار نماذج الترميز الصور التي تتوافق مع نشاط الدماغ، ما يؤدي إلى تحسين واقعية ودقة إعادة بناء المحفزات البصرية. تحقِّق شبكات GAN تقدُّمًا ملحوظًا في مجال الرعاية الصحية من خلال توليد بيانات طبية واقعية، مثل صور الرنين المغناطيسي (MRI)، والأشعة المقطعية (CT)، والأشعة السينية (X-ray) للتدريب والتحليل، وكذلك من خلال ابتكار هياكل جزيئية جديدة لاكتشاف الأدوية. 

دقة فائقة للصور

يمكن لشبكات GAN تحسين الصور منخفضة الدقة عن طريق توليد نسخ عالية الدقة، ما يعزز جودة الصور وتفاصيلها. على سبيل المثال، يقوم StyleGAN2 من NVIDIA بتوليد صور عالية الدقة وواقعية للغاية مع تحكم دقيق في الخصائص مثل المحتوى والهوية والتعبير والوضعية، ما يُتيح للمستخدمين إنشاء الصور والتلاعب بها لأغراض فنية وعملية.4

الترجمة من صورة إلى صورة

تحقِّق شبكات GAN نقل الأسلوب وتحرير الصور عن طريق تحويل الصور من نطاق معين إلى آخر، مثل تحويل رسم تخطيطي إلى نسخة مرسومة. على سبيل المثال، يتم استخدام CycleGANs لتحويل الصور إلى لوحات فنية. تتضمن هذه العملية قيام نموذج توليد واحد بتحويل الصور من النطاق المصدر (الصور الفوتوغرافية) إلى النطاق الهدف (اللوحات الفنية) والعكس بالعكس من خلال قيد دائري، ما يساعد على ضمان احتفاظ التحويل بالتناسق الدلالي. 

إعادة توجيه الفيديو 

يتم استخدام شبكات GAN لإعادة توجيه الفيديو بشكل غير خاضع للإشراف، حيث يتم تعديل محتوى الفيديو ليتناسب مع نِسَب وأبعاد مختلفة مع الحفاظ على المعلومات البصرية المهمة. تستخدم شبكات Recycle-GAN استراتيجية دورية مشابهة لتلك الموجودة في CycleGANs، مع تطبيقها بشكل خاص على بيانات الفيديو. على سبيل المثال، يمكن لشبكات Recycle-GAN تحويل فيديو بعرض واسع إلى صيغة مربعة لمنصات التواصل الاجتماعي، ما يساعد في الحفاظ على العناصر والحركات الرئيسية في الفيديو.5

معالجة سمات الوجه 

تتيح شبكات GAN تعديل ملامح الوجه في الصور، مثل تغيير التعبيرات أو إضافة تأثيرات التقدم في العمر، ما يُبرز إمكاناتها في مجالات الترفيه ووسائل التواصل الاجتماعي. تعمل شبكات StyleGAN عن طريق تطبيق تعديل طبقة تلو الأخرى على العينات التي تم توليدها استنادًا إلى "الأنماط" المستخرجة من الفضاء الكامن. تُتيح هذه العملية التحكم بشكل بديهي في خصائص مختلفة مثل لون الشعر وتعبيرات الوجه، ما يمكِّن المستخدمين من تعديل الوجوه وفقًا للسمات المحددة دون الحاجة إلى تعديلات يدوية. على سبيل المثال، يمكن استخدام StyleGAN لتغيير لون شعر الشخص من البني إلى الأشقر أو لإضافة ابتسامة إلى تعبيرات الوجه المحايدة. 

كشف الكائنات 

يتم استخدام شبكات GAN في الكشف عن الكائنات لتحسين جودة وتنوع بيانات التدريب، وهو ما يمكن أن يحسِّن أداء نماذج الكشف عن الكائنات بشكل كبير. من خلال توليد صور اصطناعية تشبه إلى حد كبير البيانات الحقيقية، تعمل شبكات GAN على زيادة مجموعة بيانات التدريب، ما يساعد النموذج على التعميم بشكل أفضل والعمل بأداء أكثر دقة. على سبيل المثال، أظهرت الأبحاث أن أداء نماذج التعلم العميق للكشف عن الكائنات يتدهور بشكل كبير عند تطبيقه على الصور ذات الجودة المنخفضة، مثل تلك المتأثرة بالضوضاء أو الضبابية أو التشوهات الأخرى.6 تقدِّم الورقة البحثية إطار العمل GAN-DO، الذي يستخدم شبكات GAN لتعزيز متانة نماذج الكشف عن الكائنات في مواجهة تفاوت جودة الصورة دون إضافة تعقيدات إلى بنية النموذج أو سرعة الاستدلال. تُظهر النتائج التجريبية أن GAN-DO تتفوق على طرق الضبط الدقيق التقليدية، ما يؤدي إلى تحسين الدقة في الكشف.

Mixture of Experts | 28 أغسطس، الحلقة 70

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

النماذج التوليدية الأخرى لتوليد البيانات الاصطناعية

بالإضافة إلى شبكات GAN، تُعد أجهزة التشفير التلقائي المتغير (VAEs) نموذجًا آخر للتعلم العميق قادر على إنشاء عينات بيانات جديدة تُحاكي البيانات الحقيقية. تُعَد VAEs نماذج احتمالية، أي أنها تمثِّل البيانات على شكل توزيعات احتمالية تَصِف احتمال حدوث القيم أو النتائج المختلفة في البيانات. تم تصميم هذه النماذج لتعلم الأنماط من مجموعة بيانات التدريب وإنشاء بيانات جديدة تمثِّل تنويعات من مجموعة البيانات الأصلية، بدلًا من نُسخ طبق الأصل منها. يحتوي جهاز التشفير التلقائي المتغير (VAE) على عنصرين. يعمل جهاز التشفير (نموذج التعرُّف) على ضغط البيانات المدخلة المعقدة مثل الصور إلى بيانات أبسط ذات أبعاد منخفضة، بينما يعيد جهاز فك التشفير (نموذج التوليد) إنشاء المدخلات الأصلية من التمثيل المضغوط. تستطيع أجهزة أيضًا توليد عينات بيانات جديدة تمامًا من خلال التعلم من أنماط مجموعة البيانات التدريبية. عادةً ما تنتج أجهزة VAE مخرجات أكثر ضبابية وأقل وضوحًا، لكنها أكثر استقرارًا أثناء التدريب، في حين تولِّد شبكات GAN مخرجات أكثر وضوحًا وواقعية، لكنها أصعب في التدريب بسبب عدم الاستقرار.

في النهاية، يعتمد الاختيار بين VAEs وGANs على المتطلبات الخاصة بالمهمة، مثل جودة المخرجات المطلوبة واستقرار التدريب والحاجة إلى تمثيلات كامنة قابلة للتفسير، ما يجعل كل نموذج ذا قيمة فريدة في تطبيقات مختلفة.

فوائد وتحديات شبكات GAN

يمكن للشبكات التنافسية التوليدية (GANs) توليد بيانات واقعية ومتنوعة للغاية، مثل الصور والنصوص والصوت. يتم استخدامها في تطبيقات تشمل معالجة اللغة الطبيعية (NLP) لتوليد بيانات نصية وتحسين النماذج اللغوية، وفي توليد الموسيقى لإنشاء مقطوعات جديدة وأصوات أدوات موسيقية واقعية. تستخدم المحاكاة والألعاب شبكات GAN لتوليد بيئات وشخصيات واقعية وكشف الحالات الشاذة من خلال تحديد الأنماط التي تنحرف عن القاعدة. تساعد شبكات GAN أيضًا البحث العلمي من خلال محاكاة البيانات المعقدة للتجارب المكلفة أو غير العملية في الأداء. كما تعمل على تعزيز عمليات التعلم الآلي (ML) من خلال تعزيز البيانات، ما يزيد من كمية وتنوع مجموعات التدريب لمعالجة تحدي البيانات الكبيرة المحدودة. من المتوقع أن تندمج شبكات GAN بشكل أكبر مع تقنيات مثل التعلم المعزز والتشغيل الآلي والبرمجة اللغوية العصبية لتطوير أنظمة الذكاء الاصطناعي. 

على الرغم من ظهور المحولات، تظل شبكات GAN ذات صلة بسبب بنيتها خفيفة الوزن وكفاءتها الحسابية، ما يجعلها مثالية للنشر على الحافة. مع وجود عدد أقل من المَعلمات مقارنةً بالمحولات، توفِّر شبكات GAN توليدًا متحكَّمًا به لمعالجة الميزات بدقة (على سبيل المثال، سمات الوجه)، ما يؤدي إلى تبسيط الضبط الدقيق لمهام محددة. توفِّر شبكات GAN سرعات استنتاج أسرع، حيث تحتاج إلى تمريرة أمامية واحدة فقط (أي مرور البيانات عبر الشبكة العصبية مرة واحدة لتوليد المخرجات). وهذا يجعلها مثالية للتطبيقات في الوقت الفعلي على أجهزة الحافة ذات الموارد المحدودة، مثل الهواتف المحمولة وأنظمة إنترنت الأشياء. تجعل هذه المزايا شبكات GAN خيارًا عمليًا لمهام مثل ترجمة الصور وتحسين الدقة الفائقة وتوليد الفيديو في الوقت الفعلي في بيئات الحافة. 

ومع ذلك، تواجه شبكات GAN تحديات كبيرة. تتمثل إحدى المشكلات الرئيسية في عدم استقرار التدريب، حيث قد لا يلتقي نموذج التوليد ونموذج التمييز بشكل صحيح، ما يؤدي إلى مخرجات رديئة الجودة. يمثل انهيار النمط تحديًا آخر حيث ينتج نموذج التوليد تنوعًا محدودًا، ويفشل في التقاط التنوع الكامل لبيانات التدريب. تتطلب شبكات GAN أيضًا كميات كبيرة من البيانات وموارد حاسوبية كبيرة، وهو ما يمكن أن يكون عائقًا أمام استخدامها على نطاق واسع. يمثل تقييم جودة المخرجات الناتجة عن شبكة GAN تحديًا، حيث إن المقاييس التقليدية قد لا تلتقط الفروق الدقيقة للبيانات التي تم إنشاؤها بشكل كامل. تُعَد المساعدة على ضمان الاستخدام الأخلاقي للعينة التي تم إنشاؤها مصدر قلق متزايد، حيث يمكن استخدام شبكات GAN لإنشاء منتجات مزيفة عميقة ومحتوى آخر يُحتمَل أن يكون ضارًا.

كيفية تنفيذ نموذج شبكة GAN

يمكن تنفيذ GAN باستخدام Tensorflow وKeras. ويلزم توفُّر مجموعة بيانات تدريبية وبرنامج نصي توليدي وبرنامج نصي تمييزي لإنشاء نموذج GAN في Python. وفيما يلي دليل تفصيلي لمساعدتك على البدء:

الخطوة 1: استيراد المكتبات اللازمة، بما في ذلك TensorFlow والمكتبات الأساسية الأخرى مثل numpy وmatplotlib لبناء نموذج GAN وتدريبه. 

الخطوة 2: تحميل مجموعة البيانات ومعالجتها مسبقًا، ما يساعد على ضمان تمثيلها لتوزيع البيانات المستهدفة (على سبيل المثال، الصور والنصوص وغيرها).  

الخطوة 3: بناء نموذج التوليد باستخدام طبقات TensorFlow أو Keras التي تأخذ ضوضاء عشوائية وتنتج عينات بيانات مطابقة للتوزيع المستهدف.

الخطوة 4: بناء نموذج التمييز لتصنيف عيّنات البيانات الحقيقية مقابل عيّنات البيانات المزيفة التي تم إنشاؤها بواسطة نموذج التوليد. 

الخطوة 5: استخدام أدوات التحسين المناسبة لكلٍّ من نموذج التوليد ونموذج التحسين وتحديد دوال الخسارة.

الخطوة 6: الجمع بين نموذج التوليد ونموذج التمييز في نموذج GAN واحد لتدريب نموذج التوليد على خداع نموذج التمييز. 

الخطوة 7: تنفيذ حلقة للتناوب بين تدريب نموذج التمييز ونموذج التوليد ببيانات حقيقية ومزيفة.

الخطوة 8: تحليل مخرجات نموذج التوليد ودقة نموذج التمييز عبر الأزمنة التدريبية للمساعدة على ضمان تقارب النموذج.

الخطوة 9: استخدام نموذج التوليد المدرَّب لإنتاج عينات جديدة تُحاكي توزيع البيانات المستهدف.

الخطوة 10: رسم أو تحليل البيانات التي تم إنشاؤها للتحقق من مدى جودة تعلُّم نموذج GAN للتوزيع المستهدف. 

باتباع هذه الخطوات، يمكن تنفيذ نموذج GAN الأساسي باستخدام TensorFlow.

يُعَد مستقبل شبكات GAN واعدًا، مع توقعات بتحسينات في الواقعية والاستقرار والكفاءة والجوانب الأخلاقية. مع زيادة تكامل شبكات GAN مع تقنيات أخرى وظهور تطبيقات جديدة لها، ستستمر في إحداث تغيير جذري في مختلف الصناعات والمجالات.

حلول ذات صلة
IBM watsonx.ai

تدريب الذكاء الاصطناعي التوليدي والتحقق من صحته وضبطه ونشره، وكذلك قدرات نماذج الأساس والتعلم الآلي باستخدام IBM watsonx.ai، وهو استوديو الجيل التالي من المؤسسات لمنشئي الذكاء الاصطناعي. أنشئ تطبيقات الذكاء الاصطناعي بسرعة أكبر وببيانات أقل.

اكتشف watsonx.ai
حلول الذكاء الاصطناعي

استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.

استكشف حلول الذكاء الاصطناعي
الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

احصل على وصول شامل إلى القدرات التي تغطي دورة حياة تطوير الذكاء الاصطناعي. تمكَّن من إنتاج حلول ذكاء اصطناعي قوية بفضل الواجهات سهلة الاستخدام وعمليات سير العمل السلسة وإمكانية الوصول إلى واجهات برمجة التطبيقات ومجموعات تطوير البرامج القياسية في الصناعة.

استكشف watsonx.ai احجز عرضًا توضيحيًا مباشرًا
الحواشي

1 Goodfellow, I. J., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., ... & Bengio, Y. (2014). Generative adversarial nets. Advances in neural information processing systems27.

2 Alqahtani, Hamed & Kavakli, Manolya & Kumar, Gulshan. (2019). Applications of Generative Adversarial Networks (GANs): An Updated Review. Archives of Computational Methods in Engineering. 28. 10.1007/s11831-019-09388-y.

3 Qiao, K., Chen, J., Wang, L., Zhang, C., Tong, L., & Yan, B. (2020). BigGAN-based Bayesian reconstruction of natural images from human brain activity. Neuroscience, 444, 92–105. https://doi.org/10.1016/j.neuroscience.2020.07.040.

4 Alarcon, N. (2020). Synthesizing High-Resolution Images with StyleGAN2. NVIDIA Technical Blog. https://developer.nvidia.com/blog/synthesizing-high-resolution-images-with-stylegan2.

5 Bansal, A., Ma, S., Ramanan, D., & Sheikh, Y. (2018). Recycle-GAN: Unsupervised Video Retargeting. arXiv. https://doi.org/10.48550/arXiv.1808.05174.

6 Prakash, C. D., Shrivastava, A., & Torresani, L. (2019). It GAN DO Better: GAN-based Detection of Objects on Images with Varying Quality. arXiv. https://arxiv.org/abs/1912.01707.