ما هو توليد اللغة الطبيعية (NLG)؟

المؤلفين

Ivan Belcic

Staff writer

Cole Stryker

Staff Editor, AI Models

IBM Think

ما هو توليد اللغة الطبيعية (NLG)؟

توليد اللغة الطبيعية (NLG) هو استخدام الذكاء الاصطناعي لإنشاء مخرجات بلغة طبيعية انطلاقًا من البيانات المنظمة وغير المنظمة. يُتيح توليد اللغة الطبيعية (NLG) لأجهزة الكمبيوتر وتطبيقات الذكاء الاصطناعي التوليدي التفاعل مع المستخدمين بلغة بشرية مفهومة. إلى جانب فهم اللغة الطبيعية (NLU)، يُعَد توليد اللغة الطبيعية (NLG) فرعًا من فروع معالجة اللغة الطبيعية (NLP).

تُستخدم أنظمة توليد اللغة الطبيعية (NLG) بالفعل على نطاق واسع في المنتجات المؤسسية والاستهلاكية، مثل أدوات ذكاء الأعمال (BI) وروبوتات المحادثة. يتواصل المساعدون الصوتيون مع المستخدمين من خلال NLG.

يستخدم قادة الأعمال تقنية NLG لتحويل البيانات المعقدة إلى نصوص توليدية لاستخلاص الرؤى الرئيسية. كلما أنتج نموذج الذكاء الاصطناعي مخرجات بلغة بشرية، فهذا يعني أن توليد اللغة الطبيعية (NLG) قيد العمل. 

أحدث اتجاهات الذكاء الاصطناعي، يقدمها لك الخبراء

احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.

شكرًا لك! لقد اشتركت بنجاح.

سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.

أنواع توليد اللغة الطبيعية (NLG)

النوعان الأساسيان من توليد اللغة الطبيعية (NLG) هما الاستخراجي والتجريدي: 

  • يعمل توليد اللغة الطبيعية الاستخراجي (Extractive NLG) على سحب الكلمات والعبارات الدقيقة مباشرةً من النص المصدر. يُستخدم في الحالات التي تكون فيها الصياغة الدقيقة أمرًا حاسمًا، مثل المستندات القانونية. بالمقارنة مع توليد اللغة الطبيعية التجريدي، يُعَد التوليد الاستخراجي أبسط لأنه ينسخ النصوص من المستندات المصدر بدلًا من إنتاج محتوى جديد. 

  • توليد اللغة الطبيعية التجريدي (Abstractive NLG) يُنتج محتوى جديدًا بناءً على المستندات المصدر، مع إعادة صياغة النص وإنشاء محتوى مبتكر. إنها عملية أكثر تعقيدًا تتطلب نماذج متقدمة، مثل المحوِّلات. بينما يُفضَّل توليد اللغة الطبيعية الاستخراجي في البيئات التقنية، يتفوق التوليد التجريدي في التطبيقات الأكثر إبداعًا.

Mixture of Experts | 12 ديسمبر، الحلقة 85

فك تشفير الذكاء الاصطناعي: تقرير إخباري أسبوعي

انضمّ إلى نخبة من المهندسين والباحثين وقادة المنتجات وغيرهم من الخبراء وهم يقدّمون أحدث الأخبار والرؤى حول الذكاء الاصطناعي، بعيدًا عن الضجيج الإعلامي.

كيف يعمل توليد اللغة الطبيعية (NLG)

يعمل توليد اللغة الطبيعية (NLG) من خلال المرور بعملية متعددة المراحل لصقل مدخلات البيانات المنظمة وغير المنظمة وإنتاج مخرجات بلغة طبيعية. كما وصفها عالم الكمبيوتر إيهود رايتر،1 تتضمن مراحل عملية توليد اللغة الطبيعية النموذجية ما يلي: 

  • تحليل الإشارات: يحدِّد نظام توليد اللغة الطبيعية البيانات المطلوبة لإنتاج المخرجات النهائية. في مرحلة تحليل الإشارات أو البيانات، تعمل تقنية التعرُّف على الأنماط على تحديد مضمون المحتوى والعلاقات بين الموضوعات. تشمل بيانات الإدخال مطالبات المستخدم، ومحتوى قواعد البيانات، والمحتوى اللغوي غير المنظم مثل ملفات PDF والمستندات وتسجيلات اللغة المنطوقة. يساعد التعرُّف على الكيانات أنظمة البرمجة اللغوية العصبية على فهم ما تتم مناقشته. 

  • تفسير البيانات: تولِّد نماذج معالجة اللغة الطبيعية رؤًى مستخلصة من نتائج مرحلة تحليلات البيانات. إذا كانت البيانات قد تمت معالجتها مسبقًا وتتوفر الرؤى بالفعل، يتم تجاوز هذه المرحلة. تحدِّد أنظمة معالجة اللغة الطبيعية أجزاء الكلام وتستخدم فهم اللغة الطبيعية (NLU) لتقييم البنية النحوية والدلالية، ما يكوِّن فهمًا للمعنى. 

  • تخطيط الوثائق: تحدِّد هذه المرحلة المعلومات التي يجب إيصالها وطريقة تنسيقها. يحدِّد نظام توليد اللغة الطبيعية نهجه لإنتاج المخرجات النهائية، اعتمادًا على البيانات المتوفرة ومطالبة المستخدم. 

  • التخطيط الدقيق (Microplanning): بعد تحديد المحتوى وطريقة عرضه، يعمل نظام توليد اللغة الطبيعية على تخطيط هيكل الجُمل والفقرات للمخرجات النهائية. 

  • تجسيد السطح (Surface realization): ينفِّذ نظام توليد اللغة الطبيعية خطته ويُنتج المخرجات بلغة طبيعية وفقًا لنتائج الخطوات السابقة. 

NLG مقابل NLP

يُعَد توليد اللغة الطبيعية جزءًا من فرع علوم الكمبيوتر الخاص بمعالجة اللغة الطبيعية: وهو استخدام نماذج التعلم الآلي لفهم اللغة البشرية والتعامل معها.
توليد اللغة الطبيعية هو جزء من معالجة اللغة الطبيعية، والذي يهتم بتوليد المحتوى، وتحديدًا إخراج لغة مكتوبة أو منطوقة جديدة. على سبيل المثال، تستخدم روبوتات المحادثة المدعومة بالذكاء الاصطناعي الحواري تقنية توليد اللغة الطبيعية للرد على مدخلات المستخدم في الوقت الفعلي. 

تحوِّل معالجة اللغة الطبيعية مدخلات اللغة الطبيعية إلى بيانات، بينما تستخدم تقنية توليد اللغة الطبيعية البيانات لإنشاء مخرجات بلغة طبيعية. 

معالجة اللغة الطبيعية (NLP) هي جزء من مجال اللغويات الحاسوبية، وهو دراسة كيفية تحليل وفهم أجهزة الكمبيوتر للغة البشرية. وتُعَد معالجة اللغة الطبيعية تطبيقًا عمليًا للغويات الحاسوبية.

مكَّن تطوير التعلم العميق والنماذج اللغوية الكبيرة (LLMs) من تحقيق تقدُّم في معالجة اللغة الطبيعية، ما دعم العديد من تطبيقات الذكاء الاصطناعي التوليدي المعنية بإنشاء المحتوى.

NLG مقابل NLU

فهم اللغة الطبيعية (NLU) هو فرع آخر من NLP. بدلًا من التركيز على المعنى النحوي واللغوي، تسعى NLU إلى فهم اللغة البشرية بشكل شامل. تستخدم NLU التحليل الدلالي والنحوي لاستيعاب مدخلات اللغة الطبيعية بشكل كامل وسياقي، بما في ذلك العاطفة والمشاعر والنوايا. 

تُتيح تقنية فهم اللغة الطبيعية (NLU) لأجهزة الكمبيوتر استيعاب المدخلات اللغوية بطريقة أقرب إلى الطريقة التي يفهم بها البشر. فعندما يتحدث الناس مع بعضهم، لا يكتفون بمعرفة معاني الكلمات فحسب، بل يستطيعون فهم المعنى العميق وراء الكلمات الحرفية للمتحدث. 

عندما يقدِّم تطبيق برمجي خيارات النص التنبؤي، فإنه يستخدم فهم اللغة الطبيعية لفهم نية المستخدم، ثم يطبِّق توليد اللغة الطبيعية لإكمال الجملة.تعمل تقنيات معالجة اللغة الطبيعية (NLP) وفهم اللغة الطبيعية (NLU) وتوليد اللغة الطبيعية (NLG) معًا لمساعدة أجهزة الكمبيوتر على التواصل مع المستخدمين.

نماذج ومنهجيات NLG

تستخدم العديد من أنظمة توليد اللغة الطبيعية نماذج الذكاء الاصطناعي مثل المحوِّلات لإنشاء نصوص جديدة من بيانات التدريب ومدخلات المستخدم.

ومع ذلك، قبل تطوير هذه النماذج، كان توليد اللغة الطبيعية ممكنًا بوسائل أخرى. تتضمن نماذج وتقنيات توليد اللغة الطبيعية ما يلي: 

  • القوالب

  • الأنظمة القائمة على القواعد 

  • المحولات

القوالب

تستخدم الأنظمة القائمة على القوالب نماذج جُمل محددة مسبقًا مع متغيّرات لبيانات الإدخال. تُعَد القوالب من أوائل وأبسط أنواع توليد اللغة الطبيعية، وهي مناسبة للسياقات التي تكون فيها هياكل الجُمل والمستندات متسقة. ومع ذلك، لا يمكن للأنظمة القائمة على القوالب أن تتكيف خارج حالات الاستخدام المحددة مسبقًا. 

قد يكون نموذج القالب مثاليًا كالآتي: في [الشهر] [السنة]، باع متجرنا في [الموقع] عدد [الكمية] من [العنصر].

بينما يتفوق هذا القالب في تقديم تقارير المبيعات حسب الموقع، لا يمكن استخدامه لإنشاء وصفة طبخ.

الأنظمة القائمة على القواعد

تعمل الأنظمة القائمة على القواعد على توليد النصوص وفق سلسلة من القواعد والمنطق المحددة مسبقًا. تم إنشاء الأنظمة المبكرة القائمة على القواعد لتقليد طريقة تحدُّث أو كتابة الخبراء في المجال. سيُجري المبرمجون مقابلات مع الخبراء، ثم يُنشئون القواعد المناسبة لتوليد النص

تُعَد أنظمة "إذا-إذن" مثالًا شائعًا على البرمجة القائمة على القواعد. على سبيل المثال، قد يُطلب من برامج توليد اللغة الطبيعية (NLG) الخاصة بالتنبؤ بالطقس وصف الطقس بأنه "أقل من درجة التجمد" إذا كانت درجة الحرارة أقل من 32 فهرنهايت أو 0 درجة مئوية.

خوارزميات التعلم الآلي الإحصائية

تعمل خوارزميات التعلم الآلي الإحصائية، مثل سلاسل ماركوف المخفية، على تحديد الأنماط في مجموعات البيانات الكبيرة لإجراء التنبؤات واتخاذ القرارات باستخدام بيانات جديدة.

ثم تُنشئ مثيلات جديدة بناءً على المثيل الحالي. بالنسبة إلى توليد اللغة الطبيعية، تولِّد سلاسل Markov والنماذج الإحصائية الأخرى كلمات من المحتمل أن يتَّبِع بعضها بعضًا. 

تُعَد النماذج الإحصائية أكثر مرونة من النماذج والأنظمة القائمة على القواعد، ولكنها تتطلب كميات كبيرة من بيانات التدريب.

نماذج التعلم العميق

تُعَد نماذج التعلُّم العميق تقدُّمًا في تكنولوجيا الذكاء الاصطناعي على الخوارزميات الإحصائية ويمكنها توليد نصوص تبدو أكثر طبيعية. تُعَد الشبكات العصبية المتكررة (RNNs) مثالًا على نماذج التعلم العميق المطبَّقة على NLG.

تعالج RNNs البيانات المتسلسلة، مثل الكلمات في الجملة، ويمكنها نقل المعرفة، كما هو الحال مع الترجمة الآلية.

المحولات

تعمل بنية نموذج المحوِّلات على تشغيل بعض تقنيات NLG الأكثر فاعلية المتاحة. تستخدم النماذج القائمة على المحوِّلات، مثل GPT وBERT، آليات الاهتمام الذاتي لالتقاط التبعيات بعيدة المدى في تسلسلات الإدخال لفهم سياقي أكبر.

يمكن لنموذج ChatGPT وClaude وروبوتات المحادثة الأخرى المدعومة بالمحوِّلات إنشاء مخرجات لغوية بشرية واقعية.

حالات استخدام توليد اللغة الطبيعية

تتواجد تقنية توليد اللغة الطبيعية (NLG) في جميع تطبيقات الذكاء الاصطناعي التوليدي، حيثما يُستخدم الذكاء الاصطناعي للتواصل المباشر مع البشر بلغة طبيعية. من Siri إلى تحليل المشاعر، تشمل حالات استخدام توليد اللغة الطبيعية ما يلي: 

  • المساعدون الصوتيون: يستخدم Siri وAlexa وغيرهما من المساعدين الصوتيين الآخرين تقنية NLG للرد على طلبات المستخدم بلغة منطوقة. كما يستخدمون معالجة اللغة الطبيعية وفهم اللغة الطبيعية للتعرُّف على الكلام وفهم ما يريده المستخدمون. 

  • المساعدون الافتراضيون: تستخدم روبوتات المحادثة والمساعدون الافتراضيون توليد اللغة الطبيعية لأتمتة تفاعلات العملاء. يستخدم العديد من المؤسسات المساعدين الافتراضيين للإجابة عن استفسارات خدمة العملاء الأولية قبل تصعيدها إلى ممثلين بشريين عند الضرورة. يتواصل الوكيل الافتراضي أيضًا مع المستخدمين من خلال توليد اللغة الطبيعية.

  • الترجمة الآلية: الترجمة الآلية هي استخدام نماذج التعلم الآلي لترجمة النصوص بين اللغات بشكل تلقائي. تتولى أنظمة توليد اللغة الطبيعية إنتاج المخرجات وتسرِّع عملية الترجمة التي تستغرق وقتًا طويلًا. يمكن للمترجمين البشر وخبراء التعريب بعد ذلك التحقق من المخرجات وتحريرها حسب الحاجة. 

  • ملخصات البيانات وإعداد التقارير: تعمل أنظمة توليد اللغة الطبيعية على تحويل البيانات المعقدة إلى ملخصات ومخططات موجزة يسهل فهمها. يساعد تبسيط عملية جمع وتلخيص المقالات والتقارير على جَعْل التنبؤ أكثر كفاءة. يستخدم قادة الأعمال أدوات ذكاء الأعمال المدعومة بتوليد اللغة الطبيعية لاتخاذ قرارات قائمة على البيانات. تستخدم شركات أخرى الذكاء الاصطناعي وأنظمة توليد اللغة الطبيعية لإنشاء هذا المحتوى لعملائها. 

  • توليد المحتوى: كلما أنتج نموذج ذكاء اصطناعي توليدي محتوى باللغة الطبيعية، فهذا يعني أن توليد اللغة الطبيعية قيد العمل. يمكن أن تختار الشركات استخدام توليد اللغة الطبيعية لأتمتة أوصاف المنتجات، وحملات التسويق عبر البريد الإلكتروني، ومنشورات وسائل التواصل الاجتماعي، وأنواع أخرى من المحتوى القصير. 

  • تحليل المشاعر: تعمل أنظمة NLG على إنشاء ملخصات نصية وتقارير بناءً على التعليقات والاتصالات. يمكن للشركات استخراج المحتوى الذي يُنشئه المستخدمون من مراجعات المنتجات ومنصات التواصل الاجتماعي ومنتديات الإنترنت ومواقع أخرى، ثم استخدام تقنيات NLP وNLG لفهم شعور المستخدمين. 

حلول ذات صلة
IBM watsonx Orchestrate

يمكنك بسهولة تصميم مساعدي ووكلاء الذكاء الاصطناعي القابلين للتوسع وأتمتة المهام المتكررة وتبسيط العمليات المعقدة باستخدام IBM watsonx Orchestrate.

استكشف watsonx Orchestrate
أدوات معالجة اللغة الطبيعية وواجهات برمجة التطبيقات

تسريع قيمة الأعمال باستخدام مجموعة قوية ومرنة من مكتبات وخدمات وتطبيقات الذكاء الاصطناعي.

استكشف حلول معالجة اللغة الطبيعية
الاستشارات والخدمات المتعلقة بالذكاء الاصطناعي

أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.

استكشف خدمات الذكاء الاصطناعي
اتخِذ الخطوة التالية

يمكنك بسهولة تصميم مساعدي ووكلاء الذكاء الاصطناعي القابلين للتوسع وأتمتة المهام المتكررة وتبسيط العمليات المعقدة باستخدام IBM watsonx Orchestrate.

استكشف watsonx Orchestrate استكشف حلول معالجة اللغة الطبيعية
الحواشي

1 Natural Language Generation, Ehud Reiter, Springer, 2024.