النماذج اللغوية الكبيرة (LLMs) هي نماذج الأساس التي تستخدم الذكاء الاصطناعي (AI)، والتعلم العميق ومجموعات البيانات الضخمة، بما في ذلك مواقع الويب والمقالات والكتب، لإنشاء النصوص والترجمة بين اللغات وكتابة أنواع كثيرة من المحتوى. هناك نوعان من نماذج الذكاء الاصطناعي التوليدي هذه: النماذج اللغوية الكبيرة المملوكة والنماذج اللغوية الكبيرة مفتوحة المصدر.
في هذا الفيديو، يشرح Martin Keen بإيجاز النماذج اللغوية الكبيرة، وكيفية ارتباطها بنماذج الأساس، وكيفية عملها وكيف يمكن استخدامها لمعالجة مشكلات الأعمال المختلفة.
النماذج اللغوية الكبيرة المملوكة هي نماذج مملوكة لشركات ولا يمكن استخدامها إلا من قِبل العملاء الذين يشترون ترخيصًا. قد يقيد الترخيص كيفية استخدام النموذج اللغوي الكبير. من ناحية أخرى، فإن النماذج اللغوية الكبيرة مفتوحة المصدر هي نماذج مجانية ومتاح لأي شخص الوصول إليها واستخدامها لأي غرض وتعديلها وتوزيعها.
يشير مصطلح "مصدر مفتوح" إلى أن كود النماذج اللغوية الكبيرة والبنية الأساسية متاح للجمهور، ما يعني أن المطورين والباحثين لهم الحرية في استخدام النموذج أو تحسينه أو تعديله.
في السابق، كان يبدو أنه كلما كان النموذج اللغوي الكبير أكبر، كان ذلك أفضل، ولكن الآن أدركت الشركات أنها قد تكون باهظة التكلفة من حيث البحث والابتكار. استجابة لذلك، بدأ النظام البنائي لنموذج مفتوح المصدر يظهر بوادر واعدة ويشكل تحديًا لنموذج أعمال النموذج اللغوي الكبير.
يمكن للمؤسسات التي ليس لديها مواهب داخلية في مجال التعلم الآلي استخدام النماذج اللغوية الكبيرة مفتوحة المصدر، التي توفر الشفافية والمرونة، ضمن بنيتها التحتية الخاصة، سواء في السحابة أو محليًا. يمنحهم ذلك تحكمًا كاملاً في بياناتهم؛ ويعني ذلك بقاء المعلومات الحساسة داخل شبكتهم. كل هذا يقلل من خطر تسرب البيانات أو الوصول غير المصرح به.
يوفر النموذج اللغوي الكبير مفتوح المصدر الشفافية فيما يتعلق بكيفية عمله، وبنيته وبيانات التدريب ومنهجياته، وكيفية استخدامه. تتيح القدرة على فحص التعليمات البرمجية والاطلاع على الخوارزميات للمؤسسة مستوى أعلى من الثقة، وتساعد فيما يتعلق بعمليات التدقيق وتساعد على ضمان الامتثال الأخلاقي والقانوني. بالإضافة إلى ذلك، يمكن أن يؤدي تحسين النموذج اللغوي الكبير مفتوح المصدر بكفاءة إلى تقليل زمن الانتقال وتحسين الأداء.
وهي عمومًا أقل تكلفة على المدى الطويل من النماذج اللغوية الكبيرة المملوكة نظرًا إلى عدم وجود رسوم ترخيص. ومع ذلك، فإن تكلفة تشغيل النموذج اللغوي الكبير تشمل تكاليف البنية التحتية المحلية أو السحابية، وعادةً ما تنطوي على تكلفة طرح أولية كبيرة.
تسمح النماذج اللغوية الكبيرة مفتوحة المصدر والمدربة سلفًا بإجراء الضبط الدقيق. يمكن للمؤسسات أن تضيف ميزة إلى النموذج اللغوي الكبير بما يخدم احتياجاتهم المحددة، كما يمكن تدريب النماذج اللغوية الكبيرة على مجموعة بيانات محددة. يستلزم إجراء هذه التغييرات أو المواصفات على النماذج اللغوية الكبيرة المملوكة العمل مع المورّدين ويكلف الوقت والمال.
في حين أن النماذج اللغوية الكبيرة المملوكة تعني أن المؤسسة يجب أن تعتمد على مزود واحد، تتيح النماذج مفتوحة المصدر للمؤسسة الاستفادة من إسهامات المجتمع ومزودي الخدمات المتعددين وربما الفرق الداخلية للتعامل مع التحديثات والتطوير والصيانة والدعم. تتيح النماذج مفتوحة المصدر للمؤسسات تجربة إسهامات الأشخاص ذوي وجهات النظر المختلفة واستخدامها. يمكن أن يؤدي ذلك إلى النتائج التي تسمح للمؤسسات بمواكبة أحدث التقنيات. كما أنه يمنح الشركات التي تستخدم النماذج اللغوية الكبيرة مفتوحة المصدر مزيدًا من التحكم في تقنياتها وقراراتها المتعلقة بكيفية استخدامها.
الرسالة الإخبارية الخاصة بالمجال
احصل على رؤى منسقة حول أهم أخبار الذكاء الاصطناعي وأكثرها إثارةً للاهتمام. اشترِك في خدمة رسائل Think الإخبارية الأسبوعية. راجع بيان الخصوصية لشركة IBM.
سيتم تسليم اشتراكك باللغة الإنجليزية. ستجد رابط إلغاء الاشتراك في كل رسالة إخبارية. يمكنك إدارة اشتراكاتك أو إلغاء اشتراكك هنا. راجع بيان خصوصية IBM لمزيد من المعلومات.
يمكن للمؤسسات استخدام النماذج اللغوية الكبيرة مفتوحة المصدر لإنشاء أي مشروع مفيد لموظفيها، أو عندما تسمح رخصة النموذج مفتوح المصدر بذلك، يمكن تقديمها كمنتج تجاري. ويشمل ذلك ما يلي:
تسمح لك النماذج اللغوية الكبيرة مفتوحة المصدر بإنشاء تطبيق بقدرات توليد اللغات، مثل كتابة البريد الإلكتروني، أو منشورات مدونة أو القصص الإبداعية. يمكن لنموذج لغوي كبير مثل Falcon-40B، المقدم بموجب رخصة Apache 2.0، أن يستجيب لموجِّه باقتراحات نصية عالية الجودة يمكنك بعد ذلك تنقيحها وتحريرها.
يمكن للنماذج اللغوية الكبيرة مفتوحة المصدر المدربة على التعليمات البرمجية ولغات البرمجة الحالية مساعدة المطورين في إنشاء تطبيقات والعثور على الأخطاء والثغرات الأمنية.
تتيح لك النماذج اللغوية الكبيرة مفتوحة المصدر إنشاء تطبيقات تقدم تجارب تعليمية مخصصة، والتي يمكن تخصيصها وضبطها حسب أنماط تعليمية معينة.
يمكن لأداة LLM مفتوحة المصدر التي تلخص المقالات الطويلة والقصص الإخبارية والتقارير البحثية وغيرها أن تسهل استخراج البيانات الأساسية.
يمكن لهؤلاء فهم الأسئلة والإجابة عنها وتقديم الاقتراحات والمشاركة في محادثة باللغة الطبيعية.
يمكن للنماذج اللغوية الكبيرة مفتوحة المصدر التي تتدرب على مجموعات البيانات متعددة اللغات توفير ترجمات دقيقة وطليقة في العديد من اللغات.
يمكن للنماذج اللغوية الكبيرة تحليل النص لتحديد النبرة العاطفية أو المشاعر، وهو أمر ذو قيمة في إدارة سمعة العلامة التجارية وتحليل التعليقات.
يمكن أن تكون النماذج اللغوية الكبيرة ذات قيمة في تحديد المحتوى الإلكتروني غير المناسب أو الضار وتصفيته، وهو ما يساعد بصورة كبيرة على الحفاظ على بيئة إلكترونية أكثر أمانًا.
تستخدم مجموعة واسعة من المؤسسات النماذج اللغوية الكبيرة مفتوحة المصدر. على سبيل المثال، طورت شركة IBM ووكالة NASA نموذجًا لغويًا كبيرًا مفتوح المصدر متخصصًا في البيانات الجغرافية المكانية لمساعدة العلماء ومؤسساتهم في مواجهة تغير المناخ.
الناشرون والصحفيون يستخدمون النماذج اللغوية الكبيرة مفتوحة المصدر داخليًا لتحليل المعلومات وتحديدها وتلخيصها من دون مشاركة البيانات الخاصة خارج غرفة الأخبار.
بعض منظمات الرعاية الصحية تستخدم النماذج اللغوية الكبيرة مفتوحة المصدر في برامج الرعاية الصحية، بما في ذلك أدوات التشخيص وتحسينات العلاج والأدوات التي تتعامل مع معلومات المرضى والصحة العامة وغيرها.
طُوّر النموذج اللغوي الكبير مفتوح المصدر FinGPT خصوصًا للقطاع المالي.
تهدف لوحة صدارة النماذج اللغوية الكبيرة مفتوحة المصدر إلى تتبع النماذج اللغوية الكبيرة مفتوحة المصدر وروبوتات المحادثة وتصنيفها وتقييمها وفقًا لمعايير مختلفة.
على الرغم من أن مخرجات النماذج اللغوية الكبيرة تبدو طليقة وموثوقة، فإنه يمكن أن تكون هناك مخاطر تشمل تقديم معلومات مبنية على "الهلوسة" بالإضافة إلى مشكلات التحيز أو الموافقة أو الأمان. التوعية بهذه المخاطر هي إحدى الإجابات على هذه القضايا المتعلقة بالبيانات والذكاء الاصطناعي.
ستكون نماذج الذكاء الاصطناعي، وخاصة النماذج اللغوية الكبيرة، واحدة من أكثر التقنيات تحولاً في العقد المقبل. ومع فرض لوائح الذكاء الاصطناعي الجديدة إرشادات حول استخدام الذكاء الاصطناعي، فمن الضروري ألا يقتصر الأمر على إدارة وحوكمة نماذج الذكاء الاصطناعي، بل ومن المهم أيضًا حوكمة البيانات المدخلة في الذكاء الاصطناعي.
لمساعدة المؤسسات على تلبية تلك الاحتياجات ومضاعفة تأثير الذكاء الاصطناعي، تقدم IBM منصة watsonx، وهي منصة جاهزة للمؤسسات للذكاء الاصطناعي والبيانات. من خلال هذا التعاون، يوفر watsonx للمؤسسات القدرة على:
تعتمد وظيفة البحث الحواري في IBM watsonx Assistant على أساس عمليات التكامل المنشأة مسبقًا وإطار عمل التكامل منخفض التعليمات البرمجية (محتوى الرابط موجود خارج موقع ibm.com) وتجربة التأليف بدون تعليمات برمجية. يمكن للمطورين ومستخدمي الأعمال على حد سواء أتمتة الإجابة عن الأسئلة باستخدام البحث الحواري، ما يتيح لهم إنشاء تدفقات معاملات ذات قيمة أعلى وتجارب رقمية متكاملة مع مساعديهم الافتراضيين.
بالإضافة إلى البحث الحواري، يواصل مساعد ®watsonx Assistant التعاون مع IBM Research وwatsonx لتطوير نماذج لغوية كبيرة على منصة watsonx تتخصص في التصنيف والاستدلال واستخراج المعلومات والتلخيص وغيرها من حالات الاستخدام الحوارية. لقد حقق Watsonx Assistant بالفعل تقدمًا كبيرًا في قدرته على فهم العملاء بمجهود أقل باستخدام النماذج اللغوية الكبيرة.
استكشف مكتبة نماذج الأساس من IBM في محفظة watsonx لتوسيع نطاق الذكاء الاصطناعي التوليدي لأعمالك بثقة.
استفد من الذكاء الاصطناعي في عملك بالاستعانة بخبرة IBM الرائدة في مجال الذكاء الاصطناعي ومحفظة حلولها المتوفرة لك.
أعدّ ابتكار عمليات ومهام سير العمل الحساسة بإضافة الذكاء الاصطناعي لتعزيز التجارب وصنع القرارات في الوقت الفعلي والقيمة التجارية.