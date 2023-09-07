نعيش اليوم لحظة فارقة في عالم الذكاء الاصطناعي الموجَّه للأعمال. ومع توسيع استخدام هذه التقنية في مجالات تمتد من خدمة العملاء إلى الموارد البشرية وتحديث التعليمات البرمجية، بات الذكاء الاصطناعي (AI) يمكّن المزيد من العاملين من إنجاز العمل بقدر أعلى من الذكاء والكفاءة، لا بمجرد بذل جهد أكبر. ولأننا لا نزال في بدايات ثورة الذكاء الاصطناعي في عالم الأعمال، فإن إمكانات تحسين الإنتاجية وتعزيز الإبداع هائلة.
لكن الذكاء الاصطناعي اليوم هو مجال ديناميكي بشكل لا يصدق، ويجب أن تعكس منصات الذكاء الاصطناعي هذه الديناميكية، بحيث تتضمن أحدث التطورات لتلبية متطلبات اليوم والغد. لهذا السبب نواصل في IBM إضافة قدرات جديدة قوية إلى IBM watsonx، مجموعتنا من منتجات الذكاء الاصطناعي.
اليوم نعلن عن أحدث إضافة لنا: مجموعة جديدة من نموذج الأساس التي بنتها IBM والتي ستكون متوفرة في watsonx.ai. استوديو الذكاء الاصطناعي التوليدي نموذج الأساس والتعلم الآلي. تسمى نموذج الأساس متعددة الأحجام مجتمعة "Granite"، حيث تطبق الذكاء الاصطناعي التوليدي على كل من اللغة والتعليمة البرمجية. وكما أن Granite مادة قوية متعددة الأغراض ذات استخدامات متعددة في البناء والتصنيع، نؤمن في IBM أن هذه النماذج من Granite ستوفر قيمة دائمة لعملك.
لكن الآن دعونا نتعمق أكثر ونتناول ملامح عن طريقة بنائها، وكيف ستساعدك على الارتقاء بالذكاء الاصطناعي إلى المستوى التالي في عملك.
تضمن نماذج Granite التي طورتها شركة IBM Research نموذج Granite® — Granite.13b.instruct ونموذج Granite.13b.chat — وتستخدم بنية "فك الترميز" التي تدعم قدرة النماذج اللغوية الكبيرة اليوم على التنبؤ بالكلمة التالية في التسلسل.
وبحجم 13 مليار معلمة، تأتي نماذج Granite أكثر كفاءة من النماذج الأكبر حجمًا، إذ يمكن نشرها على وحدة معالجة رسوميات واحدة من نوع V100 بسعة 32 جيجابايت. كما يمكن أن يكون أثرها البيئي أقلّ مقارنة بالنماذج الأكبر، مع استمرار قدرتها على أداء مهام متقدمة في سياقات الأعمال، مثل التلخيص، والإجابة عن الأسئلة، والتصنيف. ويمكن توظيف هذه النماذج عبر قطاعات وصناعات متعددة، فهي تدعم العديد من مهام معالجة اللغة الطبيعية، مثل توليد المحتوى، واستخراج الرؤى، والتوليد المعزز بالاسترجاع (وهو إطار عمل لتحسين جودة الاستجابات عبر ربط النموذج بمصادر معرفية خارجية)، بالإضافة إلى التعرف على الكيانات المُسمّاة واستخراج المعلومات الجوهرية من النصوص.
نحن في IBM نركز على بناء نماذج تستهدف الأعمال التجارية. مجموعة نماذج Granite ليست استثناء، لذا قمنا بتدريبها على مجموعة متنوعة من مجموعات البيانات — بإجمالي 7 تيرابايت قبل المعالجة المسبقة، و2.4 تيرابايت بعد المعالجة المسبقة — لإنتاج تريليون رمز مميز، وهي مجموعة من الأحرف التي تحمل معنى دلاليًا للنموذج. كان اختيارنا لمجموعات البيانات موجهًا نحو احتياجات مستخدمي الأعمال ويشمل بيانات من المجالات التالية:
من خلال تدريب النماذج على مجموعات البيانات المتخصصة في المؤسسات، نساعد على ضمان تعرّف نماذجنا على اللغة والمصطلحات المتخصصة في هذه الصناعات واتخاذ قرارات تستند إلى المعرفة المتخصصة في الصناعات.
الثقة هي رخصتك للعمل في مجال الأعمال. "ثق بنا" ليست حجة، خاصة عندما يتعلق الأمر بالذكاء الاصطناعي. وبصفتها واحدة من أولى الشركات التي طورت الذكاء الاصطناعي للمؤسسات، فإن نهج IBM في تطوير الذكاء الاصطناعي يستند إلى مبادئ أساسية قائمة على التزامات الثقة والشفافية. تتيح لك منتجات IBM watsonx أن تتجاوز مجرد أن تكون مستخدمًا للذكاء الاصطناعي وتصبح صانع قيمة للذكاء الاصطناعي. ولديها عملية شاملة لبناء نماذج الأساس وقدرات الذكاء الاصطناعي التوليدي واختبارها— يبدأ ذلك بجمع البيانات وينتهي بنقاط تحكم لتتبع نشر النماذج والتطبيقات —ويركز على الحوكمة وتقييم المخاطر والتخفيف من التحيزات والامتثال.
ولأن نماذج Granite ستكون متاحة للعملاء ليكيّفوها مع تطبيقاتهم الخاصة، فإن كل مجموعة بيانات تُستخدم في التدريب تمرّ بعملية مراجعة واضحة للحوكمة والمخاطر والامتثال (GRC). وقد وضعنا إجراءات حوكمة لإدخال البيانات في "IBM Data Pile" بما يتوافق مع مبادئ أخلاقيات الذكاء الاصطناعي في IBM. ويشمل الالتزام بمعايير الحوكمة والمخاطر والامتثال (GRC) دورة حياة بيانات التدريب كاملة. هدفنا هو إنشاء رابط يمكن تتبّعه وتدقيقه يربط بين نموذج الأساس بعد تدريبه وبين الإصدار المحدّد من مجموعة البيانات التي جرى التدريب عليها.
حظي خطر أن ينتج الذكاء الاصطناعي التوليدي محتوى يحض على الكراهية أو يتضمّن تشهيرًا باهتمام إعلامي واسع. في IBM ندرك أن المؤسسات لا تستطيع تحمّل مثل هذه المخاطر؛ لذلك ندرّب نماذج Granite على بيانات جرى فحصها باستخدام أداتنا "HAP detector"، وهو نموذج لغوي طوّرته IBM لاكتشاف المحتوى الذي يتضمّن كراهية أو ألفاظًا نابية واستبعاده. وتُقاس دقته مقارنةً بنماذج خاصة وأخرى متاحة للعامة. بعد إسناد درجة لكل جملة في أي مستند، نجري تحليلات على الجمل ودرجاتها لدراسة التوزيع، ومن ثم تحديد النسبة المئوية من الجمل التي ينبغي تصفيتها.
إلى جانب ذلك، نطبق طيفًا واسعًا من مقاييس الجودة الأخرى؛ إذ نبحث عن التكرار الذي قد يسيء إلى جودة المخرجات ونعمد إلى إزالته، كما نستخدم مرشّحات خاصة بجودة المستندات للتخلّص من المستندات منخفضة الجودة غير المناسبة لأغراض التدريب. كما نعتمد ضوابط منتظمة ومستمرة لحماية البيانات، من بينها مراقبة المواقع المعروفة بقرصنة المحتوى أو نشر مواد مسيئة، واستبعاد هذه المواقع من مصادر التدريب.
وبما أن مشهد تقنيات الذكاء الاصطناعي التوليدي يتطور بوتيرة متسارعة، فإن عمليتنا المتكاملة ستستمر في التطوّر والتحسّن، بما يضمن للمؤسسات نتائج يمكنها الوثوق بها.
إن مفتاح رؤية IBM للذكاء الاصطناعي للأعمال هو مفهوم التمكين. وكل مؤسسة ستنشر Granite لتحقيق أهدافها الخاصة، ولكل مؤسسة لوائحها الخاصة التي يجب الالتزام بها، سواء كانت من القوانين أو المعايير الاجتماعية أو معايير الصناعة أو متطلبات السوق أو المتطلبات المعمارية. نعتقد أنه يجب تمكين المؤسسات من تخصيص نماذجها وفقًا لقيمها الخاصة (ضمن الحدود)، أينما كانت أحمال التشغيل، باستخدام أدوات watsonx.
لكن الصورة لا تقتصر على ذلك. في watsonx تظل ملكية بياناتك عائدة إليك بالكامل، أيًّا كان ما تفعله بها داخل المنصة. نحن لا نستخدم بياناتك لتدريب نماذجنا، وتظل لك السيطرة الكاملة على النماذج التي تبنيها ويمكنك نقلها وتشغيلها حيثما تشاء.
نماذج Granite الأولية ليست سوى البداية: نخطط لإنجاز المزيد بلغات أخرى وتوجد أيضًا نماذج أخرى مدربة من IBM في طور الإعداد. وفي الوقت نفسه، نستمر في إضافة مصدر مفتوح إلى watsonx. أعلنا مؤخرًا أن IBM تقدم الآن نموذج Llama 2-chat الذي يضم 70 مليار معلمة من Meta لتحديد عملاء بهدف الوصول المبكر ونخطط لكي يكون متاحًا على نطاق واسع في وقت لاحق من سبتمبر. بالإضافة إلى ذلك، ستستضيف IBM StarCoder، وهو نموذج لغوي كبير للبرمجة، يشمل أكثر من 80لغة برمجية، والتزامات Git، وإصدارات GitHub وJupyter Notebook.
وبالإضافة إلى النماذج الجديدة، تطلق IBM قدرات تكميلية جديدة في استوديو watsonx.ai. وخلال هذا الشهر سنطرح الإصدار الأول من "Tuning Studio"، الذي يتضمن ميزة ضبط الموجِّهات، وهي طريقة فعّالة ومنخفضة التكلفة تتيح للعملاء تكييف نماذج الأساس مع مهامهم اللاحقة المتخصصة، عن طريق تدريب النماذج على بياناتهم الموثوقة. سنطرح أيضًا أداة "Synthetic Data Generator" التي تساعد المستخدمين على إنشاء مجموعات بيانات جدولية اصطناعية من مخططات بيانات مخصّصة أو من مجموعات بيانات داخلية. تتيح هذه الإمكانية استخلاص رؤى لتدريب نماذج الذكاء الاصطناعي وضبطها بدقة أو لمحاكاة سيناريوهات مختلفة مع تقليل المخاطر، بما يعزّز جودة صناعة القرار ويُسرّع وتيرة طرح المنتجات والخدمات في السوق.
إن إضافة نماذج الأساس Granite والقدرات التكميلية الأخرى إلى watsonx تفتح آفاقًا جديدة وواعدة لاستخدامات الذكاء الاصطناعي في عالم الأعمال. ومع كل جيل جديد من النماذج والأدوات، تظهر أفكار وحلول مبتكرة. وأفضل ما في الأمر أنّنا ما زلنا في بداية الطريق.
تخضع البيانات المتعلقة بالاتجاه والنوايا المستقبلية لشركة IBM للتغيير أو الإلغاء دون إشعار، وتمثِّل الأهداف والغايات فقط.