لقد وصل الذكاء الاصطناعي إلى مرحلة مفصلية، حيث يعد تدريب النماذج اللغوية الكبيرة (LLMs) من بين أكثر المهام تطلبًا لقوة الحوسبة. تُعد الحوسبة عالية الأداء ضرورية لتحسين أحمال تشغيل الذكاء الاصطناعي التوليدي والنماذج اللغوية الكبيرة (LLM)، في حين قد تكون وحدات معالجة الرسوميات (GPUs) باهظة الثمن وشحيحة. وحدات معالجة الرسوميات هي رقائق حاسوبية متخصصة مصممة للتعامل مع العمليات الحسابية المعقدة والمعالجة المتوازية، مما يجعلها مثالية للعمليات الحسابية المعقدة المطلوبة في التدريب والاستدلال لنماذج التعلم العميق. ونتيجةً لذلك، يزداد الطلب على وحدات معالجة الرسوميات (GPUs)، ويُعد تحسين استخدامها أمراً بالغ الأهمية لنجاح تطبيقات الذكاء الاصطناعي.
رصَدَ فريق نماذج الذكاء الاصطناعي الكبيرة (BAM) من IBM، الذي يدعم بيئة البحث والتطوير الأساسية للفرق الهندسية لاختبار مشاريع الذكاء الاصطناعي الوليدي وتحسينها، فرصة للتحسين. ومع ازدياد عدد المشاريع التي تمر بمرحلة الاختبار، أدرك الفريق أهمية الاستخدام الأمثل لكل مثيل لتجنب إهدار الموارد.
لتحقيق أقصى استفادة من موارد وحدة معالجة الرسوميات وإدارة مثيلات Kubernetes الخاصة بالنماذج اللغوية الكبيرة، نشر فريق IBM BAM أداة ®IBM Turbonomic، وهي أداة برمجية متقدمة لإدارة موارد التطبيقات. باستخدام البيانات في الوقت الحقيقي، قدمت Turbonomic توصيات ذكية مستندة إلى الذكاء الاصطناعي لاتخاذ إجراءات آلية تهدف إلى تحسين استغلال الموارد وزيادة كفاءتها. من خلال تحديد استراتيجيات مثلى لتخصيص الموارد، قدم الحل توصيات مخصصة يمكن للفريق إعدادها للتنفيذ تلقائيًا، مما يتيح تحسين الموارد باستخدام الذكاء الاصطناعي.
كأداة برمجية داخلية من IBM صُممت خصيصًا لتحسين إدارة السحابة الهجينة، التي تشمل التطبيقات المدمجة في حاويات، والأجهزة الافتراضية والسُّحب العامة، وفرت IBM Turbonomic تكاملًا سلسًا مع البنية التحتية الحالية.
يلخص توم موريس، الباحث في منصة الذكاء الاصطناعي: "تمكين Turbonomic من زيادة أو تقليل خوادم استدلال النماذج اللغوية الكبيرة (LLM) ساعدني على تقليل الوقت الذي أقضيه في مراقبة الأداء."
قبل
بعد
بفضل Turbonomic، تمكن فريق IBM BAM من بناء بنية تحتية مرنة وقابلة للتوسع لتلبية المتطلبات المتزايدة لأعمالهم، مما دعم خدمات LLM وشغل أكثر من 100 وحدة معالجة رسومات من نوع NVIDIA A100. A100.
من خلال تقليص المثيلات المبالغ في تخصيصها، تمكن الفريق من زيادة الموارد غير المستغلة لوحدات معالجة الرسوميات من 3 إلى 16 وحدة (5.3 أضعاف)، مما أتاح استخدام هذه الموارد لأحمال تشغيل إضافية.
تضمنت النتائج ما يلي:
باستخدام إمكانيات الأتمتة التي توفرها Turbonomic، نجح فريق IBM BAM في تحسين وتوسيع خدمات النماذج اللغوية الكبيرة، مما أتاح لهم إعادة تخصيص وقتهم للعمل على مشاريع استراتيجية.
فريق IBM Big AI Models (BAM) هو مجموعة من الباحثين والمهندسين في ®IBM Research متخصصون في تطوير وتطبيق نماذج الذكاء الاصطناعي واسعة النطاق. تم تصميم هذه النماذج لمعالجة وتحليل كميات ضخمة من البيانات، مما يدعم تطبيقات مثل معالجة اللغة الطبيعية، ورؤية الحاسوب، والتحليلات التنبؤية.
حقوق النشر © محفوظة لصالح شركة IBM Corporation لعام 2024. IBM وشعار IBM وTurbonomic وIBM Research هي علامات تجارية أو علامات تجارية مسجلة لشركة IBM Corp.، في الولايات المتحدة و/أو دول أخرى. يصبح هذا المستند ساريًا بدءًا من تاريخ النشر الأول، ويجوز لشركة IBM تغييره في أي وقت. لا تتوفر بعض العروض في بعض الدول التي تعمل فيها IBM.
الأمثلة المقدمة عن العملاء تهدف إلى توضيح كيفية استخدامهم لمنتجات IBM والنتائج التي قد حققوها. قد تختلف النتائج الفعلية من حيث الأداء أو التكلفة أو التوفير أو غيرها في بيئات تشغيل مختلفة.