تشير الحوسبة المسرّعة إلى استخدام الأجهزة والبرامج المصممة خصيصًا لتسريع مهام الحوسبة.
تعتمد الحوسبة المسرعة على مجموعة واسعة من الأجهزة والبرمجيات (المعروفة أيضًا باسم المسرعات)، بما في ذلك وحدات معالجة الرسومات (GPUs) والدوائر المتكاملة الخاصة بالتطبيقات (ASICs) ومصفوفات البوابات القابلة للبرمجة الميدانية (FPGAs).
يزداد الطلب على حلول الحوسبة المسرّعة في العديد من الصناعات لأنها يمكن أن تؤدي العمليات الحسابية بشكل أسرع وأكثر كفاءة من وحدات المعالجة المركزية (CPUs) التقليدية. على عكس وحدات المعالجة المركزية، تعتمد المسرعات على الحوسبة المتوازية، وهي طريقة لحل المشكلات الحاسوبية يتم فيها تقسيم المهام إلى مشاكل أصغر وحلها في وقت واحد، وليس بشكل متسلسل.
بسبب سرعات معالجة البيانات، أصبحت الحوسبة المسرّعة ضرورية لتقدم العديد من التقنيات والتطبيقات المتطورة، بما في ذلك الذكاء الاصطناعي (AI)، والذكاء الاصطناعي التوليدي والتعلم الآلي (ML) والحوسبة عالية الأداء (HPC). واليوم، أصبحت هذه التقنية عنصراً رئيسياً في استراتيجيات العديد من شركات التكنولوجيا الأكثر نجاحاً في العالم، بما في ذلك Google و Amazon Web Services (AWS) و Microsoft.
تتكون وحدات المعالجة المركزية أو الوحدات أو CPUs من دوائر إلكترونية متنوعة تعمل بنظام تشغيل الكمبيوتر (OS) والتطبيقات. ولسنوات عديدة، كانت وحدة المعالجة المركزية بمنزلة العقل المدبر للكمبيوتر، حيث كانت تقوم بتحويل مدخلات البيانات إلى مخرجات معلومات. ولكن، مع ازدياد تقدم التطبيقات، أصبحت التطبيقات بحاجة إلى معالجة البيانات بشكل أسرع وأكثر كفاءة مما تستطيع وحدات المعالجة المركزية معالجته. أدخل المسرعات وتقنيات الحوسبة المسرّعة بفضل قدرات المعالجة المتوازية وزمن الانتقال القصير والإنتاجية العالية. منذ ثمانينيات القرن العشرين، عندما برزت لأول مرة، اعتمدت العديد من أكبر التطورات التكنولوجية في علوم الكمبيوتر على المسرعات.
بدءًا من ألعاب الفيديو الجديدة الأكثر تشويقًا وتجارب الواقع الافتراضي الغامرة إلى ChatGPT، وتدريب نماذج الذكاء الاصطناعي و وتحليل البيانات الكبيرة، تُعد المسرّعات جزءًا أساسيًا من عالمنا سريع التطور وفائق الترابط. تعتمد العديد من المؤسسات الحديثة على المسرّعات لتشغيل تطبيقاتها الأكثر قيمة وبنى البنية التحتية، بما في ذلك الحوسبة السحابية ومراكز البيانات وحوسبة الحافة ونماذج اللغة الكبيرة (LLMs). على سبيل المثال، يستثمر قادة الأعمال والمطورون الذين يتطلعون إلى استكشاف الذكاء الاصطناعي التوليدي في مسرعات البيانات للمساعدة في تحسين مراكز البيانات الخاصة بهم ومعالجة المزيد من المعلومات بشكل أسرع1.
يتم استخدام المسرعات عبر مجموعة واسعة من تطبيقات الأعمال لتسريع معالجة البيانات—خاصةً مع توسع تغطية 5G —مما يزيد من فرص إنترنت الأشياء (IoT) وحوسبة الحافة. تعتمد تطبيقات إنترنت الأشياء (IoT) على المسرّعات لمعالجة البيانات من الأجهزة الذكية مثل الثلاجة، وأجهزة استشعار تدفق حركة المرور، وغيرها. يمكن أن توفر حوسبة الحافة رؤى أعمق وأوقات استجابة أسرع وتجارب عملاء محسّنة، ولكن فقط مع سرعات المعالجة التي توفرها المسرعات.
عندما يتعلق الأمر بالذكاء الاصطناعي، فإن العديد من تطبيقاته الأكثر تقدمًا—مثل معالجة اللغة الطبيعية (NLP)، والرؤية الحاسوبية ، والتعرف على الكلام—تعتمد على قوة الحوسبة المتسارعة للعمل. على سبيل المثال، تحتاج الشبكات العصبية التي تدعم العديد من تطبيقات الذكاء الاصطناعي المتطورة إلى مسرعات الذكاء الاصطناعي لتصنيف البيانات وتجميعها بسرعة عالية.
وأخيراً، في ظل سعي المزيد من الشركات إلى إيجاد طرق للتحول الرقمي وتسريع الابتكار، توفر حلول الحوسبة المسرّعة تكلفة إجمالية منخفضة نسبياً للملكية. إن قدرة المسرعات على معالجة كميات كبيرة من البيانات بسرعة ودقة تعني أنه يمكن استخدامها عبر العديد من التطبيقات المختلفة مع إمكانية إنشاء قيمة تجارية، بما في ذلك روبوتات الدردشة المدعومة بالذكاء الاصطناعي وتحليلات البيانات المالية والحوسبة السحابية والمزيد.
تستخدم الحوسبة المسرّعة مجموعة من الأجهزة والبرامج وتقنيات الشبكات لمساعدة المؤسسات الحديثة على تشغيل تطبيقاتها الأكثر تقدمًا. تشمل مكونات الأجهزة التي تعتبر ضرورية للمسرعات وحدات معالجة الرسومات والدوائر المتكاملة الخاصة بالتطبيقات (ASICs) ومصفوفات البوابات القابلة للبرمجة الميدانية (FPGAs). تعتبر البرامج وواجهات برمجة التطبيقات (APIs) على نفس القدر من الأهمية، حيث تلعب CUDA وOpenCL أدوارًا مهمة.
وأخيرًا، تساعد حلول الشبكات، مثل PCI express (PCIe) وNV link، وحدات المعالجة على التواصل مع الذاكرة وأجهزة التخزين حيث يتم الاحتفاظ بالبيانات. فيما يلي نظرة فاحصة على كيفية عمل مسرعات الأجهزة ومسرعات البرامج وحلول الشبكات معًا لجعل الحوسبة المسرّعة ممكنة.
يمكن لمسرعات الأجهزة الحديثة معالجة البيانات بشكل أسرع بكثير من وحدات المعالجة المركزية التقليدية نظرًا لقدرات المعالجة المتوازية الخاصة بها. بدونها، لن تكون العديد من أهم تطبيقات الحوسبة المسرّعة ممكنة.
وحدات معالجة الرسومات
وحدات معالجة الرسوميات أو GPUs، هي مسرّعات أجهزة مصممة لتسريع رسومات الكمبيوتر ومعالجة الصور على أجهزة مختلفة، بما في ذلك بطاقات الفيديو ولوحات النظام والهواتف المحمولة وأجهزة الكمبيوتر الشخصية (PC). وتقلل مسرعات GPU بشكل كبير من مقدار الوقت الذي يحتاجه الكمبيوتر لتشغيل برامج متعددة. كما تُستخدم الحوسبة المسرّعة بوحدة معالجة الرسوميات في مجموعة كبيرة من تطبيقات الحوسبة المسرّعة بما في ذلك الذكاء الاصطناعي وسلسلة الكتل.
الدوائر المتكاملة الخاصة بالتطبيقات (ASICs)
إن ASICs، أو الدوائر المتكاملة الخاصة بالتطبيقات، هي مسرعات أجهزة مصممة لغرض أو وظيفة محددة في الحسبان—مثل التعلم العميق، في حالة مسرع WSE-3 ASICs، الذي يُعد أحد أسرع مسرعات الذكاء الاصطناعي في العالم2. وعلى عكس بعض مسرعات الأجهزة الأخرى، لا يمكن إعادة برمجة ASICs. ومع ذلك، نظرًا لأنها مصممة لغرض واحد، فإنها عادةً ما تتفوق في الأداء على المسرعات التي تم تصميمها لمهام الحوسبة ذات الأغراض العامة . مثال آخر على مسرع ASICs هو وحدة معالجة Tensor (TPU) من Google، والتي تم تطويرها لشبكة التعلم الآلي العصبية (ML) على برنامج Tensorflow الخاص بشركة Google.
مصفوفات البوابات القابلة للبرمجة الميدانية (FPGAs)
مصفوفات البوابات القابلة للبرمجة الميدانية أو FPGAs، هي مسرّعات ذكاء اصطناعي قابلة للتخصيص بشكل كبير والتي تعتمد على معرفة متخصصة لإعادة برمجتها لغرض معين. وعلى عكس مسرعات الأجهزة الأخرى، تتمتع FPGAs بتصميم فريد يناسب وظيفة معينة، وغالبًا ما يتعلق بمعالجة البيانات في الوقت الفعلي. يمكن إعادة برمجة FPGAs على مستوى الأجهزة، ما يتيح مستوى تخصيص أعلى بكثير. وغالبًا ما تُستخدم في الفضاء وتطبيقات إنترنت الأشياء (IOT) وحلول الشبكات اللاسلكية.
وتلعب واجهات برمجة التطبيقات والبرمجيات أدواراً حاسمة في جعل المسرعات تعمل، حيث تقوم بالربط بين الأجهزة والشبكات اللازمة لتشغيل تطبيقات الحوسبة المسرّعة.
واجهات برمجة التطبيقات
واجهات برمجة التطبيقات، أو APIs، هي مجموعات من القواعد التي تسمح للتطبيقات بالتواصل وتبادل البيانات. وتُعد APIs ضرورية للحوسبة المسرّعة، حيث تساعد على دمج البيانات والخدمات والوظائف بين التطبيقات. إنها تعمل على تبسيط وتسريع تطوير التطبيقات والبرمجيات من خلال السماح للمطورين بدمج البيانات والخدمات والقدرات من التطبيقات الأخرى وتمكين مشاركتها عبر المجموعة بأكملها. وتساعد واجهات API على تحسين تدفق البيانات بين مسرعات الأجهزة والبرامج ومنح المطورين إمكانية الوصول إلى مكتبات البرامج التي تعتبر ضرورية لتطوير التطبيقات والبرمجيات.
CUDA
بنية الجهاز الموحدة للحوسبة (CUDA)، التي أنشأتها NVIDIA في عام 2007، هي برنامج يمنح المطورين وصولاً مباشرًا إلى قدرات الحوسبة المتوازية لوحدات معالجة الرسوميات من NVIDIA. وتُمكِّن CUDA المطورين من استخدام تقنية وحدة معالجة الرسوميات (GPU) في مجموعة من الوظائف أوسع بكثير مما كان ممكنًا في السابق. ومنذ ذلك الحين، وبناءً على ما أتاحته CUDA، اكتسبت مسرعات أجهزة وحدة معالجة الرسوميات المزيد من القدرات—ولعل أهمها تتبع الأشعة، وتوليد صور الكمبيوتر عن طريق تتبع اتجاه الضوء من الكاميرا، ونوى tensor التي تتيح تقنية التعلم العميق (DL).
OpenCL
OpenCL عبارة عن منصة مفتوحة المصدر مصممة للحوسبة المتوازية وتدعم العديد من أنواع مسرعات الأجهزة، بما في ذلك وحدات معالجة الرسوميات (GPU) ومصفوفات البوابات القابلة للبرمجة الميدانية (FPGAs). إن توافقها العالي يجعلها أداة مثالية للمطورين الذين يحتاجون إلى استخدام أنواع مختلفة من المكونات في أعباء عمل الحوسبة المسرّعة. تتضمن أمثلة حالات استخدام OpenCL الألعاب والنمذجة ثلاثية الأبعاد وإنتاج الوسائط المتعددة.
تعد تقنيات الشبكات ضرورية للحوسبة المسرّعة، مما يتيح الاتصال السريع والفعال بين العديد من وحدات المعالجة المختلفة وأجهزة الذاكرة والتخزين حيث يتم تخزين البيانات. فيما يلي بعض أنواع الشبكات المختلفة التي تعتمد عليها الحوسبة المسرّعة.
إيثرنت
إيثرنت هي نوع من التكنولوجيا المستخدمة على نطاق واسع لتوفير نقل سريع ومرن للبيانات بين الخوادم في مركز البيانات (أو فقط بين أجهزة الكمبيوتر الموجودة في نفس المساحة الفعلية). على الرغم من انتشارها الواسع وتكلفتها المعقولة، إلا أنها ليست بنفس سرعة بعض أنواع الشبكات الأخرى، مثل NVLink أو InfiniBand.
مسرى الربط السريع بين المكونات الطرفية (PCIe)
PCIe هو ناقل توسعة كمبيوتر عالي السرعة يربط جهازين بمصدر ذاكرة خارجي. تستخدم المسرعات PCIe لتوصيل وحدات معالجة الرسوميات أو أنواع أخرى من مسرعات الأجهزة بنظام حوسبة مركزي.
NVLink
NVLink هي تقنية التوصيل البيني الخاصة ب NVIDIA ويمكنها توفير نطاق ترددي أعلى بكثير من PCIe. تم تصميمها لتمكين مشاركة البيانات بكفاءة عالية بين وحدات معالجة الرسوميات والأجهزة الأخرى.
InfiniBand
InfiniBand عبارة عن مواصفات اتصالات تحدد بنية النسيج التبادلي على الخوادم المترابطة أو التخزين أو الأجهزة الأخرى في مركز البيانات. تم تصميم هذه التقنية من قِبل جمعية InfiniBand التجارية، وتتميز بأدائها العالي وزمن الانتقال المنخفض، مما يجعلها مثالية لأعباء العمل عالية الأداء.
وصلة الحوسبة السريعة (CXL)
CXL هي معيار توصيل بيني مفتوح تساعد على تحقيق زمن انتقال منخفض وزيادة عرض النطاق الترددي بين وحدات المعالجة المركزية والمسرعات من خلال دمج عدة واجهات في وصلة PCIe واحدة.
مع انتشار تقنية الذكاء الاصطناعي والتوسع في شبكات 5G التي تتيح سرعات نقل البيانات بسرعة البرق، يتزايد عدد حالات استخدام الحوسبة المسرّعة كل يوم. فيما يلي بعضًا من أكثرها شيوعا.
لن يكون الذكاء الاصطناعي AI ، وتطبيقاته التجارية العديدة، ممكنًا من دون مسرعات مثل وحدات معالجة الرسوميات (GPU) ووحدات المعالجة المتكاملة المخصصة للتطبيقات (ASICs). وتمكن أجهزة الحوسبة المتسارعة هذه أجهزة الكمبيوتر من إجراء حسابات معقدة للغاية بشكل أسرع وأكثر كفاءة من وحدات المعالجة المركزية التقليدية. وتعمل مسرعات مثل الحاسوب العملاق Vela من IBM والمخصص للذكاء الاصطناعي على تشغيل العديد من تطبيقات الذكاء الاصطناعي الرائدة والتي تعتمد على قدراتهم على تدريب نماذج الذكاء الاصطناعي على مجموعات بيانات أكبر وأكبر.
يعتمد كل من التعلم الآلي (ML) و التعلم العميق (DL)، وهو مجال من مجالات الذكاء الاصطناعي يهتم باستخدام البيانات والخوارزميات لتقليد الطريقة التي يتعلم بها البشر ويتخذون القرارات، على قدرات معالجة البيانات في المسرعات. تعمل الحوسبة المسرّعة على تمكين تدريب نماذج التعلم العميق من التعلم لاستخلاص الاستنتاجات من البيانات بطرق مماثلة للدماغ البشري.
تعتمد سلسلة الكتل، وهي دفتر الأستاذ الشهير الذي يُستخدم لتسجيل المعاملات وتتبع الأصول في شبكات الأعمال، اعتمادًا كبيرًا على الحوسبة المسرّعة. تعتمد الخطوة الحيوية التي تُسمى إثبات العمل (PoW) حيث يتم التحقق من صحة المعاملة وإضافتها إلى سلسلة الكتل، على المُسرِّعات. في العملات الرقمية، على سبيل المثال، تعني PoW أن أي شخص لديه الآلة المناسبة يمكنه التنقيب عن عملة رقمية، مثل البيتكوين.
تتعامل المسرعات مع مجموعات البيانات الكبيرة التي تم إنشاؤها بواسطة تطبيقات إنترنت الأشياء (IoT) بكفاءة أكبر بكثير من وحدة المعالجة المركزية ذات إمكانات المعالجة التسلسلية. يعتمد إنترنت الأشياء (IoT) على الأجهزة المتصلة بالإنترنت التي تجمع البيانات باستمرار لمعالجتها. تساعد مسرعات الأجهزة مثل وحدات معالجة الرسومات (GPUs) على معالجة البيانات بسرعة لتطبيقات إنترنت الأشياء (IOT) مثل السيارات والأنظمة ذاتية القيادة التي تراقب حركة المرور والطقس.
تعتمد حوسبة الحافة، وهي إطار حوسبة موزع يعمل على تقريب تطبيقات المؤسسات من مصادر البيانات، بشكل كبير على المسرعات لتعمل. أدى التوسع في اتصال 5G إلى نمو مجموعات البيانات بشكل كبير. تساعد الحوسبة المسرّعة، بقدراتها على المعالجة المتوازية، الشركات على الاستفادة من جميع إمكانيات حوسبة الحافة، مثل تقليل الوقت اللازم للاستفادة من المعلومات وتحسين أوقات الاستجابة وتحسين عرض النطاق الترددي.
إن IBM Spectrum LSF Suites عبارة عن منصة لإدارة أحمال التشغيل وجدولة المهام للحوسبة عالية الأداء (HPC).
تساعد حلول الحوسبة عالية الأداء السحابية الهجينة من IBM على معالجة التحديات واسعة النطاق وكثيفة الحوسبة وتسريع وقت الوصول إلى المعارف.
العثور على حل البنية التحتية السحابية الذي يلبي احتياجات أعمالك وتوسيع نطاق الموارد عند الطلب.
1. وحدات معالجة الرسومات تجبر مسؤولي المعلومات على إعادة التفكير في مركز البيانات، Information Week، في 23 أبريل 2024.
2. وحدة المعالجة المركزية العملاقة للذكاء الاصطناعي تحتوي على ما يقرب من مليون نواة، Tech Radar، في 16 مارس 2024