ما وحدة المعالجة العصبية (NPU)؟

نظام من الخلايا العصبية مزود بوصلات متوهجة على خلفية سوداء

المؤلفون

Josh Schneider

Staff Writer

IBM Think

Ian Smalley

Staff Editor

IBM Think

ما وحدة المعالجة العصبية (NPU)؟

وحدة المعالجة العصبية (NPU) هي معالج دقيق حاسوبي متخصص مصمم لمحاكاة وظيفة المعالجة في الدماغ البشري. وتم تحسينها للذكاء الاصطناعي للشبكات العصبية والتعلم العميق ومهام وتطبيقات التعلم الآلي.

تختلف وحدات المعالجة العصبية عن وحدات المعالجة المركزية للأغراض العامة (CPU) أو وحدات معالجة الرسومات (GPU)، حيث تم تصميم وحدات المعالجة العصبية لتسريع مهام الذكاء الاصطناعي وأحمال التشغيل، مثل حساب طبقات الشبكة العصبية المكونة من الرياضيات القياسية والمتجهة والمكثفة.

تُستخدم وحدات المعالجة العصبية (NPUs)، التي تُعرف أيضًا باسم شريحة الذكاء الاصطناعي أو مُسرِّع الذكاء الاصطناعي، عادةً في بنيات الحوسبة غير المتجانسة التي تجمع بين معالجات متعددة (على سبيل المثال، وحدات المعالجة المركزية ووحدات معالجة الرسومات). ويمكن لمراكز البيانات واسعة النطاق استخدام وحدات المعالجة العصبية المستقلة المتصلة مباشرة باللوحة الأم للنظام؛ ومع ذلك، فإن معظم التطبيقات الاستهلاكية، مثل الهواتف الذكية والأجهزة المحمولة وأجهزة الكمبيوتر المحمولة، تجمع بين وحدة المعالجة العصبية والمعالجات المشتركة الأخرى على شريحة واحدة من أشباه الموصلات تُعرف باسم النظام على الشريحة (SoC).

يمكن للمصنعين من خلال دمج وحدات المعالجة العصبية المخصصة تقديم تطبيقات الذكاء الاصطناعي التوليدي على الجهاز، القادرة على معالجة تطبيقات الذكاء الاصطناعي وأعباء عمل الذكاء الاصطناعي وخوارزميات التعلم الآلي في الوقت الفعلي مع استهلاك منخفض نسبيًا للطاقة وإنتاجية عالية.     

الميزات الرئيسية لوحدات المعالجة العصبية

تعد وحدات المعالجة العصبية (NPUs) مناسبة تمامًا للمهام التي تتطلب حوسبة متوازية ذات زمن انتقال قصير، مثل معالجة خوارزميات التعلم العميق والتعرف على الكلام ومعالجة اللغة الطبيعية ومعالجة الصور والفيديو واكتشاف الأشياء

تتضمن الميزات الرئيسية لوحدات المعالجة العصبية ما يلي:

  • المعالجة المتوازية: يمكن لوحدات المعالجة العصبية تقسيم المشاكل الكبيرة إلى عناصر لحل المشاكل متعددة المهام. ويسمح هذا للمعالج بتشغيل عمليات متعددة للشبكة العصبية بشكل متزامن. 
  • عمليات الحساب المنخفض الدقة: غالبًا ما تدعم وحدات المعالجة العصبية عمليات 8 بت (أو أقل) لتقليل التعقيد الحسابي وزيادة كفاءة الطاقة. 
  • نطاق ترددي عالٍ للذاكرة: تتميز العديد من وحدات المعالجة العصبية بنطاق ترددي عالٍ للذاكرة على الرقاقة لأداء مهام معالجة الذكاء الاصطناعي التي تتطلب مجموعات بيانات كبيرة بكفاءة.
  • تسريع الأجهزة: أدت التطورات في تصميم وحدات المعالجة العصبية إلى دمج تقنيات تسريع الأجهزة مثل بنيات المصفوفات الانقباضية أو معالجة الموترات المحسّنة.  

كيف تعمل وحدات المعالجة العصبية

استنادًا إلى الشبكات العصبية في الدماغ، تعمل وحدات المعالجة العصبية من خلال محاكاة سلوك الخلايا العصبية البشرية والمشابك العصبية في طبقة الدائرة. ويسمح ذلك بمعالجة مجموعات تعليمات التعلّم العميق التي تكمل فيها إحدى التعليمات معالجة مجموعة من الخلايا العصبية الافتراضية.

على عكس المعالجات التقليدية، فإن وحدات المعالجة العصبية غير مصممة لإجراء عمليات حسابية دقيقة. وبدلاً من ذلك، فإن وحدات المعالجة العصبية مصممة خصوصًا لوظائف حل المشكلات ويمكنها أن تتحسن بمرور الوقت، وتتعلم من أنواع مختلفة من البيانات والمدخلات. يمكن أن توفر أنظمة الذكاء الاصطناعي التي تتضمن وحدات المعالجة العصبية حلولاً مخصصة بشكل أسرع من دون الحاجة إلى المزيد من البرمجة اليدوية من خلال الاستفادة من التعلم الآلي.

توفر وحدات المعالجة العصبية ، كميزة بارزة، معالجة متوازية فائقة، حيث إنها قادرة على تسريع عمليات الذكاء الاصطناعي من خلال أنوية مبسطة عالية السعة يتم تحريرها لأداء أنواع متعددة من المهام. وتتضمن وحدات محددة للضرب والجمع ووظائف التنشيط وعمليات البيانات ثنائية الأبعاد وفك الضغط. تُستخدم وحدة الضرب والجمع المتخصصة لإجراء عمليات ذات صلة بمعالجة تطبيقات الشبكات العصبية، مثل حساب ضرب المصفوفات وجمعها والالتفاف والضرب النقطي ووظائف أخرى. 

في حين أن المعالجات التقليدية تتطلب آلاف التعليمات لتنفيذ هذا النوع من المعالجة العصبية، قد تتمكن وحدة المعالجة العصبية من تنفيذ عملية مماثلة بعملية واحدة فقط. ستقوم وحدة المعالجة العصبية أيضًا بدمج التخزين والحساب من خلال الأوزان المتشابكة —وهو متغير حسابي مائع يتم تعيينه لعقد الشبكة يشير إلى احتمال الحصول على نتيجة ”صحيحة“ أو ”مرغوبة“ يمكن تعديلها أو ”تعلمها“ بمرور الوقت—ما يؤدي إلى تحسين الكفاءة التشغيلية.

بينما يستمر تطوير وحدات المعالجة العصبية في التطور، أظهرت الاختبارات أن أداء بعض وحدات المعالجة العصبية أفضل من وحدات معالجة الرسومات المماثلة بأكثر من 100 مرة مع معدل استهلاك الطاقة نفسه. 

منظر جوي للطرق السريعة مع حركة المرور

ابق على اطلاع حول ما يخص السحابة

احصل على نشرة Think الأسبوعية للحصول على توجيهات الخبراء حول تحسين إعدادات السحابة المتعددة في عصر الذكاء الاصطناعي

المزايا الرئيسية لوحدات المعالجة العصبية

وحدات المعالجة العصبية (NPUs) ليست مصممة ولا يُتوقع أن تحل محل وحدات المعالجة المركزية ووحدات معالجة الرسومات التقليدية. ومع ذلك، تعمل بنية وحدة المعالجة العصبية على تحسين تصميم كلا المعالجين لتوفير توازٍ وتعلم آلي لا مثيل له وأكثر كفاءة. وهي قادرة على تحسين العمليات العامة (ولكنها الأنسب لأنواع معينة من المهام العامة)، وتقدم وحدات المعالجة العصبية عند دمجها مع وحدات المعالجة المركزية ووحدات معالجة الرسومات العديد من المزايا القيّمة مقارنة بالنظم التقليدية. 

تشمل المزايا الرئيسية ما يلي:

  • المعالجة المتوازية: كما ذكرنا، يمكن لوحدات المعالجة العصبية تقسيم المشاكل الكبيرة إلى عناصر لحل المشاكل متعددة المهام. ويكمن السر في أنه على الرغم من أن وحدات معالجة الرسومات تتفوق أيضًا في المعالجة المتوازية، إلا أن البنية الفريدة لوحدة معالجة الشبكة يمكنها التفوق على وحدة معالجة الرسومات المكافئة مع تقليل معدل استهلاك الطاقة وتقليل البصمة المادية. 
  • تحسين الكفاءة: بينما تُستخدم وحدات معالجة الرسومات غالبًا للحوسبة عالية الأداء ومهام الذكاء الاصطناعي، يمكن لوحدات المعالجة العصبية أداء معالجة متوازية مماثلة بكفاءة طاقة أفضل بكثير. ونظرًا لانتشار الذكاء الاصطناعي وغيره من الحوسبة عالية الأداء بشكل متزايد وتطلبها المزيد من الطاقة، تقدم وحدات المعالجة العصبية حلاً قيّمًا لتقليل معدل استهلاك الطاقة الحرجة. 
  • معالجة بيانات الوسائط المتعددة في الوقت الفعلي: تم تصميم وحدات المعالجة العصبية لمعالجة مجموعة واسعة من مدخلات البيانات والاستجابة لها بشكل أفضل، بما في ذلك الصور والفيديو والكلام. إن تعزيز التطبيقات مثل التشغيل الآلي وأجهزة إنترنت الأشياء والأجهزة القابلة للارتداء باستخدام وحدات المعالجة العصبية يمكن أن يوفر تعليقات في الوقت الفعلي، ما يقلل من الاحتكاك التشغيلي ويوفر ملاحظات وحلولًا حاسمة عندما يكون وقت الاستجابة أكثر أهمية. 

مقارنة بين وحدات المعالجة العصبية ووحدات معالجة الرسومات ووحدات المعالجة المركزية

تُعد وحدة المعالجة المركزية بمثابة "دماغ" الكمبيوتر في عالم علوم الحاسب الكلاسيكية. تعالج وحدة المعالجة المركزية معظم مهام الحوسبة التقليدية وتكون مسؤولة عن مجموعة كبيرة من التطبيقات المحتملة. على الرغم من وجود العديد من الأنواع المختلفة، إلا أن جميع وحدات المعالجة المركزية تقوم عمومًا بإجراء العمليات بترتيب خطي، وتستجيب للطلبات بالترتيب الذي تأتي به. 

تحملت وحدات المعالجة المركزية العبء الأكبر من جميع عمليات المعالجة الحاسوبية تقريبًا منذ الخمسينيات إلى تسعينيات القرن العشرين، حيث كانت تنفذ التعليمات لتشغيل البرامج وأنظمة التحكم وإدارة المدخلات والمخرجات (I/O).

تدفع التطبيقات التي يزداد الطلب عليها بانتظام جيلاً تلو الآخر من تصميمات وحدة المعالجة المركزية إلى حدودها من الأجهزة، ما يتسبب في كثير من الأحيان في حدوث تباطؤ كبير أو حتى فشل النظام. ولكن مع ظهور ألعاب الحاسوب الشخصية والتصميم بمساعدة الحاسوب (CAD) في ثمانينيات القرن العشرين، تطلبت الصناعة حلاً أسرع وأكثر كفاءة لعرض رسومات الحاسوب. 

تم إنشاء وحدة معالجة الرسومات (GPU) في البداية لتخفيف مهام معالجة الصور الصعبة من وحدة المعالجة المركزية الرئيسية. ففي حين أن وحدات معالجة الرسومات تميل إلى استخدام عدد أقل من الأنوية لأداء العمليات الخطية، تتميز وحدات معالجة الرسومات بمئات إلى آلاف الأنوية مع القدرة على إجراء معالجة متوازية—وهي عملية يتم فيها تقسيم المهام الكبيرة إلى مشاكل أصغر يمكن حلها في وقت واحد من خلال معالجات و/أو أنوية متعددة. 

تم تطوير وحدات معالجة الرسومات في البداية لتلبية احتياجات معالجة الفيديو والصور، إلا أن قدرات المعالجة المتوازية لوحدات معالجة الرسومات جعلت الأجهزة مناسبة بشكل فريد لتطبيقات الحوسبة الأخرى الصعبة، مثل المهام المتعلقة بسلسلة الكتل والذكاء الاصطناعي. وفي حين أن وحدات معالجة الرسومات ليست النوع الوحيد من المعالجات القادرة على أداء المعالجة المتوازية أو الحوسبة المتوازية، إلا أنها مناسبة بشكل جيد للمهام المتوازية. ومع ذلك، فإن وحدات معالجة الرسومات لا تخلو من القيود، وعادةً ما تتطلب استهلاك طاقة مكلفًا للغاية لتشغيل عمليات أكثر صعوبة. حيث تأتي زيادة الأداء مصحوبة بتكلفة طاقة متزايدة باستخدام وحدات معالجة الرسومات. 

توفر وحدات المعالجة العصبية ومسرعات الذكاء الاصطناعي الأخرى بدائل أكثر كفاءة. توفر وحدات المعالجة العصبية المصممة خصوصًا لعمليات الذكاء الاصطناعي أداءً عاليًا مع معدل استهلاك أقل للطاقة (وميزة إضافية تتمثل في البصمة المادية الأصغر) من خلال دمج التوازي المتقدم لوحدات معالجة الرسومات وتحسينه.

مقارنة المعالجات

  • وحدات المعالجة المركزية: "دماغ" الكمبيوتر. تخصص وحدات المعالجة المركزية عادةً حوالي 70% من الترانزستورات الداخلية لبناء ذاكرة التخزين المؤقت، وهي جزء من وحدة التحكم في الكمبيوتر. وتحتوي على عدد قليل نسبيًا من الأنوية وتستخدم بنيات حوسبة تسلسلية لحل المشكلات الخطية ومصممة لعمليات التحكم المنطقي الدقيقة. 
  • وحدات معالجة الرسومات: تم تطوير وحدات معالجة الرسومات لأول مرة لمعالجة الصور والفيديوهات، وتحتوي وحدات معالجة الرسومات على عدد أكبر بكثير من الأنوية مقارنة بوحدات المعالجة المركزية وتستخدم معظم الترانزستورات الخاصة بها لبناء وحدات حسابية متعددة، كل منها ذات تعقيد حسابي منخفض، ما يتيح معالجة متوازية متقدمة. تُعد وحدات معالجة الرسومات مناسبة لأعباء العمل التي تتطلب معالجة البيانات على نطاق واسع، وقد وجدت وحدات معالجة الرسومات فائدة إضافية كبيرة في البيانات الكبيرة ومراكز الخوادم الخلفية وتطبيقات سلسلة الكتل.
  • وحدات المعالجة العصبية: بناءً على التوازي مع وحدات معالجة الرسومات، تستخدم وحدات المعالجة العصبية بنية حاسوبية مصممة لمحاكاة الخلايا العصبية في الدماغ البشري لتوفير أداء فائق الكفاءة. وتستخدم وحدات المعالجة العصبية أوزانًا متشابكة لدمج وظائف تخزين الذاكرة والحساب معًا، ما يوفر حلولاً أقل دقة في بعض الأحيان بزمن انتقال قصير للغاية. في حين أن وحدات المعالجة المركزية مصممة للحوسبة الخطية الدقيقة، فإن وحدات المعالجة العصبية مصممة للتعلم الآلي، ما يؤدي إلى تحسين تعدد المهام والمعالجة المتوازية والقدرة على ضبط العمليات وتخصيصها مع مرور الوقت من دون الحاجة إلى برمجة أخرى. 

حالات استخدام وحدات المعالجة العصبية

نظرًا لكونها تقنية ناشئة، تقدم العديد من الشركات الرائدة في مجال تصنيع الحواسيب والأجهزة—بما في ذلك Microsoft وIntel وNvidia وCualcomm وSamsung—وحدات معالجة عصبية مستقلة أو أشكالاً متكاملة مثل محرك Apple Neural Engine.

يوفر دمج وحدات المعالجة العصبية في الأجهزة الإلكترونية للمستهلكين مجموعة واسعة من الفوائد، مثل تحسين التعرف على الصور وتحسين الكاميرات التي تدعم تقنية الذكاء الاصطناعي لتحسين تشويش الخلفية في مكالمات الفيديو. تتضمن بعض التطبيقات الإضافية لوحدات المعالجة العصبية ما يلي.

الذكاء الاصطناعي والنماذج اللغوية الكبيرة

صُممت وحدات المعالجة العصبية كنوع من مسرّعات الذكاء الاصطناعي بهدف تحسين أداء أنظمة الذكاء الاصطناعي والتعلم الآلي، مثل الشبكات العصبية. واستكمالاً لوحدات معالجة الرسومات، يوفر التوازي المحسّن لوحدات المعالجة العصبية تطورات هائلة للنماذج اللغوية الكبيرة التي تتطلب المعالجة التكيفية ذات زمن الانتقال القصير، لتفسير إشارات الوسائط المتعددة، وإجراء عملية التعرف على الكلام وإنتاج اللغة الطبيعية والفن المستخدم في أدوات مثل روبوتات المحادثة المدعومة بالذكاء الاصطناعي وتطبيقات الصور والفيديو المدعومة بالذكاء الاصطناعي التوليدي .  

أجهزة إنترنت الأشياء (IoT)

بفضل قدرات التعلم الذاتي والمعالجة المتوازية الاستثنائية، فإن وحدات المعالجة العصبية مناسبة تمامًا لأجهزة إنترنت الأشياء المتصلة بالشبكة، مثل الأجهزة القابلة للارتداء والمساعدات الصوتية والأجهزة الذكية. 

مراكز البيانات

كان الذكاء الاصطناعي والتعلم الآلي بمثابة نعمة كبيرة لمراكز البيانات التي تسعى إلى تحسين موارد الطاقة. حيث تقدم وحدات المعالجة العصبية عالية الأداء والموفرة للطاقة قيمة هائلة لمراكز البيانات التي تقدم إدارة أفضل للموارد من أجل الحوسبة السحابية

المركبات ذاتية القيادة

تستفيد المركبات ذاتية القيادة مثل الطائرات من دون طيار أو السيارات والشاحنات ذاتية القيادة بشكل كبير من قدرات المعالجة في الوقت الفعلي لوحدات المعالجة العصبية، ما يسمح بتصحيح المسار بشكل أسرع وأفضل بناءً على مدخلات مستشعرات الوسائط المتعددة. وبفضل المعالجة المتوازية التي لا مثيل لها، يمكن لوحدات المعالجة العصبية أن تساعد المركبات ذاتية القيادة على تفسير المدخلات سريعة التطور ومعالجتها، مثل إشارات الطرق وأنماط حركة المرور وحتى العقبات غير المتوقعة.

حوسبة الحافة والذكاء الاصطناعي للحافة

بينما توفر الحوسبة السحابية حلولاً متقدمة للبيانات والموارد خارج الموقع لإنترنت الأشياء والأجهزة الذكية وأجهزة الحوسبة الشخصية الأخرى، تسعى حوسبة الحافة والذكاء الاصطناعي للحافة إلى تقريب البيانات الحساسة وحوسبة الموارد فعليًا من المستخدمين. ويقلل هذا من زمن الانتقال ومعدل استهلاك الطاقة ويعزز الخصوصية. أصبحت وحدات المعالجة العصبية، التي تتطلب طاقة أقل وتوفر بصمة مادية أصغر، عنصرًا قيمًا في حوسبة الحافة والذكاء الاصطناعي على الجهاز. 

التشغيل الآلي

تُعد وحدات المعالجة العصبية بارعة في إنجاز المهام التي تتطلب التعلم الآلي والرؤية الحاسوبية، وتوفر وحدات المعالجة العصبية دعمًا مهمًا لتطوير صناعة التشغيل الآلي. ويعتمد التشغيل الآلي المدعوم بالذكاء الاصطناعي بدءًا من المساعدين المنزليين إلى الأدوات الجراحية المؤتمتة على وحدات المعالجة العصبية لتطوير القدرة على اكتشاف بيئاتها والتعلم منها والتفاعل معها. 

الموارد

ما مُسرِّع الذكاء الاصطناعي؟
موضوع ذو صلة
ما المقصود بالشبكات العصبية؟
موضوع ذو صلة
ما المقصود بالتعلم العميق؟
موضوع ذو صلة
ما المقصود بالحوسبة المتوازية؟
موضوع ذو صلة

اتخِذ الخطوة التالية

صُممت منصة IBM Cloud من أجل الصناعة، وتتميز بالأمان، وحرية الإنشاء، والتشغيل في أي مكان، فهي منصة سحابية للواجهة الأمامية والخلفية للتطبيقات (Full Stack)، تضم أكثر من 170 منتجًا وخدمة تغطي البيانات، والحاويات، والذكاء الاصطناعي، وإنترنت الأشياء (IOT)، وسلسلة الكتل.استخدم IBM Cloud لبناء بنية تحتية قابلة للتوسع بتكلفة أقل، ونشر التطبيقات الجديدة بسرعة، وتوسيع نطاق أعباء العمل حسب الطلب.

استكشف IBM Cloud ابدأ مجانًا