الانتباه الذاتي هو نوع من آليات الانتباه المستخدمة في نماذج التعلم الآلي. تُستخدم هذه الآلية لتقييم أهمية الرموز المميزة أو الكلمات في تسلسل المدخلات لفهم العلاقات بينها على نحو أفضل. إنه جزء مهم من نماذج المحولات، وهي بنية ذكاء اصطناعي فائقة الإمكانات ضرورية لمهام معالجة اللغة الطبيعية (NLP. بنية المحولات هي الأساس لمعظم النماذج اللغوية الكبيرة (LLMs) الحديثة.

طرحت آلية الانتباه الذاتي عن طريق نموذج المحول، بنية الشبكات العصبية التي اقترحها الباحثون. الهدف من البنية المقترحة هو مواجهة تحديات نماذج التعلم الآلي التقليدية التي تستخدم الشبكات العصبية التلافيفية (CNNs) والشبكات العصبية المتكررة (RNNs).1

تتبع النماذج المتسلسلة التقليدية بنية وحدة فك التشفير نفسها مثل نماذج المحولات ولكنها تعالج البيانات خطوة بخطوة أو من التسلسل إلى التسلسل (seq2seq). تشكل هذه الوظيفة تحديًا للمعالجة المتوازية، وهي القدرة على تقليل وقت الحوسبة وتحسين توليد المخرجات من خلال حساب أوزان الانتباه عبر جميع أجزاء تسلسل المدخلات في وقت واحد.



أدى الانتباه الذاتي دورًا رئيسيًا في النهوض بالنماذج اللغوية الكبيرة من خلال تمكين التوازي داخل أمثلة التدريب. هذه الطريقة مفيدة لأنه كلما زاد طول التسلسل، زادت قيود الذاكرة التي تحد من التجميع عبر أمثلة التدريب. باستخدام الانتباه الذاتي، يمكن تقسيم بيانات تدريب النموذج اللغوي الكبير إلى دفعات ومعالجتها بالتوازي على وحدات معالجة رسومات متعددة.1 يقلل الانتباه الذاتي من قوة الحوسبة اللازمة لتدريب نماذج التعلم الآلي من خلال معالجة التجميع الفعال بالتوازي.

لا يُسهم الانتباه الذاتي في توزيع الحمل الحوسبي بكفاءة فحسب، بل يتيح القدرة على معالجة أوزان الانتباه في وقت واحد كذلك. تسمح هذه القدرة للنموذج بالتركيز على الأجزاء ذات الصلة من تسلسل المدخلات للتنبؤ ديناميكيًا بأهمية كل عنصر داخل التسلسل. الانتباه الذاتي مفيد لمهام معالجة اللغة الطبيعية مثل الترجمة الآلية وتحليل المشاعر والتلخيص.