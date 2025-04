قدم البحث الرائد "Attention is All You Need"، الذي ألفه Vaswani وزملاؤه، مفهوم الانتباه الذاتي كأساس لتقديم بنية شبكة عصبية جديدة: المحول. اعتمد نموذج المحول بالكامل على آليات الانتباه، متخليًا عن التلافيف العصبية (CNNs) والتكرار المستخدم في الشبكات العصبية المتكررة (RNNs)، واستبدلهما بطبقات الانتباه فقط وطبقات أمامية خطية قياسية.

اعتمد النموذج الذي قدمه مؤلفو البحث "Attention is All You Need" على بنية التشفير-فك التشفير، على غرار النماذج السابقة القائمة على الشبكات العصبية المتكررة. لاحقًا، تخلت النماذج القائمة على المحول عن إطار التشفير-فك التشفير. كان أحد أول النماذج البارزة التي تم إصدارها بعد ورقة المحولات هو نموذج BERT (اختصارًا لـ Bidirectional Encoder Representations from Transformers)، والذي يعتمد فقط على المشفر. أما النماذج اللغوية الكبيرة القائمة على الانحدار الذاتي، والتي أحدثت ثورة في توليد النصوص، مثل نماذج GPT (Generative Pretrained Transformer)، فهي تعتمد فقط على فك التشفير.

قدم بحث "Attention Is All You Need" عدة ابتكارات في آلية الانتباه، كان من أبرزها الانتباه بالضرب النقطي المقيَّس، وذلك بهدف تحسين الأداء وتكييف آلية الانتباه مع بنية نموذج جديدة بالكامل.