Makalah penting "Attention is All You Need" menjelaskan mekanisme perhatian dengan menggunakan istilah yang diambil dari basis data relasional: pertanyaan, kunci, dan nilai. Basis data relasional dirancang untuk menyederhanakan penyimpanan dan pengambilan data dengan memberikan pengenal unik (atau “kunci”) untuk setiap data, yang mana kunci kemudian dikaitkan dengan nilai yang sesuai. Dalam konteks NLP, “basis data” sebuah model merujuk pada kosakata token yang telah dipelajari dari kumpulan data pelatihan.

Pengaruh besar dari makalah “Attention is All You Need” telah mengakibatkan mekanisme perhatian sebelumnya sering kali digambarkan secara retroaktif dalam istilah-istilah ini. Secara umum, konsepsi perhatian ini melibatkan interaksi antara tiga jenis representasi vektor untuk setiap token dalam suatu urutan.

Vektor kueri mewakili informasi yang dicari oleh token tertentu.

Vektor kunci mewakili informasi yang terkandung dalam setiap token. Penyelarasan antara kueri dan kunci digunakan untuk menghitung bobot perhatian.

Nilai (atau vektor nilai) menerapkan informasi berbobot perhatian dari vektor kunci. Kontribusi dari kunci yang sangat selaras dengan kueri akan diberi bobot lebih besar; kontribusi dari kunci yang tidak relevan dengan kueri akan diberi bobot mendekati nol.

Varian mekanisme perhatian khusus dibedakan terutama berdasarkan bagaimana vektor dikodekan, bagaimana skor penyelarasan dihitung dan bobot perhatian diterapkan untuk memberikan informasi yang relevan kepada model.