影響力のある論文「Attention is All You Need」では、リレーショナル・データベースの用語であるクエリー、キー、値を使用して、その注意メカニズムを明確に説明しました。リレーショナル・データベースは、関連データの保存と取得を簡素化するように設計されています。各データに一意の識別子(「キー」)を割り当て、各キーは対応する値に関連付けられます。リレーショナル・データベースの目的は、各クエリーを適切なキーと一致させることです。

シーケンス内の各トークンに対して、マルチヘッド注意法では3つのベクトルを作成する必要があります。

トークンが「求めている」情報を表すクエリー・ベクトル、Q。例えば、名詞のクエリーベクトルは、それを記述する形容詞の検索を表す場合があります。

トークンに含まれる情報を表すキー・ベクトル、K。各トークンのキー・ベクトルと他の各トークンのクエリー・ベクトルとの関連性を表すアライメント・スコアは、注目度の重みを計算するために使用されます。

他のトークンのキーベクトルからの注目度重み付けされた寄与によって更新されるコンテキスト情報を表す値ベクトル、V。

注意メカニズムによって媒介されるこれら3つのベクトル間の数学的相互作用は、モデルが各トークンのコンテキスト固有の理解を調整する方法です。