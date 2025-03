影響力のある論文「Attention is All You Need」では、リレーショナル・データベースの用語であるクエリー、キー、値を使用して、その注意メカニズムを明確に説明しました。リレーショナル・データベースは、関連データの保存と取得を簡素化するように設計されています。各データに一意の識別子(「キー」)を割り当て、各キーは対応する値に関連付けられます。NLPでは、モデルの「データベース」は、トレーニング用データセットから学習したトークンの語彙です。

論文「Attention is All You Need」の大きな影響により、以前の注意メカニズムも、遡及的にこれらの用語で説明されるようになりました。一般的に言えば、この注意の概念は、シーケンス内の各トークンの3種類のベクトル表現間の相互作用を伴います。

クエリー・ベクトルは、特定のトークンが求めている情報を表します。

キー・ベクトルは、各トークンに含まれる情報を表します。クエリーとキーのアライメントは、注意重みを計算するために使用されます。

値(または値ベクトル)は、キー・ベクトルからの注意重み付け情報を適用します。クエリーと強くアライメントされたキーからの貢献には、より大きな重み付けが行われます。クエリーに関連しないキーからの貢献には、ゼロに近い重み付けが行われます。

具体的な注意メカニズムのバリエーションは、主に、ベクトルがどのようにエンコードされるか、どのようにアライメントスコアが計算されるか、モデルに関連情報を提供するために注意の重みが適用されるかによって区別される。