编码器

编码是指将词元映射到虚拟三维向量空间的过程。在三维空间中就近编码的词元被视为在意义上更为相似。输入序列的这种数学向量化称为嵌入。

转换器网络中的编码器模块为每个嵌入分配一个权重,用于决定它的相对重要性。同时,位置编码器捕获语义,使 GPT 模型能够区分单词相同但单词顺序不同的分组,例如,“The egg came before the chicken”与“The chicken came before the egg”。