Aqui podemos ver o valor concreto de cada palavra e o valor de sua embedding correspondente. No entanto, não podemos usar essas embeddings de palavras diretamente para interpretar a ordem das palavras. O valor calculado aqui é usado para injetar informações sobre a posição em um vetor de entrada do transformador. Como a entrada de s i n ( x ) e c o s ( x ) são diferentes, cada posição k responderá a uma função senoidal diferente. A posição correspondente da diferente função senoidal nos dá informações sobre a posição absoluta e a posição relativa da palavra em "Allen leva o cão para caminhar". Em outras palavras, essas informações podem ser usadas pelo modelo de tal forma que o modelo pode aprender a associar esses padrões à ordem, ao espaçamento e à estrutura.

Agora vamos implementar uma função em Python para visualizar a matriz posicional