Os pesos são valores numéricos que representam a importância que o LLM atribui a uma entrada específica. Nem todas as entradas são tratadas igualmente pelo modelo de inteligência artificial (IA) ao gerar respostas. Quanto maior o peso de uma entrada, mais relevante ela é para a saída do modelo.

As definições de parâmetros treináveis, como pesos, são configuradas pelo algoritmo de aprendizado de um modelo durante o processo de treinamento. O algoritmo de aprendizado mede o desempenho do modelo de aprendizado de máquina (ML) com uma função de perda , que tenta minimizar o erro por meio da otimização dos parâmetros do modelo .

Dentro das redes neurais, os pesos são multiplicadores que determinam a intensidade do sinal de uma camada de neurônio para a próxima. Os sinais devem atingir o limite de força da função de ativação para avançar pela rede. Dessa forma, os pesos afetam diretamente como uma rede propaga os dados através de suas camadas.