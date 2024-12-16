Os LLMs geram texto prevendo a próxima palavra (ou melhor, o próximo token) de acordo com uma distribuição de probabilidade. Cada token recebe um logit (valor numérico) do LLM, e o conjunto total de tokens é normalizado em uma "distribuição de probabilidade softmax". Cada token recebe uma "função softmax", que existe entre zero e um, e a soma das probabilidades softmax dos tokens é um.

O parâmetro temperatura do LLM modifica essa distribuição. Uma temperatura mais baixa basicamente torna os tokens com a maior probabilidade de serem selecionados; uma temperatura mais alta aumenta a probabilidade de um modelo selecionar tokens menos prováveis. Isso acontece porque um valor de temperatura mais alto introduz mais variabilidade na seleção de tokens do LLM. Diferentes configurações de temperatura introduzem diferentes níveis de aleatoriedade quando um modelo de IA generativa produz texto.

A temperatura é uma funcionalidade crucial para controlar a aleatoriedade no desempenho do modelo. Ela permite que os usuários ajustem a saída do LLM para melhor atender a diferentes aplicações do mundo real de geração de texto. Mais especificamente, essa configuração de LLM permite que os usuários equilibrem coerência e criatividade ao gerar a saída para um caso de uso específico. Por exemplo, uma temperatura baixa pode ser preferível para tarefas que exigem precisão e exatidão factual, como documentação ou respostas de conversas com chatbots. O valor de temperatura mais baixo ajuda o LLM a produzir texto mais coerente e consistente e a evitar respostas irrelevantes. Por outro lado, uma alta temperatura é preferível para saídas criativas ou tarefas criativas, como redação criativa ou brainstorming de conceitos. A configuração de temperatura permite de forma eficaz que os usuários façam o ajuste fino dos LLMs e ajustem a saída de um modelo de acordo com o resultado desejado.

A temperatura é frequentemente confundida com "criatividade", mas nem sempre é esse o caso. É mais útil pensar nela como a amplitude com a qual o modelo usa o texto de seus dados de treinamento. Max Peeperkorn et al1 conduziram uma análise empírica da saída do LLM para diferentes valores de temperatura e escreveram:

"Descobrimos que a temperatura está fracamente correlacionada com a novidade e, sem surpresa, medianamente correlacionada com a incoerência, mas não há relação com a coesão ou tipicidade. No entanto, a influência da temperatura na criatividade é muito mais sutil e fraca do que o sugerido pela alegação "parâmetro criatividade"; os resultados gerais sugerem que o LLM gera saidas um pouco mais inovadoras à medida que as temperaturas aumentam.”

Um valor de temperatura alto pode fazer com que as saídas do modelo pareçam mais criativas, mas é mais correto pensar nelas como sendo menos determinadas pelos dados de treinamento.