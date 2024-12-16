Los LLM generan texto prediciendo la siguiente palabra (o más bien, el siguiente token) de acuerdo con una distribución de probabilidad. A cada token se le asigna un logit (valor numérico) del LLM y el conjunto total de tokens se normaliza en una "distribución de probabilidad softmax". A cada token se le asigna una "función softmax" que existe entre cero y uno, y la suma de las probabilidades softmax de todos los tokens es uno.

El parámetro de temperatura de LLM modifica esta distribución. Una temperatura más baja hace que los tokens con mayor probabilidad sean más propensos a ser seleccionados; una temperatura más alta aumenta la probabilidad de que el modelo seleccione tokens menos probables. Esto sucede porque un valor de temperatura más alto introduce más variabilidad en la selección de token del LLM. Los diferentes ajustes de temperatura introducen esencialmente diferentes niveles de aleatoriedad cuando un modelo de IA generativa genera texto.

La temperatura es una característica crucial para controlar la aleatoriedad en el rendimiento del modelo. Permite a los usuarios ajustar el resultado de LLM para que se adapte mejor a las diferentes aplicaciones del mundo real de generación de texto. Más específicamente, esta configuración de LLM permite a los usuarios equilibrar la coherencia y la creatividad al generar output para un caso de uso específico. Por ejemplo, una temperatura baja puede ser preferible para tareas que requieren precisión y exactitud fáctica, como la documentación técnica o las respuestas conversacionales con chatbots. El valor de temperatura más bajo ayuda al LLM a producir un texto más coherente y consistente y a evitar respuestas irrelevantes. Por el contrario, una temperatura alta es preferible para los resultados creativos o las tareas creativas, como la escritura creativa o la lluvia de ideas sobre conceptos. El ajuste de temperatura permite a los usuarios afinar los LLM y afinar el resultado de un modelo a su propio resultado deseado.

La temperatura suele confundirse con la "creatividad", pero no siempre es así. Es más útil pensar en ello como la amplitud con la que el modelo utiliza el texto de sus datos de entrenamiento. Max Peeperkorn et al1 realizó un análisis empírico del resultado de LLM para diferentes valores de temperatura y escribió:

"Descubrimos que la temperatura está débilmente correlacionada con la novedad y, como era de esperar, moderadamente correlacionada con la incoherencia, pero no hay relación ni con la cohesión ni con la tipicidad. Sin embargo, la influencia de la temperatura en la creatividad es mucho más matizada y débil de lo que sugiere la afirmación del "parámetro de creatividad"; los Resultados generales sugieren que el LLM genera outputs ligeramente más novedosos a medida que las temperaturas aumentan".

Un valor de temperatura alto puede hacer que los resultados del modelo parezcan más creativos, pero es más exacto pensar que están menos determinados por los datos de entrenamiento.