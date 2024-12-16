Los LLM generan texto prediciendo la siguiente palabra (o más bien, el siguiente token) de acuerdo con una distribución de probabilidad. A cada token se le asigna un logit (valor numérico) del LLM y el conjunto total de tokens se normaliza en una "distribución de probabilidad softmax". A cada token se le asigna una función softmax que existe entre cero y uno, y la suma de las probabilidades softmax de todos los tokens es uno.

El parámetro de temperatura de LLM modifica esta distribución. Una temperatura más baja esencialmente hace que esos tokens con la mayor probabilidad sean más propensos a ser seleccionados; una temperatura más alta aumenta la probabilidad de que un modelo seleccione tokens menos probables. Esto sucede porque un valor de temperatura más alto introduce más variabilidad en la selección de token del LLM. Las diferentes configuraciones de temperatura introducen esencialmente diferentes niveles de aleatoriedad cuando un modelo de IA generativa produce texto.

La temperatura es una característica crucial para controlar la aleatoriedad en el rendimiento del modelo. Permite a los usuarios ajustar la salida del LLM para que se adapte mejor a las diferentes aplicaciones reales de generación de texto. Más específicamente, esta configuración de LLM permite a los usuarios equilibrar la coherencia y la creatividad al generar resultados para un caso de uso específico. Por ejemplo, una temperatura baja podría ser preferible para tareas que requieren precisión y exactitud objetiva, como documentación técnica o respuestas conversacionales con chatbots. El valor de temperatura más bajo ayuda al LLM a producir un texto más coherente y consistente y a evitar respuestas irrelevantes. Por el contrario, una temperatura alta es preferible para resultados o tareas creativos, como la escritura creativa o la lluvia de ideas de conceptos. La configuración de temperatura permite a los usuarios ajustar los LLM y ajustar la salida de un modelo a su propio resultado deseado.

La temperatura a menudo se confunde con "creatividad", pero no siempre es así. Es más útil pensar en ello como la amplitud con la que el modelo utiliza el texto de sus datos de entrenamiento. Max Peeperkorn et al1 realizaron un análisis empírico de la salida del LLM para diferentes valores de temperatura y escribieron:

“Encontramos que la temperatura está débilmente correlacionada con la novedad y, como era de esperar, moderadamente correlacionada con la incoherencia, pero no hay relación ni con la cohesión ni con la tipicidad. Sin embargo, la influencia de la temperatura en la creatividad es mucho más matizada y débil de lo que sugiere la afirmación del "parámetro de creatividad"; los resultados generales sugieren que el LLM genera resultados ligeramente más novedosos a medida que las temperaturas aumentan”.

Un valor de temperatura alto puede hacer que los resultados del modelo parezcan más creativos, pero es más preciso pensar que están menos determinados por los datos de entrenamiento.