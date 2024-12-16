Les LLM génèrent du texte en prédisant le mot suivant (ou plutôt, le token suivant) selon une distribution de probabilité. Chaque token se voit attribuer un logit (valeur numérique) du LLM et l’ensemble des tokens est normalisé dans une « distribution de probabilité softmax ». Chaque token se voit attribuer une « fonction softmax » comprise entre zéro et un, et la somme des probabilités softmax de tous les tokens est un.

Le paramètre de température LLM modifie cette distribution. Une température plus basse rend essentiellement les tokens ayant la probabilité la plus élevée plus susceptibles d’être sélectionnés ; une température plus élevée augmente la probabilité qu’un modèle sélectionne des tokens moins probables. En effet, une température plus élevée entraîne une plus grande variabilité dans la sélection des jetons par le LLM. Différents paramètres de température introduisent essentiellement différents niveaux d’aléatoire lorsqu’un modèle d’IA générative produit du texte.

La température est une fonctionnalité cruciale pour contrôler le caractère aléatoire des performances du modèle. Elle permet aux utilisateurs d’ajuster la sortie du LLM pour mieux s’adapter à différentes applications de génération de texte dans le monde réel. Plus précisément, ce paramètre du LLM leur permet de trouver un équilibre entre cohérence et créativité lors de la génération de sorties pour un cas d’utilisation spécifique. Par exemple, une température basse peut être préférable pour les tâches exigeant précision et exactitude factuelle, comme la documentation ou les réponses conversationnelles avec des chatbots. La valeur de température plus faible aide le LLM à produire un texte plus cohérent et à éviter les réponses non pertinentes. En revanche, une température élevée est préférable pour les sorties ou les tâches créatives telles que la rédaction de contenu créatif ou le brainstorming. Le paramètre de température permet aux utilisateurs d’affiner les LLM de façon efficace et d’ajuster la sortie d’un modèle en fonction du résultat souhaité.

On confond souvent la température avec la « créativité », mais ce n’est pas toujours le cas. Il est plus utile d’envisager cela comme l’étendue large du modèle qui utilise le texte de ses données d’entraînement. Max Peeperkorn et al1 ont mené une analyse empirique de la sortie du LLM pour différentes valeurs de température et ont conclu ce qui suit :

« Nous constatons que la température est faiblement corrélée à la nouveauté, et sans surprise, moyennement corrélée à l’incohérence, mais qu’’il n’y a aucune relation ni avec la cohésion, ni avec la singularité. Cependant, l’influence de la température sur la créativité est bien plus nuancée et faible que ne le suggère l’affirmation selon laquelle il existe un « paramètre de créativité ». Les résultats globaux indiquent que le LLM génère des sorties légèrement plus originales lorsque la température augmente. »

Une valeur de température élevée peut rendre les productions du modèle plus créatives, mais il est plus juste de penser qu’elles sont moins déterminées par les données d’entraînement.