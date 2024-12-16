LLMs generieren Text, indem sie das nächste Wort (oder besser gesagt das nächste Token) gemäß einer Wahrscheinlichkeitsverteilung vorhersagen. Jedem Token wird ein Logit (numerischer Wert) aus dem LLM zugewiesen, und die Gesamtmenge der Tokens wird in eine „Softmax-Wahrscheinlichkeitsverteilung“ normalisiert. Jedem Token wird eine „Softmax-Funktion“ zugewiesen, die zwischen Null und Eins liegt, und die Summe der Softmax-Wahrscheinlichkeiten aller Token ist eins.

Der LLM-Temperaturparameter verändert diese Verteilung. Eine niedrigere Temperatur erhöht im Grunde die Wahrscheinlichkeit, dass die Token mit der höchsten Wahrscheinlichkeit ausgewählt werden. Eine höhere Temperatur erhöht die Wahrscheinlichkeit, dass ein Modell weniger wahrscheinliche Token auswählt. Dies geschieht, weil ein höherer Temperaturwert mehr Variabilität in die Token-Auswahl des LLM bringt. Verschiedene Temperatureinstellungen führen im Wesentlichen zu unterschiedlichen Zufallsgraden, wenn ein generatives KI-Modell Text ausgibt.

Die Temperatur ist eine entscheidende Funktion für die Kontrolle der Zufälligkeit in der Leistung. Sie ermöglicht Benutzern, die LLM-Ausgabe so anzupassen, dass sie besser zu verschiedenen realen Anwendungen der Textgenerierung passt. Genauer gesagt ermöglicht diese LLM-Einstellung Benutzern, Kohärenz und Kreativität bei der Erstellung von Outputs für einen bestimmten Anwendungsfall in Einklang zu bringen. Eine niedrige Temperatur könnte zum Beispiel für Aufgaben besser geeignet sein, die Präzision und sachliche Genauigkeit erfordern, wie z. B. technische Dokumentation oder dialogorientierte Antworten mit Chatbots. Der niedrigere Temperaturwert hilft dem LLM, kohärenteren und einheitlicheren Text zu erzeugen und irrelevante Antworten zu vermeiden. Im Gegensatz dazu ist eine hohe Temperatur für kreative Ausgaben oder kreative Aufgaben wie kreatives Schreiben oder Konzept-Brainstorming vorzuziehen. Die Temperatureinstellung ermöglicht es Benutzern effektiv, LLMs eine Feinabstimmung durchzuführen und die Ausgabe eines Modells an ihr eigenes gewünschtes Ergebnis anzupassen.

Temperatur wird oft mit „Kreativität“ gleichgesetzt, aber das ist nicht immer der Fall. Es ist hilfreicher, es als Denken vorzustellen, wie in großem Umfang das Modell Text aus seinen Trainingsdaten verwendet. Max Peeperkorn et al1 führte eine empirische Analyse der LLM-Ausgabe für verschiedene Temperaturwerte durch und schrieb:

„Wir stellen fest, dass die Temperatur schwach mit der Neuartigkeit und wenig überraschend mäßig mit der Inkohärenz korreliert, es besteht jedoch kein Zusammenhang mit der Kohäsion oder der Typizität.“ Der Einfluss der Temperatur auf die Kreativität ist jedoch weitaus nuancierter und schwächer, als die Angabe „Kreativitätsparameter“ nahelegt; Die Gesamtergebnisse deuten darauf hin, dass das LLM mit steigenden Temperaturen etwas neuartigere Ausgaben erzeugt.“

Ein hoher Temperaturwert kann die Ausgabe des Modells kreativer erscheinen lassen, aber es ist genauer, anzunehmen, dass sie weniger durch die Trainingsdaten bestimmt sind, wenn man daran denkt.