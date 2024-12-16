LLM 通过根据概率分布预测下一个字词（或者更确切地说，下一个词元）来生成文本。每个词元都被分配一个来自 LLM 的 logit（数值），并且总词元集被规范化为“softmax 概率分布”。每个词元都被分配了一个介于 0 和 1 之间的“softmax 函数”，所有词元的 softmax 概率之和为 1。

LLM 温度参数改变了这一分布。温度越低，那些概率最高的词元就越有可能被选中；温度越高，模型选中概率较低词元的可能性就越大。这是因为较高的温度值会给 LLM 的词元选择带来更大的可变性。不同的温度设置本质上会在生成式 AI 模型输出文本时引入不同程度的随机性。

温度是控制模型性能随机性的关键因素。它允许用户调整 LLM 输出以更好地适应不同的现实世界文本生成应用程序。更具体地说，此 LLM 设置允许用户在为特定用例生成输出时平衡连贯性和创造性。例如，对于需要精确度和事实准确性的任务，例如技术文档或与聊天机器人的对话回复，低温可能更为合适。较低的温度值有助于 LLM 生成更加连贯和一致的文本，并避免不相关的响应。相比之下，高温更适合创意输出或创意任务，例如创意写作或概念头脑风暴。用户可以利用温度设置，有效地对 LLM 进行微调，并根据自己想要的结果调整模型的输出。

温度经常与“创造力”混为一谈，但情况并非总是如此。更恰当的理解是，该模型在多大程度上利用了训练数据中的文本。Max Peeperkorn 等人1 对不同温度值下的 LLM 输出进行了实证分析，并写道：

“我们发现温度与新颖性呈弱相关，不出所料，与不连贯性呈中等相关，但与内聚性或典型性均无关系。然而，温度对创造性的影响远比“创造性参数”的说法所暗示的要微妙和微弱得多。总体结果表明，随着温度升高，LLM 产生的新颖输出略有增加。

较高的温度值可能会使模型的输出看起来更具创造性，但更准确的说法是，它们受训练数据的影响较小。