在大语言模型中，temperature到底是什么？

2025-08-25

做过 LLM Api 对接或者用过 chatbot 类产品的应该都知道，在设置大语言模型参数的地方，往往都有一个参数叫 temperature，中文名叫温度。

但是温度到底是什么呢？

以往只是简单了解过这个参数，大概知道温度越低 AI 回复越稳定，温度越高 AI 想象力越丰富。知道这个之后，一般也就设置个中间值就没怎么管过了。

但是最近读了一本书，叫做 《这就是ChatGPT》 ，整本书看的云里雾里，过了几天啥也没记住，反而对开篇提到的这个 temperature 越发印象深刻，干脆今天好好玩玩 temperature。

先来看看 deepseek 官方文档中对 temperature 的解释：

基本上就是这么个印象，只能说之前「好用AI，不求甚解」，也不明白为什么设置成这几个数就能达到文档说的效果。

《这就是ChatGPT》 这本书中对 temperature 有很好的解释：

“温度”参数是用来确定低排名词的使用频率。

什么意思呢？还是以上篇文章的经典问句举例：

Only one word can be selected to answer， the best type of pet is?

在 cherry studio 中，我们来做个实验：

回到上篇文章所说过的，大语言模型的根本机制就是分析了人类文字的统计分布规律，它只是在执行一个基于海量数据的数学计算：根据前文，哪个词的出现概率最高？

最终，它会结合一定的随机性，从这些高概率的候选词中选择一个，作为它的答案。

这个随机性的控制参数，就叫做 temperature。

知道了这个原理其实还不够，因为这里会有个疑问：为什么我每次选择概率最高的词（也就是 temperature 为 0），最终得到的不会是最佳答案呢？

这个问题书里面也有“解释”，就是研究人员发现，如果每次都选择最高概率的词，最终得到的往往是一篇很平淡的文章，整篇文章没有显示出任何创造力，但是如果提高 temperature，反而能得到一篇效果不错的文章。

所以说，全部选择最优解往往不一定就是最优解。

至于为什么？作者回答：

也许有一天科学能够解释。

现在回过头来看 deepseek 官方文档中给的建议：

但是相信如果你明白了 temperature 代表什么，那你就应该知道，temperature 并没有放之四海而皆准的标准，最佳温度完全取决于你的具体任务和个人偏好。

记住一个简单的原则：

狄云的所思所想