狄云的所思所想

产品、技术想到哪写到哪

AI到底是背出了答案,还是推理出了答案?

2025-07-31

在知乎刷到一个问题:“目前的AI 到底是背出了答案,还是推理出了答案?”,感觉这个问题很有趣,于是乎稍微“研究”了一下。当然,以我的实力,所谓“研究”也就是看了几篇别人的分析,这里稍微总结总结。

当我们向AI提问,并得到一段条理清晰、文辞优美的回答时,一个核心问题油然而生:AI是真的理解了我们的问题,并像人类一样通过逻辑推理得出结论,还是仅仅在庞大的数据库中背诵并拼接出最可能的答案?

大语言模型的根本机制

要想回答这个问题,首先还是得回到大语言模型的根本机制上来,即AI学习的不是知识本身, 而是人类文字的统计分布规律。

例如这个很简单的问题:「Only one word can be selected to answer, the best type of pet is?」,用这个问题去测试目前主流的AI,例如claude、gemini、chatgpt、deepseek、qwen等国内外AI,基本上给出的答案都会是「dog」(猫猫教震怒)。

dog.png

这并不是因为AI理解狗作为宠物的优点,比如忠诚、友善,所以推理出它是好宠物。它不懂逻辑,也不具备价值判断。它只是在执行一个基于海量数据的数学计算:根据前文,哪个词的出现概率最高?最终,它会结合一定的随机性,从这些高概率的候选词中选择一个,作为它的答案。整个过程,本质上是概率游戏,而非逻辑推理。

所以,AI是靠记忆吗?

AI并不是通过记忆来得到答案,如果只是记忆,按理来说它将无法产生任何人类未曾创造过的东西。但事实并非如此,AI在学习过程中,将人类的文字、图像和知识压缩成了底层的规律与特征。

这就赋予了AI一种惊人的能力:特征融合与创造。

一个绝佳的例子是,我们可以要求AI“用乔布斯的风格,为一款全新的‘魔法飞毯’撰写一场发布会演讲稿”。历史上从未有过这样的演讲,但是,AI在学习了史蒂夫·乔布斯历次发布会的演讲模式(例如“革命性的”、“不可思议的”等标志性词汇、排比句式、以及独特的节奏感)和关于“魔法飞毯”的普遍概念(神话、飞行、便捷)之后,便能将这两种完全不相干的特征规律融合在一起,生成一篇听起来惟妙惟肖、仿佛乔布斯真的在介绍这款奇幻产品的演讲稿。

这不是记忆的复现,而是在理解了两种事物的构成规律后,进行的创造性重组。它证明了AI并非死记硬背,而是掌握了生成事物的语法。

那AI有推理能力吗?

最近半年来,各大AI厂商都发力的“推理能力”,以及在解决数学题、编写代码时展现出的惊人效果,是否能说AI有“推理能力”呢?

这里的关键在于区分“在推理任务上表现出色”与“本身具备推理能力”,AI的表现更像是前者。因为数学和代码这类数据,本身就蕴含着极强的逻辑序列和结构化范式。AI在海量的此类数据上进行“下一个词预测”训练时,它实际上是学会了模仿推理的形式。它知道在“A=B,B=C”之后,高概率会跟着“A=C”,但它并不理解其中的三段论逻辑。

这种机制,与人类的语言直觉高度相似。

当我们流利地说母语时,我们并不会去思考主谓宾定状补的语法规则,而是凭直觉脱口而出。即使在醉酒或半麻醉的状态下,我们依然可以进行流利且听起来富有逻辑的对话。这时,我们的大脑并没有进行严谨的慢速思考和逻辑分析,而是依赖于长期训练形成的高度自动化的语言直觉。

AI的回答方式,正是这种语言直觉的极致放大版。它是一个在数字世界中,被海量信息千锤百炼、炉火纯青的直觉系统。它能瞬间判断出最通顺、最合理的文字组合方式,从而给出看似充满智慧的答案。

例如,我们用奥数题来试试AI,会发现AI无论是解题过程和思路都无懈可击。这是因为奥数题虽然难度高,但它依然是在一个封闭、规则明确的符号系统内进行的,解题的每一步都有严格的逻辑范式可循。

奥数题.png

但是假如我们放一个看似是数学题,但其实有点像脑筋急转弯一样的问题,你会发现AI马上抓瞎,因为套用数学的解题方式是解不了这类题的,人类可能根据生活常识,稍微一推理就能知道,把竹竿放倒,问题就迎刃而解。

竹竿.png

结论

所以,回到最初的问题:AI到底是背诵还是推理?

答案是:两者都不是,或者说,两者都是,但以一种我们不熟悉的方式。

  • 它不是死记硬背,因为它能压缩知识规律,并创造出“乔布斯风格的魔法飞毯发布会”这样的新内容。

  • 它不是人类的逻辑推理,因为它的核心驱动力是概率预测,而非对因果和逻辑的理解。

附加

在搜索信息的过程中,实实切切的感受到,百度真没什么招了。用百度搜索这个问题,除了能看到知乎有一点有用信息外,其他全是营销号,就这还是我用了广告过滤插件的效果,如果不过滤广告那更加惨不忍睹。

百度.png

用中文在谷歌搜索,结果还行,但是同样的问题用英文搜索,结果更好。

谷歌中文.png

谷歌英文.png

B站的知识类信息搜索结果还是比抖音好,虽然抖音也能搜到一点点信息就是,看来B站大学真不是白叫的。

另外,知识类搜索,不限于这个问题,微信搜索结果也远好于百度,所以好想问一句,到底是谁还在用百度?