LLM为啥总是被数学题难倒?AI算术推理竟是靠“蒙”的!
这意味着,LLM从一开始就依赖于这种“拼凑”式的推理方法,而不是在后期才发展出这种策略。那么,这种“奇葩”的算术推理方法会导致什么问题呢?研究人员发现,“启发式大杂烩”策略的泛化能力有限,容易出现错误。这是因为LLM所掌握的“小聪明”数量有限,而且这些“小聪明”本身也可能存在缺陷,导致它们在遇到新的...
大语言模型会推理吗?
文章的结论是大语言模型既不理解这些问题中的数学概念,也不能进行逻辑推理,而仅仅是将面对的问题和训练数据中的问题相比较而已。因此,即使那些正确答案也仅仅体现了系统的记忆和匹配能力,而非其逻辑推理能力。我在去年评论ChatGPT时[3]就说过它不会逻辑推理,理由是其结论质量取决于相关训练数据的多寡,所以说只能算是...
若将“数列求和”可视化,那么小学生也搞得明白公式啦
还有我们经常见的,也是考试重点的等比数列。这样可视化之后,连小学生也能明白到底是怎么回事了。当然小学生不会有高考那么难的题目。不过,小学生也是会有压轴题的。还有奥数题目。通常这种题目都会让小学生试着找数列的规律,写出下一项。还会让小学生求数列的和。一般是自然数列和、奇数和、偶数和。自然...
数学家回应“用不上的数学为什么还要学” 多位数学老师“跟帖”
尽管数学难题在日常生活中可能不直接应用,但它们对于学生思维品质、解决问题能力的培养,让学生感受数学独有的美感,对科学的发展、国家的安全等都有着不可替代的作用。北京十二中附属实验小学数学教师史秀利从小学生阶段特点的角度出发,发表了自己的观点。她认为,不断探索和求解绝大多数在生活中看似用不上的数学难题...
Sam Altman:明年OpenAI将迈入AI系统时代
11月4日,OpenAICEOSamAltman(以下称“Altman”)在“TheTwentyMinuteVC”播客中回答了这些问题,他明确表示,提升推理能力一直是OpenAI的核心战略。当播客主持人、21VC创始人HarryStebbings(以下称“Stebbings”)问到OpenAI还能给AI创业者留下哪些机会时,Altman认为,AI创业如果还要执着于解决模型不足的问题,那...
为什么小学生会的题,而丘成桐不会?
脑筋急转弯通常被视为一种非正式的思维训练,通过意想不到的方式挑战我们的认知定式(www.e993.com)2024年11月22日。这类问题往往不要求严谨的逻辑推理或数学运算,而是考察我们的直觉、灵活性以及对常识的打破。然而,若从广义上理解数学——不仅仅是数字和方程的操控,而是包括模式识别、逻辑推理和抽象思维在内的一整套方法论——那么脑筋急转弯完全...
用了2年才帮儿子重拾自信, 我想说:奥数真没必要太早学!
如果重新来一次,我大概还是不会选择一年级甚至更早让小胖开始刷题式课程学习,但是,我可能:1.会从低年级开始,每天让他坚持做五分钟计算,做1-3道奥精上的例题。2.会在一开始找一个难度匹配的班,而不是望子成龙,去尝试那些只会打击自信心的难度和进度。
我用ChatGPT做了一下姜萍的数学竞赛题,它懵了,我也懵了。
不过,这种东西,离我们普通人,肯定还是有非常远的距离,但是我们也有属于自己的小期待。比如,GPT-5。之前SamAltman就放出话来,GPT-5会在高级推理功能上实现重大突破。我很相信OpenAI,至少不会在GPT这个最核心的模型上,跟我们打嘴炮。纵使现在的AI仍然需要成长,但是,攀登者从来不畏成长。
证明三角形内角和:还真得初中生来,小学生的方式不叫证明
不存在反例。所以,在数学证明题中你可以用反证法。比如:推翻一个结论,只要一个例外就可以了。因此:数学允许发生的事,一定会发生。数学是宇宙的真理。五、方法回到开篇小学生拼拼接接是发现那严格的数学证明该如何做?方法有很多。其中一个是很多初中生都应该会的:借助平行线。
分不清9.11和9.9大小,暴露大模型逻辑推理能力短板|快评
数学相关的逻辑推理能力一直是当下大模型的短板。但一道小学生级别的数学题,却成了各家标榜成为“生产力升级”的大模型面前的绊脚石,这在公众舆论之中引发了不小争议。究其原因,是近期公众对于“大模型无所不能”的传统认知与大模型当下仍处在测试探索期的现实之间产生了冲突。实际上种种迹象显示,大模型当前在纯...