苹果发文质疑:大语言模型根本无法进行逻辑推理

2024年10月14日 - 澎湃新闻

逻辑推理:大语言模型的真正挑战研究人员表示,总体而言,这项研究没有发现大语言模型具备正式的逻辑推理能力,无论是开源模型,还是闭源模型。它们的行为更像是复杂的模式匹配,甚至很脆弱,以至于简单改变名字就能导致结果变化约10%。尽管可以通过增加数据量、参数规模或计算能力,或者为Phi-4、Llama-4、GPT-5提供更...

详情

中信建投 | OpenAI o1:逻辑能力显著提升,推理侧算力消耗大幅增加

2024年9月20日 - 新浪

Openo1在模型推理侧同样满足scalinglaw,即模型推理时间越久模型处理复杂问题能力愈强,通过不断的思维树检索和反复自我博弈,o1呈现出类人的逻辑思维潜力。由于推理过程的反复博弈,新架构下推理侧算力消耗将大幅增加。OpenAIo1具备深度思考能力,在复杂问题上表现出色。从ChatGPT爆火整个社交网络后,大模型行业进入如火...

详情

重磅!会“思考解题逻辑”的OpenAI推理大模型登场,认知将跃升至...

2024年9月13日 - 百家号

推理大模型的特点，就是AI会在回答之前花更多时间进行思考，就像人类思考解决问题的过程一样。以往的大模型，背后的逻辑是通过学习大量数据集中的模式，来预测单词生成的序列，严格来说并不是真正理解提问。作为o1系列模型的首批版本，OpenAI仅推出了o1-preview预览版和o1-mini迷你版，而且是分阶段向付费用户、免费用户和...

详情

姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致性

2024年9月25日 - 腾讯网

DAG由代表命题、批评、精炼和验证的节点组成,边表示它们之间的逻辑关系或依赖关系,边都有方向,不存在任何循环路径。这种无环的特性确保推理过程不受循环依赖的影响,能更真实反映合理的逻辑推导。9.11和9.8哪个大、strawberry中有几个“r”等问题在DoT的帮助下全都迎刃而解了。这项研究提出后得到了不小的关注。

详情

一句废话就把OpenAI o1干崩了?大模型的推理能力还真挺脆弱的。

2024年10月15日 - 网易

GSM-Symbolic:UnderstandingtheLimitationsofMathematicalReasoninginLargeLanguageModels(翻译过来即:理解大语言模型在数学推理的局限性)看着好像天书,别慌,其实非常简单,我都能看懂,你肯定也行。这篇论文想研究的一个核心问题是:这些模型是否真正具备逻辑推理能力?尤其是在数学推理任务中。

详情

...用数学理论确保AI逻辑一致大模型复杂推理新框架清华叉院姚期智...

2024年9月24日 - 新浪新闻

在这个框架中,命题被建模为拓扑中终端对象的子对象,逻辑关系和推理步骤表示为态射,批评和改进过程分别对应到子对象分类器的态射和命题间的态射(www.e993.com)2024年10月18日。通过引入PreNet范畴,他们还成功捕捉了推理过程的动态和并发特性。这种数学基础不仅确保了推理过程的逻辑一致性和完备性,还为设计下一代专门用于推理的AI模型提供了概念框架...

详情

OpenAI o1模型问世,五级AGI再突破!推理极限超博士,华人立功

2024年9月13日 - 腾讯新闻

01OpenAI推出了新的o1系列模型,具有强大的推理能力,尤其在复杂逻辑推理问题上。02与GPT-4相比,o1在物理、生物、化学问题的基准测试中,超过了人类博士水平。03为此,OpenAI发布了o1-mini,一种经济高效的推理模型,比o1-preview便宜80%。04然而,o1系列模型仍处在早期阶段,部分功能尚未集成,如网络插件、长传文件、...

详情

窦局长的“茅台论”,其背后的逻辑推理能自圆其说吗?

2024年6月2日 - 百家号

现在我们仍然按照局长的“茅台论”的推理分析，局长认为茅台也能喝死人，我们就按这一逻辑思维推论，得到的结果不难看出，也就是说，水中的鱼死了，那是鱼的事，与水无关，因此水无需进行毒性检测。在这里人们不禁要问：茅台酒是经过严格检测合格后才允许进入市场销售的，那么你们这种水是否也按照先检测后排放程序...

详情

实测OpenAI新模型o1 :做题王者,实战青铜

2024年9月13日 - 虎嗅网

OpenAI新模型o1擅长推理解题,但难应用于日常生活。????数学逻辑强,反应迅速??????情景推理接近真相????日常应用欠缺灵活性今天凌晨,OpenAI发布了o1系列模型,最大的特点是擅长推理。模型的能力,一代比一代强,我们的测评,一次比一次难做。测评变成一件“毕恭毕敬”的事情,生怕提不出好问题...

详情

一声炸雷,OpenAI o1模型突然上线

2024年9月13日 - 腾讯网

大VMattewSabia表示,最可怕的是,GPT-5还要比o1模型更强大69倍。而普通人,根本不理解大象的推理和逻辑能力。人类真的准备好了吗?绕晕人类的逻辑推理难题,o1解决了我们都知道,逻辑推理对于以往的LLM来说,是很难跨越的高山。但这一次,o1模型展现出的解决复杂逻辑难题的能力,让人惊讶。

详情

查看更多

逻辑推理包括什么
逻辑推理的概念
逻辑推理什么意思
逻辑推理应该是什么
逻辑推理是啥
逻辑推理入门篇
逻辑推理怎么理解
什么叫逻辑推理
逻辑推理有哪些常用技巧
逻辑推理