清华校友用AI破解162个高数定理,智能体LeanAgent攻克困扰陶哲轩...
实验结果发现,LeanAgent从来自23个不同Lean代码库中,成功证明162个此前未被人类证明的数学定理。相较于基于Lean数据微调大模型,LeanAgent性能直接飙升11倍。而且,综合终身学习能力近94%。其中,有许多是高等数学定理,比如具有挑战性的抽象代数、代数拓扑。它还展现出了从基本概念到高级主题清晰的学习过程。同时,L...
陶哲轩:AI时代,数学研究将进入前所未有的规模
这与数学竞赛不同,不是设定三个小时什么的来解决一个问题,而是需要几个月甚至更长时间,有时解决不了问题,那就必须改变问题。这绝对不同于数学竞赛,尽管在技能上有些重叠。这一切都非常令人兴奋,它正在开始具有变革性。但另一方面,也有一种连续性的感觉,我们实际上已经使用计算机和机器来做数学运算很长时间了,而...
MLP一夜被干掉!MIT加州理工等革命性KAN破记录,发现数学定理碾压...
根据柯尔莫哥洛夫-阿诺德定理,原始的KAN层由内部函数和外部函数组成,分别对应于不同的输入和输出维度,这种堆叠KAN层的设计方法不仅扩展了KANs的深度,而且保持了网络的可解释性和表达能力,其中每个层都是由单变量函数组成的,可以对函数进行单独学习和理解。下式中的f就等价于KAN实现细节虽然KAN的设计理念看起来简单...
是什么让他成为现代计算机之父?丨纪念冯·诺伊曼诞辰120周年(下)
也就是说,在数学上是“非齐次的”,除了要计算的物理现象的主要过程之外,还涉及许多外部扰动,其影响在附加变量中不能被忽视甚至不能被分离。这种情况经常出现在当今的技术问题中,迫使人们至少在最初阶段采用数值方法,这样做并不是因为人们需要高精度的结果,而只是为了实现定性分析!那时冯·诺伊曼对数值分析的兴趣大大...
据说这位菲尔兹奖得主的定理证明论文在数学史上篇幅最长
有时虽然以为自己的理论是得到证明的“定理”,但经过仔细检查后却发现其中存在漏洞,结果问题还是没有得到解决。这种例子在数学界中层出不穷。扎里斯基教授是担心发生这种情况才这么问我的。我充满自信地答道:“还是定理。”虽然存在几处必须改进的地方,但是我坚信我的思路没有问题。
缅怀周光召:25年前,一篇洞见未来的主旨报告
——最早完成人工合成牛胰岛素(www.e993.com)2024年10月17日。在数论、数值计算方法、数学定理证明、理论物理、凝聚态和准晶、高能物理、高分子化学、太阳磁场、杂交育种、古生物学、地质和生物调查、资源勘探和环境保护、断手再植、临床医学等方面都有杰出的工作。尽管经过了多代人的努力,有上述这些成绩,但是,近现代以来完全领先、开时代之先河的开...
周光召25年前的这个主旨报告,洞见未来
——最早完成人工合成牛胰岛素。在数论、数值计算方法、数学定理证明、理论物理、凝聚态和准晶、高能物理、高分子化学、太阳磁场、杂交育种、古生物学、地质和生物调查、资源勘探和环境保护、断手再植、临床医学等方面都有杰出的工作。尽管经过了多代人的努力,有上述这些成绩,但是,近现代以来完全领先、开时代之先河的开...
AI与机器人的42个终极问题,机器人能否产生意识?
6、我们能否真正解释和理解AI的决策与结果?目前我们还不能真正理解很多AI技术决策和得到结果的具体过程,它们也常常表现出设计者意料之外的行为。比如OpenAI训练的一个赛船游戏智能体学会了一个“技巧”:为了得到更高的分数,智能体控制的小船没有选择尽快穿过终点线,而是不断地循环刷分,即使小船不停地与其它船...
GPT家族又壮大了!OpenAI首次推出数学定理推理模型GPT-f,23个推导...
随着在样本数据上迭代次数的增加,模型性能也在不断增加,如下图,160m和700m(Webmath)参数模型在迭代学习值函数数据生成和重新训练过程中的性能表现:另外,需要说明的是,研究人员向Metamath数学库提供了23个定理的简化证明,这些证明全部是由GPT-f自动验证器生成的。为了发现更简短的证明方式,研究人员从set.mm库中采...
令多位数学家着迷的费马大定理到底是什么?
如果问数学界近几十年最重要的成果是什么,那依我看,非费马大定理获证不可。在费马提出这个问题三百多年后的1994年,来自英国的数学家安德鲁·怀尔斯(AndrewWiles)一锤定音,最终彻底解决了该问题。能见证这样的盛事,可谓我辈之幸。业余数学之王—费马