当AI遇上高考数学题,4个大模型“考生”“成绩单”出炉
我们选取了4名有代表性的大模型“考生”,分别是九章大模型、星火大模型(v3.5版本)、文心一言(3.5版)、智谱清言(GLM-4),选取2024全国高考数学新课标1卷客观题部分进行测评。大模型的数学能力究竟如何?其在数学学科教育场景中能够发挥多大价值?结果值得期待。━━━四位“考生”表现参差不齐此次测评选...
AI大模型能答对几道高考数学题?
Baichuan4和豆包大模型分别在新I卷和新II卷客观题测试中得分排名第一但在另一场测试中排名相对靠后图源:复旦大学NLP实验室根据两次评测结果该团队发现大部分测试大模型在简单题(如选择题前三道)有较好的准确率而在中档题中表现一般对于较难的题目大模型们的准确率会更低少部分题目甚至出现...
大火的大模型高考数学能考多少?让GPT-4o和MathGPT试试!
三、选择题,九章大模型、GPT-4o互有胜负2024年高考全国甲卷数学题共12道选择题,九章大模型和GPT-4o都是有7道正确,但做对的题目不完全相同,互有胜负。具体来看几道题:第2题,九章大模型做对,GPT-4o做错:原题:九章大模型解答:GPT-4o解答:第9题,九章大模型做对,GPT-4o认为没有正确答案:原...
让AI做高考数学题,结果竟然...
测试题就是新鲜出炉的2024年新高考1卷的数学题而且还是单选题的第一题一般称为“送分题”我们来看看AI怎么回答吧首先是通义向AI提问后,题目由图片的方式上传成功但AI回答的却是错的然后是文心一言它不需要提问即可解析图片但不是回答问题而是用了“说图解画”的功能随后继续向它发问,让它求解...
9款大模型做这道高考数学题:8家都翻车了 只有ChatGPT一次做对
网上名师给出的该题答案为B。这题,豆包、百小应、ChatGPT首次解答给出了正确答案,文心一言在第二次解答时给出了正确答案。注,因为360智脑、万知PC端产品不支持上传图片的功能,第二道题的测试不含这2款产品。小结:此次2道高考数学题的测试效果总结如下:...
今年高考数学试卷大变革:题量减少,思考时间更充裕
这改革,依托了高考评价体系,对试卷结构进行了创新设计(www.e993.com)2024年11月7日。题量一减,解答题的总分值就增加了,多选题的赋分方式也优化了。这样一来,试卷就更能强化对学生思维过程和思维能力的考查了。学生们不用再担心做题时间不够,可以更加专注、深入地思考每一道题。这不,思维能力强的学生就能更好地展示自己的素养和潜力了。
名师点评河南高考数学丨郑州外国语学校王珂:试卷结构创新 多选题...
王柯,郑州外国语学校高三数学备课组长点评2024年高考河南省使用的是新课标I卷,对数学评析如下:一、试卷进行了多方面的创新(一)试卷结构创新试卷由原来的22道题缩减为19道,多选题、填空题、解答题分别减少1道。随着试题数量的变化,试题的分值也相应变化,跟今年1月19日进行的2024年高考综合改革适应性测试...
2024年高考数学全国卷试题评析来了
2024年高考数学全国卷试题持续深化考试内容改革,考主干、考能力、考素养,重思维、重创新、重应用,突出考查思维过程、思维方法和创新能力。新课标卷创设全新的试卷结构,减少题量,给学生充足的思考时间,加强思维考查,强化素养导向,给不同水平的学生提供充分展现才华的空间,服务拔尖创新人才选拔,助推素质教育发展,助力教育强...
12个国产大模型大战高考数学,意外炸出个大bug
国产大模型vs数学大题鉴于一些国产大模型AI识图有点困难,我们这次直接先把这次高考的大题题目文字给copy出来,再让它们作答:设n为正整数,数列(a1,a_2,\cdots,a{4m+2})是公差不为0的等差数列。若从中抽去项(ai)和(a_j)(i<j)后剩余的(4m)项可被平均分为m...
高考数学结束 考生:梯度区分明显 计算量大
另一名卢同学表示,高考数学比学校的模拟考要难不少。“和早上的语文相比,数学还是有点难。我早上有点‘轻敌’了。”此外,还有学生表示,今年数学题的梯度区分很明显。“前17题是一个难度系数,后面的18、19题完全是另一个高层级的难度。”周同学表示,立体几何题很难建系,他考后简单复盘时发现有错一些不该错的...