复旦测评13家大模型高考数学成绩,字节豆包II卷超GPT-4o夺冠
近日,复旦大学自然语言处理(NLP)实验室LLMEVAL团队公布了2024年高考数学大模型评测结果。数据显示,字节豆包在2024高考数学新Ⅱ卷客观题正确率达到74.66%,在13家大模型中排名首位,阿里千问和GPT-4o分列二、三位,而在高考数学新Ⅰ卷评测排名中,字节豆包也排在前列。据悉,LLMEval是由复旦大学NLP实验室推出的大模型评...
“AI考生”高考成绩公布,国产大模型总分、数学分数超过GPT-4o
上海人工智能实验室今天公布了多名“AI考生”参加今年中国高考的成绩,阿里Qwen2-72B、GPT-4o和“书生·浦语”2.0文曲星(InternLM2-20B-WQX)成为三甲,得分率均超过70%。大部分“AI考生”在语文、英语科目上表现良好,但数学成绩不如人意。其中,“书生·浦语”2.0文曲星获得了数学最高分,超越包括GPT-4o在内的...
大火的大模型高考数学能考多少?让GPT-4o和MathGPT试试!
九章大模型总分=7*5分+2*5分=45分(满分90分)GPT-4o选择题12题,正确7题。填空题4题,正确1题。GPT-4o总分=7*5分+1*5分=40分(满分90分)九章大模型作为以数学领域的解题和讲题算法为核心的大模型,在高考数学题目上更胜一筹,比GPT-4o得分更高。同时...
高考数学,AI大模型被难倒,几乎全军覆没,GPT-4o仅得41 分
具体而言,在满分73分、及格线为43.8分(60%)的情况下,六家大模型产品的分数结果分别为:GLM-4-0520(63分)>智谱清言(43分)>GPT-4o(41分)>豆包(40分)>文心4(30分)=百川4(30分)>通义千问2.5(29分)。多说一句,每年的第8道单选题往往是高考数学...
复旦测评13家大模型高考数学成绩:GPT-4o被国内AI大模型超越!
近日,复旦大学自然语言处理(NLP)实验室LLMEVAL团队做了一个极具创意和挑战性的尝试,开创性地用高考数学题来评测大模型!根据公开的2024年高考数学大模型评测结果,阿里千问和讯飞星火分别获得了2024高考数学新I卷的第一名和第二名,以及高考数学新II卷的第二名和第一名,两份考卷的评测中,而GPT-4o均...
“韦神,高考数学题是不是你出的?”多地考生觉得难度比想象中小
高考数学难或不难,取决于考生的主观判断,如同小马过河,不可一概而论,可谓是会者不难难者不会(www.e993.com)2024年11月28日。不过能确定的是,今年韦东奕并未参加任何地区的高考命题工作。有北大学生反映,这段时间韦神频繁出现在校园中,关于高考命题的谣言也就不攻自破了。考试院也对今年高考命题难度给出解释,以新课标为例,命题风格最...
大模型“考生”们高考数学普遍不及格 业内解释为何“偏科”
大模型数学普遍不及格,与数据情况、推理逻辑相关虽然英语和语文成绩可圈可点,但从单科成绩上看,大模型“考生”数学不太行,普遍出现了偏科、不及格的状况。数据显示,数学科目各大“考生”平均得分率仅为36%(150分满分)。上海人工智能实验室给出的数据显示,数学成绩前三名为Qwen2-72B、GPT-4o、InternLM2-20B-WQ...
大模型能答对几道高考数学题?国产九章大模型PK国际GPT-4o
九章大模型总分=7*5分+2*5分=45分(满分90分)GPT-4o选择题12题,正确7题。填空题4题,正确1题。GPT-4o总分=7*5分+1*5分=40分(满分90分)九章大模型作为以数学领域的解题和讲题算法为核心的大模型,在高考数学题目上更胜一筹,比GPT-4o得分更高。同时...
“我数学太烂,但高考136分!”刷完上万道题后,我找到了2个月多考58...
高一、高二、高三分班上课高一、高二、高三3个年级精细区分,详细到学习方法、学习规划、与考纲相符的考点等等,让高中学生针对性地查缺补漏,更快速提分!这门课程官方售价499元,限时特价仅需9块钱,跟着2位十余年数学教学经验的老师,攻克不同年级的数学难点,让数学多考30-40分,绝对不是难题!
2014高考数学北京卷解析 重点考查三大能力【2】
3、北京市理科数学第15题北京市高考数学从2010年以来,基本上在15题里面考的是三角函数的函数性质,求周期,求最值和单调区间,只有在2013年理科数学的15题考了一道解三角形的题目,我们预测这个趋势可能会延续,果不其然,在今年理科数学15题依然考的解三角形,这是第一个。在考前我们做过第二个预测,解三角形的普通...