AI大模型挑战高考:豆包等三款国产大模型突破文科一本线 数理学科...
????6月24日,在极客公园最新发布的高考新课标Ⅰ卷大模型评测报告中,文科本科一批录取分数线为521分,GPT-4o以562分排名文科总分第一,字节豆包以542.5分位列于GPT-4o之后,排名国产AI第一。字节豆包、文心一言、百小应三款国产AI成功超过一本线。????但与文科相比,大模型在理科方面的表现却不尽如人意,其...
3款大模型超河南高考文科一本线,字节豆包总分排国产AI第一
凭借中文语言的“主场优势”,三款国产大模型产品获得了语文考试前三名,分别是百小应、字节豆包和腾讯元宝,得分依次为128分、125.5分和120.5分。除了少数开放性的阅读理解和语言文字运用问题,各家大模型主要丢分在语文写作上。作为本次评测的语文作文阅卷人,北京市级骨干教师、怀柔区语文学科带头人夏老师曾多次参加...
大模型2024高考发榜,豆包等三款国产AI考上文科一本线
凭借中文语言的“主场优势”,三款国产大模型产品获得了语文考试前三名,分别是百小应、字节豆包和腾讯元宝,得分依次为128分、125.5分和120.5分。除了少数开放性的阅读理解和语言文字运用问题,各家大模型主要丢分在语文写作上。作为本次评测的语文作文阅卷人,北京市级骨干教师、怀柔区语文学科带头人夏老师曾多次参加全...
9款大模型角逐河南高考,GPT-4o、字节豆包等超文科一本线
以数学试卷为例,9款大模型产品中,仅GPT-4o、文心一言4.0和豆包获得60分以上成绩(满分150分),目前的大模型只能正确推理步骤相对简单的问题。据测试机构透露,豆包等大模型能准确运用求导公式和三角函数定理,但是面对较为复杂的推导和证明问题就很难继续得分。重点考查实验探究能力的化学和物理试卷,各模型平均分更是只...
让AI去高考,豆包等四款大模型考上文科“一本”
河南省教育考试院公布的高考录取分数线,文科本科一批分数线为521。根据测试结果,这意味着,GPT-4o、豆包、文心4.0、百小应等四款AI大模型在测试中的得分冲上了“一本”线。与文科相比,大模型的理科成绩要差很多,最高分还不到480分,多数大模型的理科总分在400分以下,数学普遍不及格,相比河南理科511分的“一本...
高考阅卷名师点评AI作文,九家大模型“决战”高考
第一财经记者测试了ChatGPT、月之暗面kimi、智谱清言、百度文心一言、阿里通义千问、字节豆包、腾讯元宝、百川智能、零一万物这九大厂商的大模型,并请了多位高考阅卷老师给AI作文打分、评价(www.e993.com)2024年11月3日。成老师是江苏省某四星级高中语文高级教师,多次参加高考作文阅卷工作,她看完这九份答卷后,将最高分52分给了腾讯元宝,最低...
楼市,政府要兜底了;惊爆理想大规模裁员;董明珠欲全国开展主播选秀...
解读:理想汽车CEO李想是个危机感很重的人,即便去年年底公司账上躺着400多亿现金流,毛利率领先昔日对手,一旦销量未达内部预期,便会有调整动作。4月7日,理想进行了新一轮组织架构调整,4月22日,理想历史上首次官宣全系降价,除L6以外官降1.8万-3万。