【大模型】出分了!首个AI高考全卷评测结果发布
与以往多采用高考客观题考察模型的方式不同,在本次测试中,研究团队使用了语数外三科的全卷试题,既包含选择、填空等“答案唯一性”题目,也包括简答、阅读理解及作文等主观题,在更加接近真实高考的环境中测试模型能力。为贴近高考评卷模式,联合团队邀请多位具有阅卷经验的高中教师对模型主观题答案评分,每份考卷至少由3...
首个AI高考全卷评测结果发布,这个大模型排名第一
数学评卷显示,大模型的主观题回答相对凌乱,解题过程有迷惑性,甚至出现过程错误但得到正确答案的情况。大模型的公式记忆能力很强,但无法在解题过程中灵活运用。大模型的英语整体表现良好,大模型写的英语作文普遍存在因超出字数限制被扣分的情况,而人类考生大多因为字数不够被扣分。据了解,本次“大模型高考”答案生成...
首个AI高考全卷评测结果发布:语文124分 数学都不及格
与以往多采用高考客观题考察模型的方式不同,本次测试研究团队使用了语数外三科的全卷试题,既包含选择、填空等“答案唯一性”题目,也包括简答、阅读理解及作文等主观题,在更加接近真实高考的环境中测试模型能力。为贴近高考评卷模式,联合团队邀请多位具有阅卷经验的高中教师对模型主观题答案评分,每份考卷至少由3位教师...
首个AI高考全卷评测结果出分,大模型“考生”表现如何?
在数学科目上,阅卷教师表示,大模型的主观题回答相对凌乱,而且过程具有迷惑性,甚至出现了过程错误但得到正确答案的情况。此外,大模型的公式记忆能力较强,但无法在解题过程中灵活引用。相较于语文和数学,阅卷教师认为,在英语科目上大模型整体表现良好,但部分模型由于不适应题型,在七选五、完形填空题等题型得分率较...
权威发布 | 2024浙江中考命题思路、试题评析出炉
2024年浙江省初中学业水平考试语文试题卷以课标为依据,坚持正确的价值导向,考查语文学科的必备知识与关键能力,落实语文核心素养,促进“教-学-评”有机衔接,引领语文教学走向素养立意。一、落实立德树人,呼应时代主题全卷以班级开展“责任担当,青春闪光”系列活动为情境,设置了“‘树立远大志向’主题演讲活动”“‘彰...
语文能考124分 数学都不及格……这群“偏科”的考生是谁?阅卷老师...
司南评测体系首次采用高考全卷测试的形式,选取新课标I卷“语数外”三科题目作为测试集(www.e993.com)2024年11月27日。因受测的开源模型均为大语言模型,在评测过程中,仅输入文字题干(数学包含2道带图试题),英语听力部分(分值30分)不纳入此次评测。首个大模型高考全卷评测结果显示,Qwen2-72B、GPT-4o及书生·浦语2.0文曲星(InternLM2-20B-...
浙江省2024年6月高考和选考科目试题评析
2024年6月浙江省思想政治选考试卷,以习近平新时代中国特色社会主义思想为指导,贯彻党的二十大精神,命题遵照“价值引领、素养导向、能力为重、知识为基”的命制要求,落实立德树人的根本任务。试卷呈现出三个特点。一、彰显时代特色,加强价值引领“情境载体串联线”是命题的逻辑主线。试卷进一步优化情境创设,精选素材,将...
2020年全国小学生英语能力测评招生啦!模拟测试卷免费领!
模拟测试卷免费领!为了贯彻《义务教育法》,进一步推进素质教育,促进英语教学的改革和教学质量的提高,激发广大师生教与学的积极性,国家基础教育实验中心外语教育研究中心决定举办2020年全国小学生英语能力测评(NECPS)。本届测评是第二十二届全国小学生英语能力测评。
【教育】专家点评中考英语卷!明日道德与法治、历史考前提醒在此
2021年是上海市初中学业水平考试改革实施的第一年,英语听说测试纳入评价体系,开启了初中英语对听、说、读、看、写等能力的全面考查。试卷题材丰富,体裁多样,通过创设具有鲜明时代性的情境,考查英语学科核心素养。试卷为考生分析、比较、归纳、推断、评价等思维活动留出了足够的空间。如听说测试的复述、表达,笔试部分的...
娃英语究竟学到什么程度,才可以报考KET,PET?_腾讯新闻
娃英文要学到什么水平才可以考KET和PET?KET对标的学习标准和要求KET考试是剑桥通用英语五级(MSE)考试的第一个级别,是一项基础英语水平考试,可以证明考生能在简单的情景中使用英语进行沟通。通过该考试,英语能力已达到如下水平:理解简单的书面英语在熟悉的情景中,使用英语进行沟通...