首个AI高考全卷评测结果出分,大模型“考生”表现如何?
智谱AI于2024年6月4日推出的最新一代预训练模型GLM-4系列的开源版本(GLM-4-9B)、上海人工智能实验室于2024年6月4日开源的书生·浦语2.0系列文曲星大语言模型(InternLM2-20B-WQX)、阿里巴巴于2024年6月6日开源的Qwen2系列MoE对话
上海人工智能实验室发布首个 AI 高考评测结果:最高 303 分,数学...
IT之家6月20日消息,上海人工智能实验室19日公布了首个AI高考全卷评测结果。据介绍,2024年全国高考甫一结束,该实验室旗下司南评测体系OpenCompass选取6个开源模型及GPT-4o进行高考“语数外”全卷能力测试。评测采用全国新课标I卷,参与评测的所有开源模型开源时间均早于高考,确保评测“闭...
用AI来做全国高考试卷,真的有人试了!结果:成绩偏科很严重
上海人工智能实验室近日公布了司南评测体系OpenCompass选取开源大模型测试今年高考的全国新课标I卷“语数外”的结果,为了确保“闭卷”考试,大模型的开源时间早于高考,同时邀请有高考评卷经验的教师人工批卷。选取的大模型分别是OpenAI的GPT-4o、法国的Mixtral8x22B、零一万物的Yi-1.5-34B、智谱AI的GLM-4-9B、上...
AI助力中国多地防高考作弊
参考消息网6月10日报道据香港《南华早报》网站6月7日报道,中国多个省份已利用人工智能(AI)对被称为“高考”的普通高等学校招生全国统一考试进行监管,并打击作弊和其他违规行为。根据教育部的数据,今年有创纪录的1342万名学生报名参加高考。据媒体报道,包括南方的广东、海南和东部的山东在内的一些省份已启用人工智...
首个AI高考全卷评测结果发布:最高分303,数学全不及格
在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试。6月19日,OpenCompass发布了首个大模型高考全卷评测结果。语数外三科加起来的满分为420分,此次高考测试结果显示,阿里通义千问2-72B排名第一,为303分,OpenAI的GPT-4o排名第二,得分296分,上海...
首个AI高考全卷评测结果发布:数学全不及格;严打虚拟主播?腾讯视频...
两位研究人员以真人、初代聊天机器人ELIZA、GPT-3.5和GPT-4为研究对象,试图了解谁在诱使人类参与者认为它是人类方面表现最成功(www.e993.com)2024年10月20日。结果显示,多达54%的参与者将GPT-4误认为真人,是迄今为止首次有AI模型以如此高的结果通过图灵测试。(科创板日报)高盛:人工智能将大幅推动数据中心电力需求增长...
AI助力严防作弊!天津高考全面实行“2+1”入场安检模式
从市教育招生考试院获悉,从4日起,考生可以在招考资讯网自行下载并打印高考准考证,详细了解自己所在的考场信息。市教育招生考试院发布提示,今年高考将实施人工智能等新技术手段,严防考试作弊行为。维护考试公平是每位考生的责任,严守考试纪律是每位考生的义务。做诚信高考的践行者,做公平高考的捍卫者,是考生们最庄严的承...
AI巡考!今年高考,泸州智能监测考场违规违纪行为,严防作弊
6月7日2024年高考拉开帷幕在纳溪区纳溪中学蓝安大道校区,参加2024年高考首科考试的考生在考试结束后走出考场。泸州日报记者牟科摄泸州日报记者从市大学中专招生委员会办公室了解到今年高考期间我市17个考点和8个保密室引用AI智能巡考系统对考试进行监控该系统作为人工智
录取概率秒出?AI填报高考志愿靠谱吗?
眼下,各省高考志愿填报工作正在紧张进行中。近年来,随着人工智能的普及和应用,借助AI填报高考志愿,成为很多考生和家长的一个新选择。考生只要输入分数等信息,即刻就能生成一张详细的选校方案。那么,AI帮忙填报高考志愿,到底靠不靠谱?输入考生信息AI软件可即刻生成志愿“推荐列表”...
首个AI高考全卷评测结果发布,这个大模型排名第一
6月19日,上海人工智能实验室发布首个AI高考全卷评测结果,月初开源的阿里通义千问大模型Qwen2-72B排名第一,在语数外三科420分的满分中获得303分,高于OpenAI的GPT-4o和上海人工智能实验室的书生·浦语2.0文曲星(InternLM2-20B-WQX)。语文和英语表现良好,数学不及格极目新闻记者看到,上海人工智能实验室...