大厂AI决战高考作文:文心一言有文采,豆包更懂中文,GPT-4o更深度
多篇文章对比来看,主场作战的文心一言对中文的理解更为精准透彻,同时还引用了名人名言,在作文的表现上比起其余三个大模型更具文采。豆包作为字节跳动旗下的大模型被寄予厚望,上线至今已有超过1700万用户。从行文表现来看,豆包兼具思考性与逻辑性,但文章偏向白话,欠缺一定的文采。作为AI届的新晋网红顶流,Kimi展现了...
9个国产大模型大战高考作文:谁能得满分?
(用AI写AI)话不多说,我们这就有请“选手们”登场——Kimi、通义千问、文心一言、豆包、讯飞星火、商量、智谱AI、腾讯元宝、天工。国产大模型,大战高考2024我们评测的方式也是比较简单,直接将这次语文作文的题目,原封不动“喂”给AI们。接下来,我们就来看一下各个国产大模型的作答结果。Kimi通义千问...
高考阅卷名师点评AI作文,九家大模型“决战”高考
第一财经记者测试了ChatGPT、月之暗面kimi、智谱清言、百度文心一言、阿里通义千问、字节豆包、腾讯元宝、百川智能、零一万物这九大厂商的大模型,并请了多位高考阅卷老师给AI作文打分、评价。成老师是江苏省某四星级高中语文高级教师,多次参加高考作文阅卷工作,她看完这九份答卷后,将最高分52分给了腾讯元宝,最低...
当大模型开始“考上”一本
这些模型一方面是出现了指令识别问题,比如字数不符合80字要求,豆包只写了30多字,通义千问则写了近300字;另一方面是细节不够出色,多为简单句结构,用词也非常基础。而在应对“读后续写”的要求时,较多模型在情节设置有些逻辑不顺或者不合理问题,以及漏掉了作文题目中提及的promise的内容。(左图为百...
一份超难“高考真题”,AI考生能及格吗?|【经纬低调分享】
考试分为三场,需要考生在不到一天的时间里,用毛笔撰写13篇文章,每篇大概2000字。有网友换算,约等于一天里写了32篇高考作文。考题的内容也包罗万象。不但要根据历史事件撰写论文,还要分析当时其他国家的一些政策变动。为了让网友们更直观地了解这场考试的困难程度,UP主先带着网友们通览了一遍考卷。
当大模型开始「考上」一本
得分较低的有通义千问、豆包和腾讯元宝(www.e993.com)2024年9月7日。这些模型一方面是出现了指令识别问题,比如字数不符合80字要求,豆包只写了30多字,通义千问则写了近300字;另一方面是细节不够出色,多为简单句结构,用词也非常基础。而在应对「读后续写」的要求时,较多模型在情节设置有些逻辑不顺或者不合理问题,以及漏掉了作文题...