提前体验火上热搜的 Kimi 探索版,我感觉 AI 搜索和百度们完全不是...
昨天发布的特斯拉「赛博的士」Cybercab还很热乎,我用英文提问Cybercab和梦碎的苹果梦碎的汽车项目有哪些不同,也没能难倒Kimi。所有的问题都有答案。既然Kimi探索版擅长拆解用户的问题,那它能否智斗弱智吧难题?实测发现,虽然Kimi探索版能够理解拆分复杂问题,但还是一板一眼地遵循搜索环节,依靠海量知识来解...
智源人工智能研究院林咏华:建中文语料库让AI说中国话
但是大模型有很强的跨语言能力,训练语料里头没有中文,但它会自动把英文的意思给转成中文的描述。面对“麻婆豆腐”,可能在它的训练数据里头没有四川那盘麻婆豆腐的图片,但是它会用跨语言能力去把麻婆豆腐进行解读,然后在英文的图片里面去寻找英文麻婆豆腐匹配的图片,于是它就会出现长了麻子的老太太和一盘豆腐。所以...
要让AI“讲中国话”,必须建好中文语料库
在语料库建设热潮中,还出现过一个有趣的说法,被誉为“最大原创段子手孵化地”的百度贴吧“弱智吧”,竟成了“最佳中文AI训练语料库”。据说,由中国科学院自动化研究所和众多高校组成的联合研究团队,前往知乎、小红书、豆瓣、百度贴吧等社交平台取材,以提升大模型对中文指令的理解和响应能力。其中,“Ruozhiba(弱智...
李阳:让英语疯狂
我读英文和写英文的能力都很强,但我从不说英文。在这方面,我有一个致命的障碍。你怎么可能在一个很短的时间里,让我突然具有说英语的能力?李阳:如果有时间,一会儿我给你演示一下。不仅是让你,我还要让现场150位观众都能喊英语。你说得很对,中国学英语的人有4亿5千万,但99%是经过10年锻造,成了作选择题的...
实测OpenAI最强模型o1:会做大学数理化,但弱智吧依然难解
Q:你的回复中有几个字?A1:这句话有七个字A2:一共五个字量子位也进行了一番实测,下面就一起来了解。推理能力大进化,但还是难敌弱智吧该说不说,o1虽然在推理能力上取得了很大进步,但面对充满心机的弱智吧问题,还是掉进了人类挖的陷阱。当然了,对于正经问题,o1的表现还是很强的,首先看看逻辑推理能力。
首批中文版Llama3模型来了,解释成语、答弱智吧问题
与原来的Meta-Llama-3-8B-Instruct模型相比,Llama3-8B-Chinese-Chat模型显著减少了「中文问题英文回复」以及中英文混合的问题(www.e993.com)2024年11月16日。此外,与原始模型相比,新模型大大减少了答案中表情符号的数量,使回复更加正式。以下是一些demo展示:弱智吧问题测试提问「弱智吧」的问题,Llama3-8B-Chinese-Chat模型可以耐心回...
“作为一个人像个白痴……”,记者有什么资格教育全红婵?
大概朱记者就是这么认为的。因为他会几句英语。但你作为记者学英语是为了采访外国人的,不是让你在中国人面前显摆的。恰恰是你们天天追着人家问喜欢吃什么、累不累一类的弱智问题,才像个白痴一样。不仅如此,朱小龙直播中还说:“作为一个运动员她很优秀,但作为一个人,她不是很完整”。看到这句我更来气了,...
GPT-4o mini,你好!GPT-3.5 彻底再见!|AI 鲜测
除了中文提问,我又换成英文提问:Whatisthedifferencebetween9.11and9.9?谁知GPT-4omini还是觉得9.11大。看这效果,大模型的数学能力暂时是救不活了。中文理解能力:弱智吧三连问第一问:当手机和钱包同时掉水里,会选择救谁?在第一问中,GPT-4omini直接回答提问,并且中规中矩有理有据的...
新晋“黑马”Reka Core:拳打 GPT,脚踢 Claude,多模态实力到底有多...
这英文水平真不错啊!测到这儿了,这里怎么能少得了咱们中文的“弱智吧”呢?提问:高考满分才750,怎么才能考985?Reka的回答中规中矩,但想要从弱智吧“出院”还差不少呢。提问:用数据线传输电脑和手机文件,同时两头拔掉,文件可以保存在数据线中吗?对于弱智吧的提问,RekaCore并没有接梗,而是有理有据...
你抛弃“九二共识”,两岸就会“撞车”,苏起直言蔡英文“弱智”
苏起还指出,蔡英文在处理蓬佩奥窜台上面的做法其实就是在耍小聪明,这也表明蔡英文根本没有大智慧,她主动抛弃“九二共识”,坚持“谋独”行为,让两岸沟通对话中断,让中国大陆和台湾地区之间越发没有缓和空间,那么最终两岸火车必定“相撞”。事实上,中国大陆已经多次就台湾问题向民进党当局和蔡英文发出警告,让...