豆瓣9.2!斯坦福AI教母的逆袭人生,什么样的教育成就了她?
读完她最新出版的自传、豆瓣评分高达9.2分的《我看见的世界》,我有了答案。01.浪漫的父亲和坚定的母亲「我与未来的距离却大大拉近了」1976年,李飞飞出生于北京,在成都长大,她的父亲是工程师,母亲是老师。在她的成长经历中,性格迥异的父母对她有着极为不同的影响。她这样描述过父亲:「一个迷失在成年人身...
...成最佳中文AI训练数据?中科院等:8项测试第一,远超知乎豆瓣小红书
为了解决这些痛点,团队从中文互联网的各种知识源头直接收集数据,比如知乎、豆瓣、百科、小红书等,经过一系列严格的清洗和人工审核,打造成高质量、多样化的中文指令微调数据集COIG-CQIA。除了探索不同数据源的作用,团队还专门从中抽取出一个精华子集CQIA-Subset。在众多数据来源中,弱智吧成了最特别的一个。由500个点...
研究称弱智吧成最佳中文AI训练数据 :8项测试第一,远超知乎豆瓣...
分别用各种数据集训练零一万物Yi系列开源大模型,在BELLE-Eval测试集上使用GPT-4评分得到结果。在规模较小的Yi-6B模型上,纯弱智吧版本总分排名第三,还不算太突出。到了Yi-34B,弱智吧版本表现就一骑绝尘了。只有在改写和数学任务上没能取得最高分,但成绩也比较靠前。另外,在安全评估上弱智吧版本也能排上第...
恭喜弱智吧,打败AI
相比于小红书、知乎、豆瓣的上千组数据,弱智吧仅有240组数据,这是不是太少了?而且,其他数据源用的数据都是本来就有的回答,由人类作出。(即使小红书数据的回答部分,看着像一键生成的,也被标注为人类作出)弱智吧的那组数据还是GPT-4去回答、GPT-4来评分的,那这是不是有既当裁判又当运动员的嫌疑呢?另...
AI已经可以画画写作了,还要人类做什么?
在微博上,搜索“AI”“画画”,就可以看到大量分享;在豆瓣上,有个话题,叫“AI命题作图作品大赏”,不少人抱着好奇的心态希望能通过AI程序来画出自己的梦境,毕竟当头脑中想象的东西如此便捷地出现在画面上,确实值得激动。比如,让我们实验一下,以“简洁的现实主义风格/一幢长得像积木一样的大楼,大楼有很多阳台...
99.9%的数据分析师都需要知道的数据库!
一、公开数据库1、常用数据公开网站UCI:该网站目前维护了436个经典的机器学习、数据挖掘数据集,包含分类、聚类、回归等问题下的多个数据集(www.e993.com)2024年9月7日。国家数据:数据来源中华人民共和国国家统计局,包含了我国经济民生等多个方面的数据,并且在月度、季度、年度都有覆盖,较为全面。