知乎直答上线“专业搜索”:让你的AI搜索自带5000万篇正版论文
这种模式的独特之处在于,从数据源的角度来看,知乎直答依托的是一个在中文互联网中独一无二的知识社区,因为很难找到一个单一的平台能在质量和话题多样性上与之媲美。这次知乎直答与正版论文库建立正式合作关系并推出“专业搜索”,将用户生成优质内容与专业学术资源相结合,让知乎直答不仅是一个所有用户都能用上...
“中文十级”的混血网红:在读大四 是个温州媳妇
12天前,她在知乎上注册了自己的账号“吃货国的外国小公举”,现在粉丝量已突破12万。而且,这个数字还在不停地疯涨。兰兰的魅力来自她的中文。“小公举”、“脱离了高级趣味的人”、“甜豆腐脑和五仁月饼”……她不仅将各种网络流行语挂在嘴边,还能活学活用,说出诸如“自己剁的手,含泪也要缝起来”这样的话,有...
“中文版 Perplexity”驶入快车道,知乎直答8月访问量增长345%
十多年在问答领域的精心耕耘,知乎拥有了大量的专业答主,积累了海量、高质量的中文语料,这使得答案有效减少了AI幻觉,回答内容更专业、可信。当前,随着知乎直答被更多的用户访问使用,这些内容互动也更大量地同知乎主站内容展开了联动,一个更有创造力与活力的知乎也在逐渐形成中。2024年下半年以来,基于AI聊天的海外对话...
全国政协委员、知乎创始人周源:补齐优质中文语料数据短板
推动我国大模型产业高质量发展文|《中国企业家》记者赵东山编辑|李薇图片来源|受访者2024年是知乎创始人、CEO周源任职全国政协委员的第二个年头,基于过去一年的创业体悟,周源今年带来了5份提案,聚焦“大模型产业发展”“全民科学素质”“互联网平台企业创新活力”“高质量技能人才供给”和“打击新型盗版侵权”。...
弱智吧竟成最佳中文 AI 训练数据?中科院等:8 项测试第一,远超知乎...
中文数据集很多是从英文翻译过来的,没有很好地契合中文的语言习惯和文化背景不少数据集是用AI生成的,质量难以保证,容易出现事实性错误即使是人工标注的数据集,也存在数据量小、覆盖领域不全面等问题为了解决这些痛点,团队从中文互联网的各种知识源头直接收集数据,比如知乎、豆瓣、百科、小红书等,经过一系列严格的...
...知乎创始人兼CEO周源:中国大模型面临中文语料资源短缺的挑战
然而,尽管国内存量数据资源丰富,但由于数据挖掘不足、无法自由在市场上流通等现状,目前中文优质数据仍然稀缺,如ChatGPT训练数据中中文资料比重不足千分之一,而英文资料占比超过92.6%(www.e993.com)2024年11月11日。这也导致国内许多从事大模型开发的研究机构和企业在进行模型训练时,不得不依赖于外文标注数据集、开源数据集,或是爬取网络数据。
女孩子每天喝茶好吗-女孩子每天喝茶好吗知乎
1.提神醒脑:现代女孩的学和工作压力往往很大,长时间的工作和学容易导致疲劳和注意力不集中。茶叶中的***能够***中枢神经,提高人的警觉性和注意力,让女孩更加精神饱满。2.饮茶减肥:女孩们都渴望拥有条的身材,茶叶中的多酚类和***具有促进脂肪代谢的作用,可以减少脂肪的积累,帮助女孩们达到减肥的效果...
热点问答|《动物强弙人类的BBBBB》在线观看 - 正版视频电影高清...
台风“康妮”强度逐渐增强向台湾岛东部海面靠近,黄文污|人民日报出文“最新科学“国模小树私拍泬150P-知乎|国产精品青青在线韩围。(乡村行·看振兴)从“老黄牛”村书记24年任职路看浙派乡村蝶变,好男人影剧院|一个人在上面2个在下?b站免费的|胡桃吃旅行者坤坤。
好像中文已死,只有弱智吧还在勇敢上坟
总的来说,弱智吧的中文数据价值很高。网友见状一顿狂欢,谁说弱智吧里都是弱智的。但弱智吧真赢了吗?相比于小红书、知乎、豆瓣的上千组数据,弱智吧仅有240组数据,这是不是太少了?而且,其他数据源用的数据都是本来就有的回答,由人类作出。
“弱智吧”帖子训练AI效果遥遥领先?研究团队回应—新闻—科学网
不过,并不像传说的那样——“弱智吧8项测试第一,远超知乎豆瓣小红书”“竟成最佳中文AI训练数据”。实际上,在Yi-34B大模型上表现上佳的,不单纯是“弱智吧”。具体来说,弱智吧只贡献了个标题。论文提到,研究团队收集了“弱智吧”上点赞数最多的500个帖子,并使用这些帖子的标题作为指令,使用GPT-4生成相应的回...