智源人工智能研究院林咏华:建中文语料库让AI说中国话
一方面我挺开心,我们3.0的语料库跟其他已有的中文开源语料库相比,训练之后得到的模型在中文质量上能力上更优;另一方面,我们也觉得很难一家去把整个问题解决,最好是出现更多的高质量中文语料库,让不同的企业可以去做更多的选择。读+:还有一种说法,语料库爬取的都是网页,但实际上近10年来,中国互联网很多数据是在...
中国老板,卷不动墨西哥打工人
从去年年底开始,Lora手头的业务量急剧增长。此前她在国内对接业务,“很多人甚至不知道出海是什么意思”。但到墨西哥后,“所有来这里考察的中国人,基本都会有继续开拓市场的打算。大家觉得这块土地欣欣向荣。”今年年初,黎旭妍所在的集团董事长前往墨西哥进行实地考察。在考察结束后,他对黎旭妍说:“Rita(黎旭妍),这...
要让AI“讲中国话”,必须建好中文语料库
语料库是人工智能的粮食和养料,两台一模一样的电脑,使用一样的算法,但是用不同的语料库“喂养”,结果必然是大相径庭。上周,长江日报《读+》周刊专访了北京智源人工智能研究院副院长兼总工程师林咏华,智源研究院由科技部和北京市支持,依托北大、清华、中国科学院、百度、小米、字节跳动、美团点评、旷视科技等北京...
??清华刘嘉教授:大模型是一个生命新物种|AI&Society百人百问
刘嘉:首先我们看ChatGPT为代表的大模型,它的预训练语料来自哪?它来自对人类知识的预训练,所以说它要取代或者影响最大的行业一定是知识密集型行业。那什么是知识密集型行业呢?律师、医生、教师等我们所认为的白领或者金领的行业都是大模型会最先渗透进去、最先去颠覆的行业。所以将来最先要面临失业,或者再就业的人,...
AI时代,外语学科正在发生什么变化
外国语学院还与德国SAP公司共同成立了“上财-SAP联合研究中心”,开发一系列校企共建的课程,利用机器学习技术深入研究企业语言战略及跨文化管理。接下来,上海财大外国语学院还将建立一系列融合人工智能的语言技术模块,引进相关语言技术老师,把Python、语料库等课程融入教学。
对话彩云科技CEO袁行远:10年AI狂飙,中国大模型发展不应只有OpenAI...
“也有朋友说,为什么中国没有出ChatGPT,原因是什么呢?因为中国程序员水平不行(www.e993.com)2024年11月18日。我觉得不能说是中国程序员水平不行;还有人说,是因为简体中文语料不行,我们是全球使用语言最多的、母语最多的人,我们创造的东西是最多,我觉得绝对不能说是我们语料不行,也不是中国程序员不行。我认为需要给我们一些时间,迎头赶上,最...
我让AI假扮“知乎大V”,回答了上百个问题无人发现|新榜洞察
如果训练模型的过程中使用了太广太复杂的语料,导致生成的文本语义分布过于平均或者不自然,像“他非常高兴,非常兴奋,非常快乐”、“今天的天气真好,阳光明媚,鸟儿在歌唱,花儿在微笑”等等,这些都是“AI味”很浓的句子,因为没有人会这样说话。“就像每个人长得不一样,但如果把所有人的脸平均一下,肯定看...
圆桌|陈楸帆、糖匪、刘希:AI时代的性别、身份和边界
Co-becoming的意思就是说我们跟其他物种一起,共同处于一个生成的状态。这跟生成式的AI有一定的关系,在这个生成的过程中,我们如何去施加我们的影响,同时又接受来自对方或者说多方,包括环境的反馈回环。这就又回到了三分类的控制论的理论,即我们在建立新的反馈回环的机制,这个反馈可能不仅限于原来的机械控制论1.0的...
林建明:人工智能在金融科技和跨境电商领域的实践经验
说到劳动对象,这是非常有意思的思考讨论。为什么说人工智能是劳动对象?我们说压缩即智能,所谓的人工智能就是被压缩后的数据集,就是数据。数据作为新型的生产要素,就是一种生产的原材料。从这个角度来讲,人工智能就是劳动对象,跟所有其他新的技术一样,人工智能也正在重构就业结构,会有很多新的岗位诞生。例如算法工程...
2024年最新雅思口语题目大盘点,快来围观!
这个题目让我们联想一下环境保护法吧,还是考查大家环境话题的语料储备呀。2.一个你买的让你感到开心的东东。物品类话题,快把之前准备的电子产品啦礼物啦什么的调动起来!3.未来想做的工作。回忆一下上个季度的apersonwhosejobisimportanttosociety,如果你说的是老师,医生,企业家或者导演什么的,直...