对话许四清:眼下投AI,就是在不确定里找到必然
网易科技:阿尔法公社投资的底层逻辑是什么?许四清:过去一年里,我和创业者连续三次前往美国,深入了解了美国整个AI生态体系,从底层的硬件到上层的应用层级,逐层考察了大家耳熟能详的多家公司。我们可以先看一个来自OpenAI的流程模型。在训练一个大模型的四个步骤:预训练(Pre-train、微调(Fine-tuning,SFT)、奖励模...
李彦宏:应用驱动是百度第一性原理,基础模型两年一个版本就够了
底层技术上主要有两件事:第一是RAG(Retrieval-augmentedGeneration)——检索增强。百度是国内最早强调检索增强技术的公司,到今天这一技术已经成为行业共识。李彦宏认为,过去24个月大模型行业最大的变化,就是基于检索增强技术基本消除了幻觉。第二是iRAG(imagebasedRAG)——检索增强的文生图技术。百度在今年年初...
英国科学家研发破译系统可读懂外星球语言
埃利奥特表示不同文化的词汇和字符不过是底层结构的盖子。他说:“我们的发声以及所使用的字符只是上面的盖子,盖子下面的语言结构非常非常相似。在对中文和英文进行比较时,我发现它们在某些意思的表达上几乎一模一样。”海豚的语言也拥有同样的结构,只不过与人类语言相比频率更高。埃利奥特表示如果在将来的某一天发现地外...
伯克利具身智能图谱:深度强化学习浪尖上的中国 90 后们
具体而言,计算机系是从上层感知技术向底层逐步渗透,从AI出发,在遇到AI的局限(例如可解释性不足)时,再整合控制理论等元素;机械工程系则从底层起步向上拓展,侧重于模型基础研究和工业应用,在遇到传统技术局限时,引入AI技术进行增强。也是从2017年起,两大专业的交叉内容越来越多。随着伯克利CS系的fr...
刘楠祺:法语是拉辛和伏尔泰的语言,是巴尔扎克和雨果的语言,对我...
“整整九十六个孤独的页面[1],”他曾回答说,“一个页面连着另一个页面。首个页面位于上层;最后一个页面位于底层。这就是书写的进程。”他又接着说道:“最让我好奇的不是如何一页页走下全书的台阶而是想知道我是如何从一开始便位于第一级即最高的位置上的。”...
大模型到底是什么?小白也能看懂的科普贴
鉴于最近在做基于大模型和Agent的上层AI应用,如若不了解底层概念,始终还是会限制产品层的能力,因此,最近2周零散时间读完了这本由复旦团队出版的《大规模语言模型:从理论到实践》,基本涉及到了大模型入门所需的核心框架内容,适合扫盲看(www.e993.com)2024年11月29日。因此,基于这本书的核心框架,来结合自己的理解聊一聊大模型到底是什么?
成功融合“扩散+语言大模型”的Sora 能带飞哪些国内企业?丨黄金眼
当前,华为昇腾计算平台CANN已经实现从0至1突破。2018年9月,CANN1.0华为昇腾AI使能平台诞生,2020年8月,CANN3.0版本发布,作为专门面向AI场景的异构计算架构,搭起了上层深度学习框架和底层AI硬件平台的桥梁,目前华为CANN计算平台已经到了7.0版本,其生态加速繁荣。华为CANN昇腾AI计算平台资料来源:昇腾官网整个...
XLang??,AI 时代的编程语言 | 新程序员
1.Python是“胶水”语言,具备与其他语言的“互操作性”。Python语言更高级和抽象的语法封装了底层的C/Fortran库,而这些库(大多数情况下)负责完成主要的计算。2.Python有大量的工具库。Python的标准库提供了广泛的模块和工具,其社区活跃且提供大量的第三方库,从网站开发、数据科学、人工智能到科学计...
如果强化学习是问题,大模型是否是「答案」?丨GAIR live
大模型对于强化学习的一个启示是可能会颠覆我们现在对决策领域的认知,可以借鉴语言大模型的思路去实现决策领域的通用大模型,这可能是未来探索的重要方向。最后一点刚刚其实俞老师也提到,大模型本身具备对世界的良好认知,所以它可以帮助我们做一些比较复杂的上层任务的拆解,然后底层配合基于强化学习的控制,去实现一些更加...
月之暗面杨植麟专访:AI不是接下来一两年找到PMF,而是接下来十到...
这是我在Google学到的思维:如果能被更底层的东西解释,就不应该在上层过度雕花。有一句重要的话我很认同:如果你能用scale解决的问题,就不要用新的算法解决。新算法最大价值是让它怎么更好的scale。当你把自己从雕花的事中释放出来,可以看到更多。