中国大模型发展指数(第1期)
大模型实践方面:实践指数揭示了大模型在实际应用中的增长态势,尽管短期内增速有所放缓,但大模型在各行业的应用水平仍在提升。特别是大模型创业指数的快速增长,表明市场对大模型应用的高度认可和积极响应。大模型支撑方面:支撑指数的显著增长凸显了中国在算力、人才、政策和创新环境等方面的坚实基础。算力中心数量的增加...
AI+数据时代,企业如何有效落地大模型知识管理?
模型数据实际上可以分为三类,第一个是全训模型数据,其实就是知识库;第二类是RAG数据,即我们将一系列的知识文件转换为各种内容块;第三类是进行微调和精调时需要使用的更高质量的QA数据。这三种数据我们通常称之为大模型数据,它实际上是通过我们的知识数据转化为模型数据。这里就引申出一个问题,知识数据来自哪里?知...
大模型进化分岔口:多模态、成本、代码推理
在性能方面,Claude模型取得了很大进步。Claude3.5Sonnet在很多领域的表现超越了GPT-4,特别是在研究生级推理和编程能力方面。直到9月,其他所有模型的更新都无法在Coding和复杂推理能力上超越Sonnet3.5。其coding能力提升也带来了一系列AIcoding产品的实现:Cursor作为IDE的开发体验一下子流畅了很多,甚至Websim这样在上...
年内狂揽五项第一,“字节系大模型”何以后发先至?
据悉,当时最核心的两个小组主要来自内部其他业务线:一个来自原搜索部门,负责开发语言模型;另一个则来自产品研发与工程架构部下的智能创作团队,负责图片模型的开发。大模型新部门成立之后,字节在AI大模型方面形成了“三管齐下”的策略:由TiKTok产品技术负责人朱文佳、字节ALLab(人工智能实验室)总监李航、数据-应用机器...
专访三优生物郎国竣:破除新药内卷利剑--超万亿分子库的前世今生
本质区别主要表现在三个方面。第一,分子多样性业内最全。正如前面所讲,从库的类型上看,三优生物超万亿分子库覆盖了全人单抗、共轻双抗、单域抗体、新型蛋白、多肽以及鼠抗、兔抗、驼抗、犬抗等多种类型。第二,库容量业内遥遥领先。目前,三优生物超万亿分子库的库容已超过十万亿,与第二梯队公司的库容相比,我们...
生成式人工智能的主体性问题|个体性|社会性|自主性_网易订阅
而在技术对象与人类交互的主动性方面,人们将智能系统的主体性分为被动、半主动、反应、主动、合作五个层次(www.e993.com)2024年10月18日。随着人工智能的行动能力在某些方面开始高于人类,又形成了渐进式(gradualized)和分布式(distributed)主体性概念,这进一步表达了人类与人工智能在主体性方面的复杂关系。人工智能的发展使人类主体性和人工智能的主体...
【专题研究】KD-Ensemble:基于知识蒸馏的alpha因子挖掘模型
量价数据集中只有Level-2数据集是一些人工合成的日频alpha因子,这些alpha因子主要是基于大单所构建的。整个AI量价模型框架分为三个部分,数据预处理、提取因子单元、因子单元动态加权。数据预处理包括对输入特征进行去极值、标准化和补充缺失值三个步骤,而提取因子单元则是通过将预处理好后的特征或者残差网络提取得到的...
2024年诺贝尔化学奖官方解读:他们通过计算和AI揭示 “蛋白质奥秘”
图1.蛋白质可以由几十个到几千个氨基酸组成。一串串氨基酸折叠成三维结构,对蛋白质的功能起着决定性作用。(来源:ohanJarnestad)随后,研究人员主要使用X射线晶体学(通常需要付出大量努力)成功制作了约20万种不同蛋白质的图像,这为2024年诺贝尔化学奖奠定了基础。
生成式人工智能信息内容审核机制构建研究
生成式人工智能分层业态突破明显,区分于原有的法律主体界分,基于前述“基础模型—专业模型—服务应用”的三个层次划分,技术变迁突破了法律的底层设定。生成式人工智能的底层通用能力直接打破了网络服务提供者和信息内容生产者二者互相独立的局面,将技术支持者与前两者相互融合,三者功能的融为一体意味着大模型既可以为...
做好“数字金融”,大模型大有可为
《生成式AI大模型:赋能金融业变革》邀请中国工商银行、清华大学、中国工程院、中国证监会等产、学、研领域的十余位权威专家,对金融领域大模型的技术、应用、合规、监管等方面进行深入阐释,力图共同构建更强大、安全、可靠的金融垂直领域基础模型,切实为经济高质量发展提供助力。