大模型:从拼性能到拼赋能
在政务服务场景,政务大模型持续迭代,全面覆盖4500多种标准化事项和60多种材料。????中国工业和信息化部赛迪研究院数据显示,2023年,中国生成式人工智能的企业采用率已达15%,市场规模约为14.4万亿元。截至2024年10月,科大讯飞已与各头部企业共建20多个行业大模型,覆盖300多个应用场景,均为第一。今年1月至9月,...
字节跳动大模型训练被实习生攻击!损失超千万美元
10月18日,多个微信群流传一则消息:“某头部大厂的大模型训练被实习生入侵,注入了破坏代码,导致其训练成果不可靠,可能需要重新训练。据称遭到入侵的代码注入了8000多张卡,带来的损失可能超过千万美元。”界面新闻从知情人士处获悉,该头部大厂为字节跳动。此事发生在今年6月,起因是某高校的博士在字节跳动商业化技术团...
关于AI大模型的问题 听听郑纬民院士怎么说|院士上封面
近年来,人工智能被越来越广泛地应用于诸多重要领域,AI大模型对算力的需求也产生了爆发式的增长。数据是大模型能力的核心,高质量的训练数据是大模型成功的关键之一。那么,AI大模型是如何训练而来的?我国相关研究处于何种地位?近日,长期从事高性能计算机体系结构、并行算法和系统研究的中国工程院院士、清华大学计算机科学与...
斯坦福博士图解AlphaFold 3:超多细节+可视化还原ML工程师眼中的AF3
AF3不仅预测单个蛋白质序列(AF2)或蛋白质复合物(AF-multimeter)的结构,还能预测蛋白质与其他蛋白质、核酸、小分子中的一种或多种物质的复合结构,而且仅根据序列信息。因此,前代的AF模型只需表示标准的氨基酸序列,但AF3需要引入更复杂的输入类型,因此设计了更复杂的特征表示和tokenization机制。tokenization过程会在...
媲美AF3!阿里云合作伙伴百奥几何发布新一代抗体设计生成式AI大...
与AF3相比,GeoFlow不仅能够用于抗原-抗体复合物结构预测,还能够用于抗体的从头设计和优化。对于传统AI方法来说,大分子从头设计非常困难。主要原因是难以快速采样高质量的样本,只能通过判别模型从浩瀚的分子空间中评估大量低质量样本,这个过程如同大海捞针。生成式AI的出现为大分子设计带来了革命性的机遇,给定抗原结构和...
AI大厂硬刚价格战,中小模型夹缝求生存
但另一方面,直至今日,对于大模型,特别是个人助手类产品在C端的应用仍有“伪需求”的争议,在用户新鲜感褪去后,如何让短期尝试后的用户持续付费,甚至探索出更为清晰的盈利模式,对目前仅有“高峰期不用排队”权益的Kimi来说或许是最大的挑战(www.e993.com)2024年11月27日。但至少这种站在用户视角的创新,给了其他初创企业,特别是中小模型一个很好...
2024年中国大模型能力评测发布
Baichuan4-Air适用于已经验证过的较大规模流量的场景,其效果与Baichuan4基本持平,但推理成本为Baichuan4的1%,百万Token需0.98元。此外,两款模型的响应速度相比Baichuan4,Baichuan4-Turbo首Token速度提升51%、Token流速提升73%;Baichuan4-Air的首Token速度提升77%、Token流速提升93%。
DeepSeek开源数学大模型,高中、大学定理证明新SOTA
DeepSeek-Prover-V1.5是一个70亿参数的开源模型。它通过结合强化学习(基于证明助手反馈的强化学习,RLPAF)和蒙特卡洛树搜索(特别是提出的RMaxTS变体),显著提升了证明生成的效率和准确性。DeepSeek-Prover-V1.5在Lean4的形式定理证明方面优于所有开源模型。
行业大模型落地提速释放新动力
????记者在不久前结束的2024中国国际大数据产业博览会(下称“数博会”)上发现,随着大数据和人工智能技术融合的不断演进,行业大模型继通用大模型之后,对产业的渗透率正在提高,大模型对产业的赋能正在释放新的经济增长动力。????打造新质生产力发展新引擎...
百度发布文心大模型4.0 Turbo,多端面向用户正式开放
王海峰发布了飞桨新一代框架——飞桨框架3.0,具备动静统一自动并行、编译器自动优化、大模型多硬件适配、大模型训推一体等核心技术,支撑大模型效果更好、性能更优。截至目前,飞桨文心生态已凝聚1465万名开发者,服务37万家企事业单位,创建95万个模型。王海峰表示,纵观人类经历的前三次工业革命,其核心驱动力量机械...