新V观海外：英伟达Blackwell GPU推动AI模型迈向10万亿参数级别

2024-04-01 10:08:00 - 中国经济观察网

陈沛/文英伟达在GTC24大会上发布了新一代GPU架构Blackwell。在单芯片性能上，Blackwell比当前主流的H100在FP8精度的训练性能上提升了2.5倍，在FP4精度的推理性能上提升了5倍。

在现场演示中，英伟达则是重点介绍了由2块BlackwellGPU加上1块GraceCPU堆叠形成的GB200大芯片，以及由72块GB200GPU和36块CPU组成的GB200NVL72液冷单机架解决方案，能够直接满足上万亿参数规模大模型的训练和推理需求。

要知道，当年开始涌现语言理解能力的GPT-3模型有1750亿参数，而如今最领先的GPT-4模型被认为有1.8万亿参数。因此可以设想，随着Blackwell到今年年底前逐步开始交付这段时期，10万亿参数以上的下一代AI模型或将很快落地。

到2025年后，英伟达或许还会继续发布下一代GPU架构R100，继续提速GPU架构的升级节奏。与此同时，AI学术界还在持续提出模型量化、数据压缩、剪枝等优化模型算法的前沿研究成果，未来几年AI的发展不会减速。

实际上，回顾过去十多年AI领域的变化，从2012年前后深度学习受到重视以来，预训练模型的基础架构经历了几次转变，提升AI模型性能的核心驱动力也几经转变。

从我最近看到Epoch等研究机构最新的研究结果来看，模型达到一定性能的算力需求每过8个月就会减半，这种算法优化的速度在过去十年间带动模型性能累计提升了2.2万倍。

而在2017年引入Transformer架构并成为主流基础模型以来，计算资源的增加则累计带动模型性能增加了100万倍，成为模型性能提升的最主要因素。

虽然这项研究在计算特定算法创新的收益、数据质量的可用性、模型性能评估的偏差等方面还存在一些局限性，但并不影响我们从整体上理解算法优化和算力提升在增强AI模型性能过程中所发挥的作用。

总而言之，算法优化的速度确实令人印象深刻，但算力规模的升级才是近年来AI模型性能提升背后更为重要的推手。因此，英伟达引领的AI芯片算力升级，必将成为推动10万亿参数模型落地的核心驱动因素。

在算力增长的预期下，我们可以期待AI模型在未来几年仍将继续以惊人的速度发展。10万亿参数模型的出现不仅会为我们带来更加智能的使用体验，还将在日常办公、专业写作、产品开发、视觉设计等工作任务中超过普通用户的水平，甚至在不久的将来能取代专业用户的作用，成为不可或缺的超级智能工具。

新V观海外：英伟达Blackwell GPU推动AI模型迈向10万亿参数级别

今日热搜

重庆姐弟坠楼案孩子生母卖甜品

每100个中国人就有1人专职网络主播

公安网安：虚构寻人启事？罚

支持为二孩家庭增加保障住房面积

朝鲜明确韩国为敌对国家

长沙自建房倒塌54死事故15人获刑

爸爸偷偷买花蛤撒海滩上让女儿捡

00后贷款10万炒股倒赔7000元

“世界上最神秘的鸟”现身哀牢山

车臣领导人称有人想暗杀他 克宫回应

俞敏洪卸任莱特兄弟公司董事

国企劝人回来上班：擅自离岗16年

山西孝义回应严禁学生玩Cosplay

中国原子弹之母隐姓埋名30年

步步高被申请破产

金字塔顶端发现一条狗

多家品牌撤掉易建联相关内容

官方：新增改造100万套城中村危旧房

网红偷拍直播情侣亲昵、过安检

李佳琦拿下淘宝双11首日销冠

2024年飞天茅台原箱跌至2305元

百岁姐姐看望94岁妹妹上演极限拉扯

69岁杜梓被逮捕

中方回应互不首先使用核武器条约

多家企业回应某境外公司非法测绘

女子摔倒鲨鱼夹碎裂扎入头部

大冰说这波流量无缘承接

住建部：中国房地产市场已开始筑底

12岁女孩离家出走社交账号仍在更新

李大霄：慢牛或重启

多个常年闲置的高铁站密集重启

法媒称姆巴佩与女子自愿发生关系

管理方回应上海徐汇滨江频现异宠

智能门锁“咬人”事件频发

石破茂向靖国神社供奉祭品

年底将有450万人住进保障性住房

新手女司机夜间高速逆行

端牢“中国饭碗”底气十足

台禁止输入大陆产黄飞红花生

唢呐女博士法国吹奏百鸟朝凤惊艳四座

网红小英送养孩子属实 不构成犯罪

司机接奇怪订单：有人要我送一箱钱

教材有46个收费二维码？出版社回应

官方回应卫星整流罩残骸坠落

将商品住房项目贷款全部纳入白名单

许家印前妻近3亿美元房产或遭拍卖

青海一卫健局建18个工作群被通报

特朗普竞选集会跳舞39分钟

伍佰回应被叶珂吐槽歌猥琐

黄圣依杨子 2个人8人群

车臣领导人称有人想暗杀他克宫回应

网红小英送养孩子属实不构成犯罪