智算需求20年增长百亿倍,这场大会信息量很大

2024-09-28 18:36:58 - 中国证券报-中证网

算力是AI时代的最底层的支撑要素,在大模型训练推理的需求推动之下,全球竞逐算力性能迭代和规模扩张。

9月28日,工业和信息化部总工程师赵志国在2024中国算力大会开幕式上介绍,全国在用算力中心机架总规模超过830万标准机架,算力总规模达246EFLOPS,位居世界前列。

智算需求20年增长百亿倍,这场大会信息量很大

与会专家也指出,当前我国算力基础设施在软硬件协同、超大规模集群构建、混合架构组网、绿色低碳转型等方面存在不少挑战,需要进一步加强技术创新,推动行业高质量发展。

我国算力总规模达到246EFLOPS

大会期间,中国信息通信研究院院长余晓晖发布《中国综合算力指数报告(2024)》。他介绍,截至2023年底,全球算力基础设施总规模达到910EFLOPS,同比增长40%。从人工智能模型角度看,过去20年间(2003年-2023年),智能算力需求大概增长超过百亿倍,构成算力增长的最主要驱动力。

全球算力规模排行榜,中美两国排在前两位。余晓晖介绍,截至2024年6月底,我国算力总规模达246EFLOPS,其中,智算同比增速超过65%。

存力方面,截至2023年底,我国存力规模达到1200EB,同比增加20%,先进存储容量占比超过25%,与去年相比增加20%。

运力方面,全国在用算力中心中,58.3%连接了骨干网;8个算力枢纽各数据中心集群间基本均可实现20毫秒的互联,各个枢纽形成了覆盖全国大部分省市的20毫秒时延圈,以及覆盖周边省市的5毫秒的时延圈。全国60%以上的省市,可5毫秒到达至少1个算力枢纽集群。

紫光股份董事长、新华三集团总裁兼CEO于英涛在演讲中表示,在“算力即国力、智能即未来”的时代背景下,智算已经成为全球高科技角逐的主要赛道。他指出:“今年,全球生成式人工智能的投资比去年增长接近10倍,我们预测2024-2027年中国算力规模会进一步急剧增长。”

在大模型领域有一个著名定律ScalingLaw(尺度定律),指模型性能会随着参数、算力、数据集的规模增加而提高。在这一定律作用之下,全球的算力中心朝着万卡规模方向演进。百度集团执行副总裁、百度智能云事业群总裁沈抖日前表示,过去一年感受到客户模型训练需求猛增,ScalingLaw的定律仍在持续,马斯克已经宣布了10万卡集群上线,“很快,就会有更多10万卡算力集群出现”。

算力大会上,河南投资集团总经理朱红兵宣布,河南将设立总规模100亿元的算力基金,通过“算力支付+基金投资”的方式,培育算力的各类应用企业,打造算力生态。目前,河南已经建成投产了240P的英伟达H800智算中心,朱红兵表示,接下来,河南将打造中部最大的万卡智算集群,明年年底实现2000P的算力供给。

算力产业发展仍存挑战

余晓晖认为,与美国相比,我国算力芯片生态比较碎片化,有几十款算力芯片,不同的芯片,对应不同的开发框架、软件栈以及算子库等。“这是一个非常大的挑战,异构算力之间的协同稳定问题亟需解决。”

他表示,万卡不等于万卡集群。“有了万卡、10万卡,不一定就能把万卡、10万卡的能力完全发挥出来,卡越多,故障的概率越高,怎么能够打造大的、稳定的算力集群,是一项全球面临的挑战,需要非常多的技术创新。”余晓晖强调。

沈抖此前也介绍,GPU算力集群有三个特征——极致规模、极致高密和极致互联,建一个万卡集群,仅仅是GPU的采购成本就高达几十亿元。沈抖表示,构建算力资源,并不是简单地买来GPU,把GPU连接上,而是需要很多技术。“比如,GPU芯片的型号更多样,管理更复杂;GPU需要执行大量并行计算;数据的传输量变大、对速度的要求更高等。”

此外,余晓晖表示,算力的需求和供给中间目前存在很多错位,不能完全精准适配,算力互联成网会是下一步需要推动的重点工作;算力中心的能耗问题愈发受到关注,未来需要将算力和电力进行统筹规划。

于英涛指出,多地针对算力基础设施赛道进行超前部署,但坦率地讲也存在一些问题。他认为,在行业热度高涨的背景下,需要给行业提一个醒,要保持“冷思考的定力”,客观测算算力需求,统筹安排智算中心布局,“小步快跑”,不断健全完善试错包容的机制,避免出现投资浪费。

他认为,相比于投资建设,算力中心的运营和管理更为重要。“算力中心,投资建设是容易的,但是算力运营模式探索和创新是更重要的话题,如何提高智算中心利用率,防止出现算力的空置、空转,保持投资的良性循环是必须解决的问题。”于英涛表示,开放、务实和应用导向是算力产业高质量发展的关键所在。

工信部:构建算力互联相关规则

赵志国表示,将从规划设计、创新驱动、应用培育、安全保障四个方面,稳步提升我国算力产业综合实力,持续提升算力的赋能成效,构建适应中国式现代化发展所需要的算力产业体系。

在规划设计方面,赵志国表示,要统筹好“量的增长”和“质的提升”。完善建设布局机制,面向重大区域发展战略制定发展规划,促进东西部算力高效互补和协同联动。完善多元配置机制,面向人工智能等新兴产业制定发展规划,建设一批智算中心,合理配置通算、智算、超算比例。完善互联互通机制,构建算力互联程序规则、市场规则、质量检测规则,推动形成以算力大市场体系服务统一大市场建设的发展格局。

在创新驱动方面,他强调,要统筹好技术创新和产业创新。加快关键核心技术攻关,推动高端芯片、架构设计、大模型算法、高速传输协议等基础软硬件技术实现更大突破,建立健全算力产业标准体系。加快创新成果产业转化,组织实施产业链强链补链行动,开展“算力强基揭榜挂帅”,建设一批可满足各类创新主体进行算力研发、验证、调度、应用的载体平台,探索形成科技创新和产业创新深度融合的发展路径。

今日热搜