算力产业规模指数级增长,国内生态的寻路与突破
21世纪经济报道记者骆轶琪郑州报道 AI大模型的持续竞速发展,让当前国内算力需求紧俏行情延续。但目前国内AI芯片呈现小而散的状态,彼此之间采用不同的软件生态和硬件架构,使得形成良好协同的算力体系仍面临一定困难。
2024中国算力大会期间,推动计算生态软硬件协同、探索异构计算能力互联、推动大模型相关应用落地等成为热议话题。业界普遍认为,只有保持充分的开放态度、同时推动应用层面商业化闭环,方能在面临外部市场压力的条件下,推动国内计算生态进一步完善。
算力飞速发展的另一面,是应用场景和绿色发展的重要性凸显。工业和信息化部总工程师赵志国表示,如今全国算力中心平均电能利用效率(PUE)降至1.47,创建国家绿色数据中心246个;工业、教育、医疗、能源等多个领域算力应用项目超过1.3万个。
他强调,构建适应中国式现代化发展需要的算力产业体系,要强化规划设计,统筹好“量的增长”和“质的提升”;强化创新驱动,统筹好技术创新和产业创新;强化应用培育,统筹好“化点成珠”和“串珠成链”;强化安全保障,统筹好高质量发展和高水平安全。
智算产业迅猛成长
在生成式AI浪潮下,全球主要市场都在积极发力算力体系建设。
大会上,中国信息通信研究院发布了《中国综合算力指数(2024年)》,其中显示,截至2023年底,全球算力基础设施总规模达到910EFLOPS(FP32),同比增长40%;其中,美国、中国算力基础设施规模位列前两名,算力占比分别为32%、26%,排在后面的分别是日本5%、德国4%、英国3%、加拿大3%,全球超过70%的算力集中在上述六个国家。
紫光股份董事长、新华三集团总裁兼CEO于英涛分析道,智算已经成为全球科技角逐的主赛道。根据第三方机构统计,全球对生成式人工智能相关私人投资在2023年达到252.3亿美元,同比增长接近10倍。国内市场方面,预计在2024—2027年间,中国智能算力规模将急剧增长,从2024年约497.1EFLOPS增长到2027年的1117.4EFLOPS。
这显示出我国智算技术不断突破、算网融合稳步推进,为AIGC产业高质量发展奠定了良好的基础。
算力基础设施主要包括算力、存力和运力三方面。前述指数报告显示,截至2024年6月,我国在用算力中心超过830万标准机架,算力规模达246EFLOPS(FP32),智算同比增速超过65%。我国算力结构不断调整,智算规模增长势头强劲。
存力方面,截至2023年底,我国存力规模达到约1200EB,同比增加20%;先进存储容量占比超过25%,同比增加20%。
运力主要指传输层面,全国58.3%的在用算力中心连接骨干网,其中大型、超大型算力中心连接比例为45%,规划在建算力中心预计有64%连接骨干网。从算力枢纽的连接效率看,各枢纽均已基本形成覆盖全国大部分省市的20ms时延圈,以及覆盖周边省市的5ms时延圈。60%以上省市可5ms到达至少1个算力枢纽集群,所有省份(包括西藏、新疆等)均可20ms接入多个算力枢纽集群。
在基础设施持续推进过程中,AI大模型的演进也到了新阶段。
OpenAI近日发布被称为“草莓”的GPT-O1备受热议。APUS董事长兼CEO李涛分析,目前人工智能发展有两大趋势:GPT-O1的出现让人工智能从有人类反馈和参与的强化机器学习,转向大模型自我对弈的强化学习,这让大模型可以自我训练和成长;由此让“AIforScience”的落地初露端倪,AI进入物理世界的可能性大幅提高。“当前最重要就是让人工智能进入千行百业,建设人工智能应用和生态建设,GPT-O1将带动经济增长并创造新的就业机会。”
推进软硬生态聚合
在智算产业基座方面,国内生态体系还面临外部环境挑战、内部生态相对碎片化的现状,要在此基础上完善计算生态能力,并推动大模型相关应用以更低成本的方式落地,仍有不少需要优化的方面。其中,“开放”是不少业者提到的重要命题。
仅在AI芯片方面,不同于海外市场主要以英伟达提供统一的硬件架构和软件适配生态,国内AI芯片企业众多,且采取了不同的发展路线:有强调“兼容”海外生态体系者,也有强调“自主”、自建指令集和生态者。由此二者面临的挑战各不相同:前者容易遭遇外部不确定性风险,后者则面临短期发展相对聚焦、生态扩容较慢的现状。
中国信息通信研究院院长余晓晖就指出,要加快软硬件产业协同,打造开放兼容的智能计算体系。
“中国目前有几十种自己的计算芯片,做了大量创新。但中国算力芯片生态比较碎片化,是很大的挑战。”他分析道,此外算力的需求和供给还面临错位、无法精准适配的现状,因此让算力互联成网是下一步要推动的重要工作。
由此在跨体系应用适配迁移方面,要加强智能计算软硬件协同。在多芯混合多架构组网方面,要推动不同架构芯片加速卡间、机间、集群间高效的互联互通,实现算力效能最大化。在超大规模算力集群构建方面,应打造更高效的算力集群,提升集群使用效率、稳定性,实现超大规模组网。
同时,算力指数级增长对能源也带来较大挑战,让算力和电力统筹协调,是未来国内重要的发展方向。
于英涛则强调,创新、开拓不能闭门造车,而要积极鼓励与国产芯片公司合作的同时,继续秉持开放的国际视野。
在软硬件计算芯片基础设施建设之外,如何完善算力能力的商业化闭环、如何实现投资回报也不可忽视。
河南投资集团总经理朱红兵分析,当前算力产业发展还面临一些困惑,包括场景端需求、国产GPU供应、算力人才三个维度。
他指出,在需求方面,以化工、能源、制造、交通运输、物流等为代表的场景类实体企业算力应用,大多停留在尝试阶段,前期投入大、降本增效不明显,企业投入积极性不高。同时模型开发企业与场景类企业对接不畅、协同不足,导致场景价值无法释放,模型能力无人买单、模型开发企业生存困难,相关算力需求减少,导致算力的价格不升反降。
而目前我国数字产业人才总体缺口约3000万,其中AI人才缺口400万人以上,且在持续扩大。算力人才培养落后于产业实践,基础人才储备相对薄弱,既懂算法又懂产业、有实践经验的高层次算力人才严重短缺,无法有效支撑行业发展。
于英涛坦言,除了软硬件的发展完善外,国内目前在算力方面的投资略有超前发展的态势。因此,防止算力基础设施被空置,以及投资回报如何实现,是必须关心的话题。此外,要让算力中心实现商业闭环,要将其落实到应用层面,让算力真正服务于百行百业。