为“大模型”提供“蛋白质”!腾讯云发布国内性能领先的大模型算力集群

2023-04-14 15:56:26 - 上游新闻看点

国内性能领先的大模型计算集群,它来了!

当前GPT热度不减,大量模型、训练方法围绕它火速展开。如今,腾讯云凭借强大的技术流,正为“大模型”提供集群算力。可以说,假如大模型是训练方法,那腾讯云发布的大模型计算集群就是“蛋白粉“,为其提供源源不断的”养分“。

就在4月14日,腾讯云正式对外了发布新一代HCC(High-PerformanceComputingCluster)高性能计算集群。该集群采用腾讯云星星海自研服务器,搭载英伟达最新代次H800GPU,服务器之间采用业界最高的3.2T超高互联带宽,为大模型训练、自动驾驶、科学计算等提供高性能、高带宽和低延迟的集群算力。

实测显示,腾讯云新一代集群的算力性能较前代提升高达3倍,是国内性能最强的大模型计算集群。

要知道,早在去年10月,腾讯就已经完成首个万亿参数的AI大模型——混元NLP大模型训练。在同等数据集下,将训练时间由50天缩短到11天。如果基于新一代集群,训练时间将进一步缩短至4天。

为“大模型”提供“蛋白质”!腾讯云发布国内性能领先的大模型算力集群

这意味着,腾讯云攻克了大集群场景下的算力损耗问题,能为大模型训练提供高性能、高带宽、低延迟的智算能力支撑。

为“大模型”提供“蛋白质”!腾讯云发布国内性能领先的大模型算力集群

领先的算力性能背后,是腾讯在云计算领域长期的技术积累,和在基础软硬件研发上的长期投入。

此前,腾讯多款自研芯片已经量产。其中,用于AI推理的紫霄芯片、用于视频转码的沧海芯片已在腾讯内部交付使用,性能指标和综合性价比显著优于业界。值得关注的是,紫霄芯片采用自研存算架构,增加片上内存容量并使用更先进的内存技术,能够消除访存能力不足制约芯片性能的问题,同时内置集成腾讯自研加速模块,减少与CPU握手等待时间。

目前,腾讯云的分布式云原生调度总规模超过1.5亿核,并提供16EFLOPS(每秒1600亿亿次浮点运算)的智算算力。

未来,新一代集群不仅能服务于大模型训练,还将在自动驾驶、科学计算、自然语言处理等场景中充分应用。以新一代集群为标志,腾讯云基于自研芯片、星星海自研服务器和分布式云操作系统遨驰,构建起了完整的自研产品体系。

今日热搜