1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

2024-10-11 09:18:41 - 芯智讯

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

当地时间10月9日,处理器大厂AMD在美国旧金山举行的AdvancingAI活动期间,正式发布了最新的InstinctMI325XAIGPU加速器,该加速器配备256GBHBM3e内存,而明年的MI355X则将配备288GBHBM内存。

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

在介绍MI325X之前,AMD介绍了整个Instinct平台的成绩,该平台已获得世界顶级AI公司的支持,并被Meta、OpenAI和Microsoft等一些头部品牌厂商采用。

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

据称AMD的MI300X在一系列特定于AI的工作负载中比NVIDIAH100的性能提高了30%。AMD在其ROCm套件中增加的工作有助于从旗舰加速器中获得更多性能,但现在是时候构建具有相同强大软件支持的更好硬件了。

AMD表示,其致力于性能领先、轻松迁移、开放式生态系统和以客户为中心的产品组合,这为领先的OEM和云合作伙伴提供了大力支持。因此,随着行业中的AI需求增长到无与伦比的高度,AMD加快了其下一代解决方案的推出。

AMDMI325X:256GBHBM3e和CDNA3架构,1530亿个晶体管

全新的MI325X加速器建立在与MI300X相同的基本设计和架构之上,使用了CDNA3GPU架构,MI325X可以看作是中期升级,提供256GB的HBM3e内存,基于16-Hi堆栈制成,内存带宽高达6TB/s,FP8性能达2.6PFLOP,FP16性能为1.3PFLOP。所有这些都封装在一个芯片中,总共拥有1530亿个晶体管。

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

AMD预计InstinctMI325XAIGPU将于2024年第四季度开始首批生产,并从2025年第一季度开始通过领先的合作伙伴提供相应的服务器解决方案。

全新的基于MI325X的AIInstinct服务器将具有多达8个MI325X配置,具有高达2TB的HBM3e内存、896GB/s的无限结构带宽、48TB/s的内存带宽、20.8PFLOPs的FP8和10.4PFLOPs的FP16性能。每个GPU也配置为1000W,这比MI300X的750-700W配置有了很大的提升。

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

AMD声称InstinctMI325XAIGPU加速器在Mixtral8x7B中应该比NVIDIAH200快40%,在Mistral7B中快30%,在MetaLlama3.170BLLM中快20%。

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

与Llama3.1405B中的H200HGXAI平台相比,8xMI325X平台的性能也将提高40%,在70B推理测试中的性能提高20%。在AI训练方面,8xMI325X平台将提供与8xH200平台相似或10%的性能提升。

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

AMDMI355X:3nm制程,配备288GBHBM3e和CDNA4架构

明年,AMD还计划推出全新的InstinctMI355XGPU加速器,该加速器将针对AI工作负载,该加速器将使用3nm工艺节点构建。GPU将采用CDNA4架构。在规格方面,内存将升级到更高的容量,最高可达288GBHBM3e,同时支持FP4/FP6数据类型。

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

AMD表示,CDNA4架构的性能比CDNA3高出35倍,AI计算增加了7倍,内存容量/带宽增加了50%,并且还配备了最新的网络效率进步。

在性能方面,AMDInstinctMI355XAIGPU将提供高达2.3PFLOP的FP16性能,比MI325X高80%,而FP8数据也比MI325X高80%,达到4.6PFLOPS。新的FP6和FP4计算性能额定为9.2PFLOPS。

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

MI355X的内存容量和内存带宽将增加50%,速度比当前一代MI300X高出8TB/s。

首款采用八个MI355XGPU的平台将于2025年下半年上市,并提供高达2.3TB的HBM3E内存容量和64TB/s带宽、18.5PFLOPs的FP16、37PFLOPs的FP8和74PFLOPs的FP6/FP4计算。

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

ROCm6.2继续为Instinct提升AI性能

回到软件方面,AMD宣布推出其最新的ROCm6.2生态系统,该生态系统在推理中的一系列AI工作负载中实现了2.4倍和2.8倍的平均性能提升,训练性能平均提高了2.4倍。

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

最后,AMD仍在确认其InstinctMI400,该芯片于2026年作为“CDNANext”部分发布,但没有使用最近披露的UDNA架构名称。也许现在使用UDNA命名还为时过早。

1530亿晶体管!AMD MI325X发布:比英伟达H200快40%!

话虽如此,AMD似乎将通过未来的Instinct产品全力以赴,与NVIDIA等公司展开激烈竞争,并与一直在努力赶上其他公司的英特尔展开竞争。

编译:芯智讯-浪客剑 来源:wccftech

今日热搜