时隔6年!第二代Versal自适应SoC发布:标量算力提高10倍,每瓦TOPS提升3倍!

2024-04-12 10:06:11 - 芯智讯

北京时间4月9日,AMD宣布扩展AMDVersal™自适应片上系统(SoC)产品组合,正式推出了全新第二代Versal自适应SoC,包括第二代VersalAIEdge系列和第二代VersalPrime系列自适应SoC,其将预处理、AI推理与后处理集成于单器件中,能够为AI驱动型嵌入式系统提供端到端加速。主要面向汽车、工业等领域的对于高性能、高灵活性、低时延等方面的需求。

时隔6年!第二代Versal自适应SoC发布:标量算力提高10倍,每瓦TOPS提升3倍!

需要指出的是,第一代Versal自适应SoC是由FPGA大厂赛灵思(Xilinx)在2018年10月正式发布的。不过,在2020年10月,AMD宣布以当时价值约350亿美元的全股票交易收购赛灵思,直到2022年2月,收购正式完成,最终交易价值大约498亿美元。在对于赛赛灵思的收购整合完成之后,AMD才开始陆续推出相关的FPGA新产品。这或许也解释了为何在第一代Versal自适应SoC推出近6年之后,才迎来第二代的Versal自适应SoC。

这些第二代Versal系列产品组合中的首批器件以第一代为基础进行构建,具备强大的全新AI引擎,预计每瓦TOPS较之初代VersalAIEdge系列器件提升至多2倍,同时全新高性能集成ArmCPU预计可提供比第一代VersalAIEdge和VersalPrime系列器件至高10倍的标量算力。

AMD高级副总裁兼自适应和嵌入式计算事业部总经理SalilRaje表示:“对人工智能化嵌入式应用的需求正呈爆炸式增长,并带动了对能在嵌入式系统的功耗和占板面积限制内实现最高效端到端加速的单芯片解决方案的需求。依托于40余年来自适应计算的领先地位,这些最新一代Versal器件将多个计算引擎集成于一个架构之上,将提供高计算效率与性能以及从低端到高端的可扩展性。”

时隔6年!第二代Versal自适应SoC发布:标量算力提高10倍,每瓦TOPS提升3倍!

第二代Versal系列器件平衡了性能、功耗、占板面积以及先进的功能安全与信息安全,其提供的全新功能与特性支持为汽车、工业、视觉、医疗、广播与专业音视频市场设计高性能边缘优化型产品。

根据AMD公布的数据显示,在面向汽车的L2+/L3ADAS应用方面,第二代AIEdge系列器件的图像处理能力相比上代产品提升了4倍;在面向智慧城市应用方面,基于第二代AIEdge系列器件的边缘AI设备相比上一代缩小了30%的占板面积,并且可以支持两倍的视频流处理。这也意味着每条视频流的占板面积缩小了约65%;在面向多端口视频编码与流媒体处理方面,第二代VersalPrime系列自适应SoC相比ZynqMOSoC带来了2倍的视频处理器能力,每路视频流占板面积缩小了35%。

时隔6年!第二代Versal自适应SoC发布:标量算力提高10倍,每瓦TOPS提升3倍!

第二代 VersalAIEdge 系列

为了满足现实系统的复杂处理需求,AMD第二代VersalAIEdge系列器件采用最优处理器组合,能为AI驱动型嵌入式系统的全部三个阶段进行加速:

时隔6年!第二代Versal自适应SoC发布:标量算力提高10倍,每瓦TOPS提升3倍!

预处理:FPGA可编程逻辑架构用于实时处理,卓越的灵活性可连接各种传感器并实现高吞吐量、低时延数据处理工作流程;

时隔6年!第二代Versal自适应SoC发布:标量算力提高10倍,每瓦TOPS提升3倍!

时隔6年!第二代Versal自适应SoC发布:标量算力提高10倍,每瓦TOPS提升3倍!

AI推理:矢量处理器阵列构成下一代AI引擎,可实现高效AI推理;

后处理:ArmCPU内核为安全关键型应用提供了复杂决策与控制所需的后处理能力。

具体来说,相比上一代VersalAI系列来说,第二代VersalAIEdge系列升级内部的CPU核心,由原来的ArmCortex-A72升级为了专门面向汽车和工业的高性能CPU内核Cortex-78AE,支持2核到8核可选,可以根据需要来说进行配比平衡来。并且将ArmCortex-R5实时处理器升级为了Cortex-R52实时处理器,最高支持10核,进一步提升了实时处理器能力。另外,还加入了ArmMaliG78AEGPU,进一步提升了图形处理方面的能力。在可编程逻辑核心方面也进行了加强,可实现了灵活的实时预处理。

时隔6年!第二代Versal自适应SoC发布:标量算力提高10倍,每瓦TOPS提升3倍!

第二代VersalAIEdge系列升还升级了全新的AI引擎,在AI推理性能方面,达到了上代的2倍每瓦TOPS性能提升。在支持的数据类型方面,全新提供对FP8、FP16、MX6、MX9数据类型的原生支持。并且还支持数字信号处理(FIR、FFT等)、视觉以及其他推理以外的附加功能。

时隔6年!第二代Versal自适应SoC发布:标量算力提高10倍,每瓦TOPS提升3倍!

时隔6年!第二代Versal自适应SoC发布:标量算力提高10倍,每瓦TOPS提升3倍!

特别需要指出的是,第二代VersalAIEdge系列直接将控制器集成到了SoC内部,在单个器件中实现了端到端的嵌入式系统加速,提升了集成度,降低了时延。增强的功能安全性,也减少了对于外部安全微控制器的需求。

时隔6年!第二代Versal自适应SoC发布:标量算力提高10倍,每瓦TOPS提升3倍!

综合来看,这种单芯片智能性消除了构建多芯片处理解决方案的需求,进而带来了更小、更高效的嵌入式AI系统,并为缩短上市时间提供了潜能。

第二代 VersalPrime 系列

相对于第二代VersalAI系列来说,第二代VersalPrime系列最大的不同就是没有了AI内核,将面向传感器处理的可编程逻辑与高性能嵌入式ArmCPU相结合,能够为传统的非AI嵌入式系统提供端到端加速。这些器件旨在提供较之初代至高10倍的标量算力,可以高效地执行传感器处理和复杂的标量工作负载。

时隔6年!第二代Versal自适应SoC发布:标量算力提高10倍,每瓦TOPS提升3倍!

凭借针对高吞吐量视频处理(包括至高8K的多通道工作流程)的全新硬IP,第二代VersalPrime器件非常适合超高清(UHD)视频流与录制、工业PC等应用。

广泛且可扩展的产品组合

第二代VersalAIEdge系列与第二代VersalPrime系列产品组合为AI驱动型系统提供了从边缘传感器到中央计算的可扩展性。其以一系列具备不断增加的AI和自适应算力的器件为特色,支持客户选择性能、功耗以及占板面积,以高效实现应用性能与安全目标。

简化设计周期

AMDVivado™ 设计套件工具及库有助于为嵌入式硬件系统开发人员提升生产力并简化设计周期,从而缩短编译时间与提升结果质量。对于嵌入式软件开发人员,AMDVitis™统一软件平台支持在用户首选的抽象级别进行嵌入式软件、信号处理和AI设计开发,无需具备FPGA经验。

时隔6年!第二代Versal自适应SoC发布:标量算力提高10倍,每瓦TOPS提升3倍!

设计人员可以由现已推出的AMD第二代VersalAIEdge系列和第二代VersalPrime系列早期访问文档、以及第一代Versal评估套件与设计工具入手。

时隔6年!第二代Versal自适应SoC发布:标量算力提高10倍,每瓦TOPS提升3倍!

AMD预计于2025年上半年提供第二代Versal系列芯片样片,随后于2025年年中提供评估套件及系统模块(SOM)样品,并预计于2025年末提供量产芯片。

时隔6年!第二代Versal自适应SoC发布:标量算力提高10倍,每瓦TOPS提升3倍!

值得一提的是,斯巴鲁公司已选择第二代VersalAIEdge系列用于公司的下一代高级驾驶员辅助系统(ADAS)视觉系统,该系统名为EyeSight。

编辑:芯智讯-浪客剑

今日热搜