中国移动李允博:智能光网络将构建智算中心坚实基座

2024-07-19 08:17:00 - C114通信网

C114讯7月19日消息(九九)昨日下午,“2024中国高质量发展论坛”的第六场线上论坛——“智能光网络技术专场”顺利举行。论坛邀请来自产业界及学术界的多位重磅嘉宾,围绕智算时代下光网络的架构和关键技术,AI大模型在DCN和DCI等多种场景中的应用实践,光网络通感一体/光算一体等热点话题,进行深入探讨。 

会上,中国移动研究院基础网络技术研究所主任研究员李允博应邀作了题为《智算时代下智能光网络技术发展与探讨》的主题演讲。

中国移动李允博:智能光网络将构建智算中心坚实基座

李允博表示,人工智能与光网络自身发展相得益彰,光网络是实现人工智能代际跃迁的关键基础技术,而人工智能促进光网络功能更加强大、性能更加先进,增强其为上层业务的服务能力。作为AI算力的运力载体,智能光网络将构建智算中心内外高可靠、大带宽、低时延、跨域协同的坚实基座。

面向算力网络业务:光通信呈现四大发展趋势

李允博指出,面向算力网络业务发展,光通信并存“理论研究全局化、非线性化”、“传输系统宽带化、多维化”、“光连接多元化、立体化”、“光网络孪生化、智能化”四大发展趋势。

面对光纤的非线性香农极限,可以考虑采用新的颠覆性空心光纤来降低光纤的非线性;从现有的C波段L波段进一步扩展到S波段U波段,提升整个光纤的传输容量;将光连接向下沉至单个芯片,向上提升至新激光通信,实现光连接技术向立体架构进行延伸;同时,随着光网络规模的不断扩大,可以利用光网络数字孪生构建起自愈自优动态智慧的光网络。

面向未来技术演进,在系统层面,面向800G核心器件的高速化和宽幅化方向进行研究,包括更高波特率的相关功能模块的技术攻关,更宽谱光纤放大器的研制,更宽谱光合分波器的的研制。在物理层面,在推动反谐振空心光纤的技术不断前进,

中国移动首先实现了空心光纤(极小物理量)非线性系数的上限测定,首次开发光纤的方向性独立自由维度,提出光纤同频同时全双工无损传输理论;现网铺设首条800G空芯光纤传输技术试验网,20km同频同时全双工128Tb/s超大容量,实现空-空光纤熔接损耗低至0.05dB、空-实光纤小于0.3dB和铺设后光缆损耗小于0.6dB/km。

AI赋能光网络:数字孪生技术成为关键

李允博表示,随着新业务和新技术的蓬勃发展,网络规模呈指数级增长。新兴网络服务对基础光网络提出了更高要求,迫切需要推进传送网数智化转型,实现光网络运维提质增效,满足用户极致体验追求。“我们面临着组网技术差异大,模拟信号感知难,实施检测要求高的需求,需要探讨引入人工智能去提升光网络的运维效率。”

李允博介绍,面向光网络现状和数字孪生主要功能特点,中国移动设计光网络孪生总体架构,提出跨层、跨域、跨界技术理念,以及云管端协同训练、层次化多协议协同、模块化系统设计等技术架构思路。在跨层方面,通过光层OAM拉通光电协同感知调度;跨越方面,通过统一标准Telemetry实现数据同步;跨界方面,则引入层次化智能检测和决策,实现联动算力与网络。同时,中国移动综合运用云管端协同训练,层次化协议协同和模块化系统设计等关键技术,来提高整个数字孪生光网络泛化能力、高效感知和网络技术的平滑演进。

在AI赋能光网络实践方面,中国移动创新同沟同缆检测、健康度预测、智能规划、故障监测、性能余量评估、智能调优等技术方案。比如在光纤同沟风险深度识别领域,可以做到实时感知光纤静态特征参量(长度、衰减、熔接点)和动态特征(车辆、施工等引发的振动)参量,全程免人工参,同缆整体识别准确率97.7%。

四大技术突破点:智算中心组网重要性凸显

智算中心是AI算力的物理载体,主要由GPU服务器联网构成的智算中心需要完全不同的网络架构。作为承载上层智算业务的重要基础设施,在AI时代,光网络也应该与时俱进。

李允博指出,人工智能自身的发展离不开光网络提供的有效保障。在智算中心的发展过程当中,光模块、光纤、业务调度、智算拉远都离不开光通信。光模块需要进一步降低功耗、降低时延、提高可靠性;通过引入新的光纤,可以进一步降低数据中心内部和数据中心之间业务传输的时延;通过引入光交叉则可以进一步提升数据中心内部业务调度的灵活性,并可以通过隔离故障点的方式,提高数据中心内部服务器的可用性。

在高速光模块方面,速率正在从400G到800G乃至1.6Tbps演进,中国移动协同业界积极推动标准发展,联合攻关高速EML、硅光等多种关键技术,促进AIGC大模型等新型应用繁荣发展。在智算中心内部,传统的基于纯电交叉的交换机面临着扩容的瓶颈,同时也要面临着100G/400G/800G混合组网的现实,基于端口级的光交叉技术,它可以实现低时延、低功耗的交叉调度和混合组网,同时它还具备拓扑重构、按需扩展、冗余保护的特性,可以实现数据中心内部更高效率更可靠的业务调拨能力。

另外,随着智算中心规模的不断扩大,从万卡集群走向10万卡集群,在电力供应、机房空间等方面面临新瓶颈,而通过网络能力可换取更大的集群规模,同时可以整合算力资源孤岛。李允博表示,当前应重点解决园区跨机楼互联和同城多局址互联问题,满足十万卡建设需求;同时加快跨省多节点互联技术研究和验证,满足未来3-5年潜在的超十万卡组网需求。目前,中国移动已经完成2/10/20/40/60/80/100公里OTN承载分布式智算试验,正在联合产学研、多专业协同进一步攻关千公里级智算拉远关键技术。

今日热搜