刘韵洁院士:如何缝合算力与网络两张皮
转自:中国科学报
文|刘韵洁(中国工程院院士)
中国算力发展遇上“东数西算”工程,大家都在谈论算力网。但当前,算力与网络并未融合,无法提供“算力网络服务”。我认为,只有建设“确定性网络”才能保障算力网的健康发展。
算力网络的“确定性”挑战
建设确定性网络的挑战,可简要提炼如下:
第一是实时性的挑战。目前互联网几乎没有实时性能力,但不论是工业控制、能源,还是电力,都对网络实时性提出了确定性指标,如时延指标、抖动指标。如果这些领域的网络确定性问题得不到解决,算力网是根本没法实现的。
第二是带宽的挑战。FAST每天产生的数据大概有2000多TB,散裂中子源每天产生的数据有600多TB,这么大量的数据,每天要与全球网络共享,网络的带宽不确定直接导致传输效率低下。
第三是算力成网的挑战。现在的算力网是“烟囱化”的算力,相互独立,缺乏感知和调度,算力利用率低,这使得大家使用算力的成本增加。
未来的算力应该都是易用的,就像水、电一样即取即用,这也是算力网的愿景。
但从以上几点来看,算力和网络还是“两张皮”。这背后需要大带宽、低时延、低抖动、高可靠的“确定性网络”为支撑,需要确定性的算力网做基础。
如何解决上述问题,使算力与网络深度融合,无疑是一个非常大的挑战。
这已不是人们第一次面对确定性网络的命题。但为何现在还没有解决?因为难。要满足人们对算力网络大带宽、低时延、零丢包等的需求,就好比在一条普通的马路上,突然要建一段高速公路甚至高铁。
我们目前使用的互联网就好比一条“普通马路”,时延抖动难以控制。而确定性网络则是利用新技术构建的“信息高铁”,是完全畅通的一条路,时延抖动是可定制的,可按用户需要提供服务,如此方能有效解决工业制造、能源、元宇宙等应用的精准控制问题。
确定性网络的实践探索
我认为,确定性网络是我国数字经济最重要的基础之一,远程医疗、交通系统、交易系统等应用场景,如果没有确定性网络做支撑,其既定的产业愿景就难以很好地实现。
为了解决这一问题,我们(未来网络团队)不断探索,并取得了一些成果。
首先,针对当前互联网从“消费型”向“生产型”的转变需求,我们提出了服务定制网络(SCN)技术体系,解决网络架构问题。SCN包括“新型网络承载”“网络操作系统”与“云网超融合”三大平面,具有支撑产业互联网发展所需的智能、安全、可定制等特性。
其次,我们发展了用确定性网络操作系统进行全网调度。未来网络承担了国家大科学装置——未来网络试验设施(CENI)的建设工作。CENI是我国通信与信息领域首个大科学工程,将建成一个开放、易使用、可持续发展的大规模通用试验设施,为研究新型网络体系架构提供简单、高效、低成本的试验验证环境。
基于全新的网络架构,CENI已具备按需定制服务能力、确定性服务能力、多云互联服务能力、智驱安全防护能力四大关键能力,能够为企业提供低时延、低抖动、高可靠网络接入服务,更好满足产业互联网对网络性能的苛刻要求。
目前,依托未来网络的确定性网络技术,山东已建成并运行覆盖16个地市、5600公里的全球首张确定性网络。经中国信息通信研究院测试,该确定性网络核心节点时延抖动控制在20微秒以内,主要性能指标达到国际领先水平。今年6月30日前,确定性网络2.0版升级完成。升级后,山东省16个地市,任何两个地市端到端的时延抖动都小于20微秒,而且能做到在高负载的情况下(负载92%)零丢包。
此外,在南京到贵阳的传输距离上,我们用确定性网络与非确定性网络做了对比实验,反复证明确定性网络与非确定性网络的传输差距明显。
在从南京到贵阳跨2450公里的100G试验网络中,由于传统网络存在大量的丢包与拥塞,带宽利用率不足10%,难以满足算力数据中心跨广域的无损数据传输需求;而采用新型确定性无损传输技术后,系统性解决了网络带宽、时延、丢包问题,峰值传输速率可提升至88%,达到数据中心内部无损网络传输水平。
另外,我们还构建了确定性云网的算力网操作系统,即算网的操作系统,解决了算力资源和网络资源统一调度问题。烟台和潍坊部分能源企业实验结果表明,算力速度比传统方式大概提高了75%。
确定性算力网络刚刚开始
基于确定性网络,我们开展了一些业务应用示范。
在远程医疗场景,确定性网络使手术操作跨越时空。今年2月,青岛大学附属医院副院长牛海涛团队,应用确定性网络,在济南操控一台机器人,隔空给青大附院市南院区动物实验室的实验动物猪进行了远程机器人辅助腹腔镜下肾脏切除术,用时20多分钟。整个过程网络时延不到6毫秒,创造了新纪录。
目前通过确定性网络进行远程手术,已经有了几十个成功案例。在确定性网络的保障下,远程手术中的时延、抖动都控制到了肉眼无法察觉的程度,医生操作稳定无卡顿,大大提高了手术成功率,让有需要的患者能够享受到千里之外的专家级治疗。
在济南,我们针对智慧交通系统,通过确定性算力网络采集摄像头数据,得到了一份优化调度方案,提高了16%的交通流量。
另外,我们和浪潮集团合作,利用其算力,建立矿山远程操作系统。使用确定性网络后,可实现整座矿山中矿车的无人驾驶,一个人就可以远程操作多辆矿车,减少了人力成本,提高了工作效率。
此外,确定性网络+算力,在数字孪生、元宇宙等方面也大有可为。
在中国,确定性算力网络刚刚起步,我们相信在算力网络建设方面,中国大有可为。未来,我们希望在标准体系、产业生态、原始创新等方面,与大家共同努力,开展更广泛深入的合作,让确定性算力网络从技术创新走向生产生活的方方面面。
(《中国科学报》记者赵广立根据作者在2022中国算力大会上的发言及补充材料综合整理)
《中国科学报》(2022-12-28 第3版 领域)
编辑|赵路