作者:刘韵洁 来源: 发布时间:2022-11-1 22:59:8
| ||||
当中国算力发展遇上“东数西算”工程,大家都在谈论算力网络。当前,算力与网络并未融合,而两者不融合就无法提供算力网络服务。我认为,只有“确定性网络”才能保障算力网络的健康发展,而确定性网络的建设,其实也正是算力网络面临的挑战。 建设确定性算力网络的挑战,可简要提炼如下。
算力网络的确定性挑战
首先是实时性的挑战。目前互联网几乎没有实时性的能力,而不论是工业控制、能源,还是电力,都对网络实时性提出了确定性指标,如时延指标、抖动指标。如果这些领域不解决网络确定性问题,算力网络根本无法实现。 第二是带宽的挑战。500米口径球面射电望远镜(FAST)每天产生的数据大概有2000多TB,散裂中子源每天产生的数据有600多TB,这么大量的数据,每天要与全球网络共享,网络带宽的不确定直接导致传输效率低下。 第三是算力成网的挑战。现在的算力网络是“烟囱化”的算力,相互独立、缺乏感知、缺乏调度,算力利用率低,这增加了大家使用算力的成本。 将来的算力应该都是易用的,就像水电一样即取即用,这也是算力网络的愿景。但从以上几点来看,算力和网络还是“两张皮”,这背后需要大带宽、低时延、低抖动、高可靠的确定性网络作为支撑,需要确定性的算力网络做基础。 如何解决这个问题,使算力与网络深度融合,无疑是一个非常大的挑战。 这已不是人们第一次面对确定性网络的命题。早在2015年,国际互联网工程任务组(IETF)就成立了一个工作小组,专门研究广域网的确定性标准,但至今没有实现标准化。国内包括电力、工业互联网等在内的行业,也曾发布有关确定性网络的白皮书。 但为何现在还没有解决这个问题?因为很难。要满足人们对算力网络大带宽、低时延、零丢包等的需求,就好比在一条普通的马路上,突然要开辟出一段高速公路甚至高铁轨道。 我们目前使用的互联网就好比一条普通马路,堵堵停停,时延和抖动难以控制。而确定性网络则是利用新技术构建“信息高铁”,是完全畅通的一条路,时延和抖动是可定制的,可按用户需要提供服务,如此方能有效解决工业制造、能源、元宇宙等应用的精准控制问题。
确定性网络的实践探索
我认为,确定性网络是我国数字经济最重要的基础之一,远程医疗、新能源、交通系统、交易系统等应用场景,如果没有确定性网络作支撑,其既定的产业愿景就难以很好地实现。 为了解决这些问题,我们(未来网络团队)不断探索,并取得了一些成果。 首先,针对当前互联网从“消费型”向“生产型”的转变需求,我们提出了服务定制网络(Service Customized Network,SCN)技术体系,来解决网络架构问题。SCN包括新型网络承载、网络操作系统与云网超融合三大平面,具有支撑产业互联网发展所急需的智能、安全、柔性、可定制等特性。 第二,我们发展了用确定性网络的操作系统来进行全网调度。未来网络承担了国家大科学装置——未来网络实验设施(CENI)的建设工作。CENI是我国通信与信息领域首个大科学工程,该设施于2019年启动建设,建设周期为5年,将建成一个开放、易使用、可持续发展的大规模通用试验设施,为研究新型网络体系架构提供简单、高效、低成本的试验验证环境,支撑我国网络科学与网络空间技术研究在关键设备、网络操作系统、路由控制技术、网络虚拟化技术、安全可信机制、创新业务系统等方面取得突破。 基于全新的网络架构,CENI已具备按需定制服务、确定性服务、多云互联服务、智驱安全防护四大关键能力,能够为企业提供低时延、低抖动、高可靠网络接入服务,更好地满足产业互联网对网络性能的苛刻要求。 目前,依托未来网络确定性网络技术,山东已建成并运行覆盖16个地市、5600公里的全球首张确定性网络,经中国信息通信研究院测试,该确定性网络核心节点时延抖动控制在20 微秒以内,主要性能指标达到国际领先水平。今年6月30日前,该确定性网络升级完成2.0版。升级后,山东省16个地市中,任何两个地市端到端的时延抖动都小于20微秒,而且能做到在高负载的情况下(负载92%)零丢包。 此外,在南京到贵阳的传输距离上,我们对确定性网络与非确定性网络做了对比实验,反复证明了确定性网络与非确定性网络的传输有明显差距。 在从南京到贵阳跨2450公里的100G试验网络中,由于传统网络存在大量丢包与拥塞,在网络拥塞情况下,带宽利用率不足10%,难以满足算力数据中心跨广域的无损数据传输需求;而采用新型确定性无损传输技术后,可系统性解决网络带宽、时延、丢包问题,为业务提供有确定性保障的服务,峰值传输速率可提升至88%,达到数据中心内部无损网络传输水平。
|