第三届未来网络发展大会

网络全球 决胜未来

当前位置:嘉宾致词> > 分论坛二

开放协同可控的端到端SDN网络架构与技术

编辑: 共浏览:443次

今天很高兴跟大家交流,我交流的题目不是一个新的话题,SDN话题将近10年的时间,2009年在研讨这个题目,实际上发展这么多年,我们在座很多的同事和学生都在从事网络这一方面,但是从应用需求角度,我经常碰到很多的一些合作伙伴,他们从需求角度在看这个事情的时候,其实对SDN的理解和认识逐步形成,软件定义网络我认为还有很长的生命周期,还处于一个发展的阶段。

我们来看一下,首先我想介绍一下项目的背景,这些年思考的问题,到底面向未来我们网络服务提供什么样的能力,这一次实验室成立其中谈到考虑面向2030年的技术,大家有一个很重要的共识就是互联网业务需求更多从传统尽力而为的理念、能力提供决定性,面向生产的能力,这里面我们跟很多需求方交流,确确实实发现他们提到一些问题,是我们现在网络能力所不具备的,尤其是对于网络传输的时延的问题。

我个人核心观点网络的差异性和确定性可能是非常重点的一个问题,SDN技术在这些年发展过程中通过10年的布局,我觉得经历非常多曲折的过程,有的时候他们老聊一个问题,说这些年的过程中我们有没有感觉特别困难的地方、特别困难的时候,我觉得这期间最困难的时间在2014-2016年期间,大家看到这期间是SDN最热的时候,其实是受质疑最多的时候,我们看到非常多的技术方向探讨,这个技术只能应用技术中心内,我们广域一些东西觉得不太能实现,因为有一系列的扩展性,为什么的开放性,包括涉及到生态上不同角度看待这个问题,但是无论怎么讲,这10年发展到现在来讲,处于2019年这个阶段,思想明确怎么应用的阶段。总结来看我觉得生产型场景下面,尤其是电信的网络里面,运营商骨干的控制产品里面,包含军事、专网、广电场景里面。

这种大规模情况里面还有很多挑战没有解决,我们梳理了几个数据平面白热化的趋势,这个趋势相对生态比较单一,这块做得比较快,对广域以及工业互联网OT网络里面,这块各方正在博弈,在控制平面确定性很难做,但是现在探索这样的机制,我今天也想探讨一行,编排层面已经在探讨,怎么实现集中式的端到端的控制,包括AI的控制,这些方面有很多工作要做。

大的产业角度来讲我大概梳理了一下最新的进展,从2017-2019年这个阶段,大家看到无论从(英文)社区活跃的项目还是(英文)数据平面开放的项目,还是谷歌推动数据平面开源的项目,还是ATNT考虑光传输层面定义这样动作,我们看到业界对这些事情,至少在网络的可用性,未来演进方面大家持续动脑解决这些问题。

我觉得下一步关键还是在开放性和协同控制性的角度方面增强,这里面实际上我们跟老一辈的专家和需求方聊天,他们能够理解控制面貌能力加强是很有必要的事情,其实我们的IP网络,我们管理能力也很强大,但是对于我们按需控制这些事情,其实很难有很大的手段,所以(英文)在这一块怎么面向以后更复杂的场景控制这个事情,我觉得业界应该有比较大的故事,具体怎么做呢?可能大家有不同的观念。

按照这个方向的发展探讨SDN2.0,关于这个范畴也不一样,但是我觉得至少SDN2.0相比1.0的时代争论很多,大家争论(英文),还是这些东西在不同场景用到东西很多不一样的地方,他代表一个时代,如果在下一个时代、下一个10年开放性还要持续的话,我觉得这个值得去探索的问题,包括智能网卡,这对于传统设备,对云的思想有很大的变化,包含我们控制和编排的问题,以前因为控制和编排受限于很长时间OSS、BSS的系统,但是这种编排平面大量的发展对一种跨越的东西也会带来很大的变化,包括IP和光的协同,业界持续在做但是也遇到很多困难和瓶颈,这里面我们其实也在考虑这个方面,我跟需求方探讨,他们逐渐认同这个方向,有需求能力保障的人,业务来讲是真正需要远距的时延,我们测了一些能力,从北京到南京,1000多公里,光平面固有的时延是一定的,这里面之外再整个意义上减少中间路由的数量,有一些光电混合的东西,这个方面其实有很多工作要做,包含在天地网络里面,这种光和设备的融合可能都是一些问题,按照这个理念我们正在推动的项目。

我认为未来软件定义开放、协同、可控,我们希望更深层次做到这样的能力,能够更好进行软硬件的解耦,硬件能够把专著芯片能力的提升,这个软件方面关注生态的建设,关注端到端的编排,我们希望有趋势,协同这一块我们个人认为的话,实际上希望能够做到横向和纵向的协同,其中横向希望能够从骨干网、边缘网、数据中心、智能网卡等等方面,纵向我们包括疏通层面,包括云资源一些计算存储资源业务的层面,这些资源都能够统一进行管理。确定性管理我们专家做这一块,我们希望对路径带宽进行一定程度的控制。

这是我们构想的一个结构,大家可以看到核心就是希望能够从骨干边缘数据中心横向端到端的构造,纵向实现我们刚才所说跨层的编排,这里面软件定义网络跟我们传统的七层结构所不一样的地方,我们可以看到整体的网络里面,网络的层次很多,可能有些设备是二层的,有些设备是三层,没有关系,通过数据分离,通过控制集中化的解耦我们能够达到更好的目的,在这样一个大的背景下,我们其实梳理了一系列的关键技术,比如控制平面,我们希望尤其面向大网集的产品,能够解决服务更好的定制化,我们实现异构设备控制解耦,能够解决确定性的问题,这里面包含了控制性的建模,包含单体式的结构向微服务化的演进,向更强性能的增强,包含控制层面引入机器学习的办法来解决这种路由轻量级智能的计算,还有评估的工具,在编排层面,现在已经成为具有端到端全局网络运营商不得不考虑的问题,这必须靠自己回答这个问题,因为它的网络,每个运营商的网络,每个军队的网络都是不一样的,这一块有很多编排层面的工作,有可视化的设备,我们在座有很多学生,这里面实际上也是未来业界重点的热点,也供大家做一些研究方向的选题。

在数据层面的话,我觉得最重要就是白盒化的问题,在多年操作上面做很多工作,现在要进行解耦实现,这里面有很多的问题,这个作为大的技术趋势来讲的话,怎么在更抽象、通用来讲,这是很多挑战,也是业界做的问题,包括(英文)的结果,包括有很多的争议、很多挑战,这个方面从大的趋势、从高效率包括重购的智能,还有IP的协同,这跟通讯协同的过程。我们在IP的磁化,和冷控制就很多新的进展情况服务我们更好的低时延。

智能网卡我想重点介绍一下,我们传统讲网络定义重点解决网络设备,智能网卡把这样端到端的控制拓展到服务器这一侧,实际作为未来端到端保障用户体验,这个设备控制,这个设备一体化的管理以及协议可编程值得我们进一步,这一块跟相关网络功能加速NFA直接相关,这里面是近一两年大家布局的方向,已经提了一年了,这块是非常大的蓝海,还正在发展的过程中。

我们希望通过这种方式最终构造出大家左边这个图具备端到端协同控制、分离这样一个实验的体系,能够在全网大规模场景下做实验,昨天上午刘院士发布了12个城市启动了(英文)网络,这个网络今年正式拉通了设备,我们对相关的时延进行了测试,大网环境下发现中间确实存在跟以前区域网,我们测试的时候非常多不同的问题,这里面未来的环境我们可以共同来推动刚才探讨SDN的试验。

第三个部分借这个机会汇报一下目前的进展和下一步的考虑,现在的想法我们正在推动的事情,希望在网络控制平面的基础上能够选取工业互联网的场景,这个我们目前跟富士康这次发布进行远距,跨多个园区,园区和云之间的工业互联网介入、协同制造,军民融合面向军事的骨干网场景下的一套示范系统,现在目前做这个,还有空天地海的系统,我们的核心系统昨天发布了网络操作系统,我们希望按照新的结构构建微服务的架构,提供更好的服务能力,我觉得这是一个非常重要的事情来解决远距特殊业务的能力保障。

另外一个事情现在我觉得是白盒交换设备,这个问题我们做了一个定义,我们觉得这个白盒分为两种,一种属于品牌白盒,设备的品牌厂商基于通用的白盒设备运行自己交换机的操作系统,这个可以做到非常稳定,我们这一次在昨天开放的实验网络里面用了这样一个设备,这属于品牌,另外一个按照OCP开放的价格,基于(英文)的芯片,上面再设置相应的白板系统挑战更大一些,这是下一步挑战的需求。

最后我想在这里面报告一个问题,端到端时延的挑战,这是非常难稿,我们做网络底层设计提给我们最大的挑战和需求,用户也是最关心的一个问题,我们觉得时延要考虑端到端边缘网、骨干网,考虑DC业务里面的东西,从需求导向从这几个维度综合,然后整个在这个体系里面最难,影响最大的,最难以优化是骨干网的时延,骨干网的时延包含两块,一块是我们设备的处理时延,这是要想办法优化。

另外是光传输距离的时延,然后逐段相加,首先路径是逐条可控,这里面我们需要对网络的拓扑进行规划,运营商在很多年的过程中其实都是基于以省为单位进行两级或者三级结构,面向未来的网络以云为中心构建,这个拓扑未必需要这个体系构建,拓扑成为一个问题,我们昨天CD网络充分考虑怎么构建,要形成(英文)的结构,这是脱铺这块是非常关键的。

我们目前在很多特殊场景网络构建的时候,给他们的建议也是说在拓扑构建这一块一定要考虑这个问题,另外这里面很重要的一个问题是IP的路由,包括路由的设置对我们影响也非常大,这是第一个问题。

第二个问题是设备处理时延,很显然这个方面可以用到是SDN,我们能够通过测量,能够选择路径,选择一条最有利于我们的路径,这是一个解决办法,另外我们在每条路径定义优先级,这套希望在总体的控制里面实现,光传输时延这里面需要总光的路由,光电的转化、融合做文章,在低时延我们做了一个总结,我们有这个方面去探讨。

我们要引入状态感知的能力,这个方面来实时探测我们网络的可视化,为我们最终服务测试的时延提供基础的能力,我们尽可能使核心业务链路之间直达,要减少跳水,这样才能减少转化时延,减少到云,这个光靠边缘计算分配肯定不行的。

第三个方面我们流量调度做均衡,而且这个方面做业务优先级区分,在这个方面还有很大的差距,我们怎样针对不同的业务做到这种隧道不一样,而且快速进行配置,目前运营商提供,因为复杂性其实这一点根本不做,做不了,实际上跟商业模式也有关系,但是对特殊的网络,或者是运营商网络往后演进,我个人认为这种区分非常重要,因为资源一定是有限,或者是某一个损失、某一个时间段的资源,一定是需要管理。

再就是利用队列的办法解决时延的问题,总体上我想总结,在整个业界发展领域里面,SDN技术已经有10年的历史了,中间我们取得了这样那样的成果,下一步面向新的业务需求,从控制面、数据面、编排面,这种网络体系的划分加上横向端到端,比如智能网卡到端侧,纵向物理层到业务层的拉通实现体系,有很多工作,应该是考虑大网的建设者、研发者、设计者,可以借鉴一些方法,时间关系我的报告到这,再次感谢大家。