2017全球未来网络发展峰会
创新合作共赢 引领未来发展
女士们、先生们:
上午好!刚才韦总做了很精彩的报告,提出未来网络是灵魂和架构的变革。我今天的题目也是讨论未来网络的问题,就是情景网络理论研究与技术实践。去年也是在这样一个峰会上,我们首次提出了在分布式网络中导入情景拟合机制这样一个创新性的概念。我想特别强调的是刚才韦总讲到的网络架构这些东西,我都赞成。但是有一点,未来网络肯定是一个分布式网络,这个是不变的。分布式网络当中存在的固有问题,如果不科普的话,所有的那些相关其他技术也都很难产生出光辉。
考虑到这个问题,我想首先我们回顾一下情景拟合网络的提出背景,这个人大家都可能很熟悉,这是互联网理论的基石,这个是保罗·巴兰,1962年他写的关于分布式通信的理论。到1969年达卡选择一个在核战争期间打不烂摧不垮的网络体系,用了保罗·巴兰的这样一个理论。这里很核心的一个想法,我们刚才看到这些东西,这边的东西都是我们传统的层级化的网络,保罗·巴兰就提出这么一个东西来,看起来像蜘蛛网的东西,分布式网络。整个现有的网络技术的基础,应该是它的理论基础就是这样一个分布式网络。在这个基础上,我们发现了三大基石,传输协议、转发方式、路由控制。从网络1.0到网络2.0到网络3.0,在这种变化过程中,我们可以看到这样的一个基石和它的三大基线技术是不断地在变化。
其实刚才韦总讲了一个很重要的问题,这个传输协议,这个东西多得不能再多了,怎么回事?那就是为了在上面堆砌这些东西,不得不在基线的层面上做添砖加瓦的事,不得不做修修补补的事。我记得一个很著名的观念,就是说这个东西能不能用,就是以用为标准,逢洞就补,逢漏就修,就是这么一个概念,所以这么多年互联网核心技术三大基线技术没有动过。我们在未来网络里面就要加一个网络构造技术,将成为未来网络的基线技术,但是原有的这些基线技术仍然在未来网络里面还是不可或缺的,只是可以把它简化,可以敏捷,可以灵活,但是是不会取消的。原因是未来的网络也是建立在分布式网络的理论基础上的。
所以我们说原有的三大基线技术构成了互联网的合成技术体系,现在是支撑互联网不断演进发展核心,也是未来网络基线技术,当然未来网络基线技术不仅仅是这个,还包括架构技术。分布式网络毫无疑问存在着两面性,第一,它是可扩展性和它的健壮性优势,这是互联网取得巨大的商业和产业成功的重要因素。但是我们也注意到,这种尽力而为的转发模式和最短路径的这种路由控制僵化的方式,无法实现基于用户体验的网络资源的全局协调控制。这个辞海里面对这个协调给了这么一个定义,叫和谐一致、配合得当。就是我们现在的网络真谈不上和谐一致、配合得当,几乎是一种堆砌行为。这种堆砌行为很大程度与这个分布式网络构造有关系,因为我们看不到全局,分布式网络看不到全局。
我们把互联网和交通系统上类比有很多相似的地方,比如我们在交通系统中有交通规则,在我们互联网里面有路由协议。在交通系统中有协调控制,我们可以看到当塞车的时候,临时措施,还会有一帮交警上路,然后指挥,超越这个红绿灯指挥。当然现在也有一个全城路口的流量控制调整,所以实时路况等等这样的一些东西。所以交通状况现在拥塞,但是比我们网络上的用户体验要好多了,原因是因为他有协调控制。而我们在互联网上看到协调控制在哪里呢?没有。实时路况情况也没有。所以我们可以看到都是路由协议,我们可以看到它们技术上的差别。
我们就在想,既然是这样一个情况,分布式网络这个是不可避免,这个分布式网络,未来网络你也是避免不了分布式网络的。我们现在在目前网络上追求最大路径,这种结果是导致流量向部分路径拥堵造成拥塞。我们只要看一下网络理论可以看到最大路径可能是最优的一个,除此之外就很难说。不追求最短路径的话怎么弄呢?它在这边的现状是这样。我们想如果把这个网络拥塞,我们能不能来进行一个全网的流量协调,全局的资源配置,然后全网流量协调,我们使这个流量分布能够趋向均衡一致,等于就是把网络这种无序的情况变成稍微有序一些。
当然我们也可以看到现在的现状,基于GCP的,我们叫增量加速急刹车的调整机制,引发了浪涌式加塞,这是在现在的流控。大家也会提到他为什么会采用这个方式呢?其实不采用这个方式?从分布式理论看来,得到这个方式是最佳的。所以我们也同样有个设想,就是如果能够对全网的流量进行协调,使跟这个流量相适应的进行适配,就不会出现这种浪涌的现象。再有一个,我们现有的端到端的保障机制,还是一个LV的机制,尽管我们也发展其他的等等的东西,但是这些东西都不是基于自动的一种方式。我们整个用户的体验感觉都不好,提速、降费,我费好像是降了一点,这个提速的感觉还不是很大。其实我知道中国电信也费了很大的劲,效果不好,用户体验不好。这种用户体验不好,是我们网络的痛点,就是未来的网络在运营商这边看到能够快速部署,但是在用户层面上你得给我QOE,否则你再好的快速部署我都不认。所以在用户体验和运营商的最佳的经济追求诉求方面,它们必须产生一种协调一致的目标。所以说如果能够对全网资源进行协调,使服务体验和资源能够配合得当,这也是提高网络服务质量,这也是我们的一个目标。
如果想做到全网感知,非集中控制不行,没有集中控制要想做全域优化似乎是不可能的。另外集中控制与互联网的基本理念相悖,我们没有人敢说未来网络是集中控制的网络,只是节点大量减少,不是这种平铺的,现在说是完全不分级的,恐怕我觉得还是要商议的。如果纯粹产生这种分布式网络的话,似乎现在是无能为力,能做的事情做了许多了,协议也不知道增加了多少了,这个路在何方?这个事情是我们一个要探讨的问题。
所以刚才韦总讲到了创新之路需要灵感,技术变革需要新机制。我们的网络里面必须导入新基因,不改善基因就不可能改变现在网络的这样一个状况。所以其中一个基因开放性、重构,架构可以重构,可以进行开放打开。但是不仅仅架构上要解决问题,用户体验还要极大提高,而用户体验的问题,是涉及到分布式网络的理论基础问题,如果这部分不突破,你就是架构打开的话,用户体验也不会怎么样。
好,于是乎我们有什么办法?既然我们未来网络还是分布式网络,我们还是要基于分布式网络基础上,能够导入什么基因,能够改善这个状况?这就是我们期待的。这里面第二个,我就讲到群集运动和情景拟合,群集运动实际上是生物运动的现象,大家注意到沙丁鱼的群集运动现象,每个鱼通过感知水流、温度等环境信息以及邻居状态,个体自主变化并最终使得群体形态发生适应性变化,既使是在遭受威胁时,仍能形成大规模有序的群集运动。这个很神奇的,沙丁鱼最大的群集运动大概有上亿条,这么大规模,特别是在受鲨鱼围攻的情况下,它仍然能保持队形,这东西怎么没出现撞船的现象?这个很奇怪,你看不到一条死鱼,这里面老弱病残都在里面,大大小小都在里头,这是一种什么神奇?我们需要生物界的灵感来启迪我们。
我们再看一下这两幅图,这个号称叫椋鸟,这个大概一群有好几百万只,它的少数个体在发现觅食地或掌握归巢迁徙路线时,亦可引导整个群集运动,它们没有撞击情况。前不久在看非洲大裂谷那个地方,发现各种大鸟小鸟一堆,大概有几亿只,起飞的时候很壮观,我没看到大鸟起飞把小鸟给拍到下面去,所有的鸟类,不同的鸟类在飞行过程中没有看到撞的,底下是有狐狸在那儿等着,没有等到,它只能在那儿跳,急得跳,没有说撞到掉下来的,不撞击。这是怎么弄的?
好,我们可以看到群集运动的特征,其实群集行为在我们科技界的研究还是很早,从它的特征个体上来说,它本质上是群体内相邻个体间的信息交互并自主变化,从而形成群体形态的变化过程。个体上具备了基本的智能属性,即感知、决策和执行能力。
刚才韦总讲到我们传统的网络理念,你说有没有感知,也有?你说有没有决策,也有,执行毫无疑问。但是它没有群集运动的这种感知、决策和执行。第二,个体资源虽然有限,智慧也有限。一个鸟有多大智慧,一个沙丁鱼有多少的智慧?肯定没有邬江兴的智慧高。但是群体依然能出现全局有序的收敛,队伍不会出现撞击、踩踏等事件。我们人坐在这儿有一百多人,如果有恐怖分子,人往外冲的时候,一定会出现踩踏。鸟类和鱼类面对攻击的时候,那种队形,那种保持镇定的能力不得不令人惊叹。它们是一种什么样的智慧,有什么样的基础?你说搞了几十个节点,几百个节点的东西,通信效率差得一塌糊涂。这些鱼是怎么做到的,角马是怎么做到的?椋鸟是怎么做到的?
还有一个,它个体整体能够快速收敛,这也是很神奇的。从群体来说有一个一致性的表现,多智能体网络的每个节点,它按照某种控制的规则,我把它称做一次性协议和算法,相互传递信息,相互作用,随着时间的演化,网络中所有节点的某个状态都会趋于一致,这就是它们不会出现撞击、踩踏的一个原因。也就是说一致性问题是智能体之间的协作协调,就是它能做一致,而我们现在做不到,在网络上的话,也都是各行其是。
于是我们根据这个群集运动的现象的一种分析,引发了一种灵感,说群集运动中生物群体所呈现出的各种协调有序的集体运动模式。实际上它是有分布式的个体之间,相对简单的交互而产生的一种群集运动,是这样一种行为。我们能否在分布式网络中导入群集运动的模式?借他山之石来攻玉,来实现基于服务体验的网域资源自协调运动方式。我刚才注意到韦总提出一个关于自动驾驶的问题,一个VPN要有40多个环节去配,当网络大了以后,没有人能受得了,那种工作我不知道有没有人愿意去干,是不是找个机器人去干,自动驾驶的问题。
回到这个问题中来,其实人类对群集运动的研究还是很深入的,已经建立了这样一些理论,特别是像一致性的理论很多,像一阶连续、二阶连续、高阶连续、无向离散等等,这样的一些情况都有相应的理论公式,理论已经研究得非常透了。所以网络节点如果要具备群集运动个体的智能属性,那就需要有感知、决策、执行一体化的功能,这一点上跟我们现在未来网络是很重要的。我们过去那种专用的只对某一个专一的用途的东西,可能很难具有这样的能力。
我刚才讲到,这一致性收敛是有条件的,它要强调有连通性才能有一致性收敛,恰好我们在网络,不管是现在的互联网,还是未来的网络,它在连续性上是满足群集运动的一致性收敛条件,自动满足。所以看来把这个群集运动导入到分布式网络里面去,这个看来不存在理论上面的困难。
于是我们把这样一种导入的,我取个名字叫情景拟合,我给了一个定义。就是我们参照群集运动的原理,在网络节点感知邻域节点和自身的状态,我们称这种暂时状态为情景,对感知的情景进行分析并依据一定的规则形成决策,驱动柔性网络资源执行相应调整,并将这种机制向邻域扩散,自动实现网域范围内的群体目标一致性,我们把这样一个过程叫情景拟合。
完了以后我们讨论一下基于情景拟合的网络动力学机制是什么?好,这是鸟类群集运动一阶连续一致性算法,这里通过感知、决策、执行。这个鸟,我们可以看到这个鸟,在它的坐标位置上的时候要感知相邻的那些东西,类比过来就相当于我们要跟我们的Xi节点要感知。鸟类个体感知邻居的位置Xij,依据Xij和自身位置Xi及期望的距离Rij进行自身位置调整。它产生一阶群集运动的效果,比方说在这里面已经出现拥塞了,这时这辆车过来以后,他一发现感知前面拥塞以后可以换个路走。这里面就是自动产生迂回,这其实在电信网里面也有这个概念,但是需要感知。而且不是一个节点,是直接两节点之间,而是所有关联节点之间。所以情景拟合机制可以通过邻域感知,调整流量方向,使网域内流量区域均衡,来减缓拥塞。
这是MIT数学家提出了交通拥堵的数据模型并指出,自动驾驶汽车提前预测并减速,能够大幅度缓解交通拥堵问题。这是他的原文上,我们可以看到有汽车在走,有的在减速,有一个急刹车造成一系列减速,然后再启动。数学家建立这个模型,说如果在这些汽车里面放上20%的自动驾驶汽车,就能够减少50%的走走停停的拥堵情况。这是效果之二,也就是只要20%的自动驾驶,所以我现在很看好谷歌的自动驾驶,因为它上来可能就能缓解我们的交通状况,我们现在人在上面驾驶都是要尽力而为,结果把所有四车道六车道都死死堵死。我们河南郑州到开封是六车道,都堵得死死的,即使是十条车道,还是会堵得死死的。所以情景拟合可以使全网流量趋向平滑,而减少拥塞。
第三是网域内端到端服务一阶群集运动,用户满意度传递模型,对于特定的终端MOS需求,服务链上的服务节点进行一致性调整。走到第二个节点的时候,它的服务差值也是零,可是走到第三个节点的时候,它的服务差值就变成负1了,到第四个节点是变成5,可以把这个负1补上,所以最后到达终端以后的结果还是4。所以可以看到情景拟合机制可以基于邻域的服务来提供端到端的服务保障。
SiFi可以按类在全网域提供端到端服务保障,业务聚类使得网络资源调整只针对特定的目标业务类,而不影响到其他任何非目标业务的服务效果。它们可以自动聚类,并不需要精细化。剩下的问题就是既然需要感知,感知域有多大才好呢?我们可以通过调整感知域,可改变作用范围和全网收敛速度。理论研究表明,群体系统中的个体仅需要6到7个邻居交互,即可使个体以最小的感知代价使群体获得较好的运动一致性。遗憾的是在我们的现有网络里面没有这样的一些理论,所以搞得非常糟糕。
去年我们在提出这个概念,今年我们的研究进展情况向大家报告一下,我们认为这个SiFiNet为互联网引入网域协调控制基因,当然不是在分布式网络上的推倒重来,我们认为是要继承演进,是要进行基因修补。也就是说通过增强是添加节点决策协议和节点感知,来做基因修补,为互联网引入分布式网络的协调新基因。因为原来的分布式网络里面没有协调新基因,才导致这个情况,有了这个新基因,在网络协调的自动化优化方面我们就有可能来实现。
这是基于SiFiNet路由节点架构设计,设计了互联网三大基线技术,路由控制和传输协议的增量修改。整个SiFiNet协议栈架构设计情况也会产生一些变化,这是SiFiNet协议栈架构的情况,这方面有一套的东西。因此我们注意到SiFiNet的节点资源感知协议和认知决策协议涉及到现在网络的第三层和第四层,所以它是在三层和四层之间做了一个SiFiNetWare。
我们把这个研究的结果,也做了一些仿真,实物和半实物仿真,这个仿真的结果,有均衡的这种协议方法,我们可以看到,它能够不管从哪里开始不同,都能够实现协议一致,这一点让我非常的兴奋。就是我们终于在分布式网络里面,找到了一种可以自适应趋向于均衡的方法。所以完成了一阶单目标SiFiNet的设计与仿真表明依靠节点自动协调,可以实现端到端服务保障和拥塞减缓。以后运营商可以不关心,它能自动实现。下一步我们将探索多阶多目标的SiFiNet实现,一高阶以后难度很大。
我们也同时在设备上开始做了,首先我们在大规模接入汇聚路由器ACR已占据国内宽带接入市场近30%份额以ACR为基础开展的SiFiNet节点设备的原型。同时我们也在做基于传统路由器的增量式改造方案,以及基于SDN的网元设备实现方案,现在看来进展顺利。就是我们给SDN赋予新的基因,就是分布式网络中用户体验的自适应,系统可以自动适应,不需要人去配了。
我们目前已经完成了群集运动原理、拥塞的成因、幽灵堵车的分析以及端到端的分析方式,现在正在进行高阶多种建模,今年我们已经完成了端到端的客户保障的验证,全网运算的均衡以及全网数据的平衡,继续在做高阶多种建模。下一步我们在进行SiFiNetWare的开发,然后调试实验和认证验证。我们希望在2018年在国家未来网络实验设施上开展SiFiNet的实验,以此想针对网络资源利用低下和QOE这一个痛点的问题,来探索互联网核心技术演进新方向。这是从理论和机制上来进行QOE的问题,解决资源利用率的问题。
我们也知道复杂网络理论已经证明,对于一个无标度网络来说,最大仅需要不足总节点三分之一的控制节点,即可实现网络协同控制。所以SiFiNet的支持增量部署,理论上仅需要不超过三分之一的情景拟合网络,我们即可实现全网服务体验的整体优化目标。原来以前没有人敢设想这件事情,我们可以看通过这样一个增量部署场景,比如现实是传统的,我们在传统的里面可以通过在这里把它变成SiFiNet的这个节点,把它变成SiFiNet节点,把这个变成它的节点,我们可以看到整个QOE的改善,它随着这个网络,有三分之一就足够了,不到三分之一的时候也能得到很大的改善,这种增量部署的场景有很大的指导意义。于是我们可以看到SiFiNet的机制是具有一个普世性机制,凡是分布式网络,在给定网络资源和拓扑关系条件下,即使没有精确的业务和服务分布模型也可以通过部署有限数量,情景拟合自动驾驶网元节点达成资源利用率和服务质量优化之目标。
所以我们说情景网络是未来网络的基线技术,就跟刚才像韦总一样提出的,是一个可重构的、虚拟化的、云化,还要再加上一个是情景网络、情景拟合机制,我认为再加上一个技术可能是完备的。
做个小结,在情景网络里面我们导入一个机制,叫群集运动机制。我们运用生物界的他山之石进行攻玉,基于复杂网络控制、群体动力学、物理学等领域的成熟理论成果。我们也开启了互联网服务模式的变革之路,我这里用个“变革”。另外就是实现全网域端到端无模型服务体验自动化保障目标,我觉得这是一个开天辟地的事情。因此,整个情景网络,我说是我们想实现用网络自动驾驶技术,来保障网络用户体验,提升资源利用率的未来网络所必需的基线技术。谢谢!