第三届未来网络发展大会

网络全球 决胜未来

当前位置:嘉宾致词> > 分论坛四

未来网络:联接物理与虚拟 承载高效AI网络

编辑: 共浏览:640次

我是杜伟,之前一直在华为公司从事SDN/NFV相关的规划工作,目前带ICT战略与业务发展部负责网络连接的战略与发展。我希望给大家分享一下我对于未来网络发展的一些理解,有一些内容不一定现在会形成共识,但是我希望跟大家一起分享一下,希望能激发网络连接的讨论。

首先我们过去从2012年,大概是过去五到六年,网络一直在围绕云和内容在发生变化,在这个过程中,我们看到的是,过去五年,整个网络,我们其实是在围绕云的变化在为云提供服务。最早我们讲CDN,他其实是人定义的边缘,我们现在讲边缘计算非常热的时候,其实大家很多东西都是围绕着共有云,围绕云服务来提供的。其实我们看到在这个阶段,网络其实主要是一个管道,因为整个从云到CDN,是云来定义的,它是一个相对来说封闭的体系,所以说网络为共有云提供服务的时候他其实是一个管道。这个过程中我们也看到了变化,主要是骨干网的变化,比如说DCI的网络,它主要是解决从中心云到边缘云的扩散过程中,对骨干网提出的需求,这是过去五年。但是未来我们会发现另外一个变化,就是越来越多的2B和2IOT的业务,它主要的流向数据是自下而上的,比如说我们现在城市里的摄像头或者是工业制造里的传感器,他们的数据是自下而上的,而且这个产业是碎片化的,它和之前云的垄断式的封闭式的体系是不一样的,它是自下而上碎片化的。这来来了一个变化就是数据流向的变化,自下而上,然后它给运营商提供了一个新的机会,就是为什么运营商在OTT主导云的阶段始终是在边缘,在业务里面参与不进去呢?因为他是提供了几个大的供应链的。而自下而上的数据流是来自企业和终端用户的,没有一家企业它可以完全垄断,形成一个完全垄断的封闭的产业,它必须要有开放的平台,这是我们运营商会出现的,就是我要支持企业AI的服务,我可以提供边缘计算能力,就是提供算力,我提供一个为了解决算力的高效使用,我需要支持低时延的网络,要提供一个无损交换平面,这个阶段我们认为未来会出现一个主要的变化,就是网络从传统的管道走向我们计算的总线。

昨天阿里的专家也说到了,他看到整个城市未来就是一个整体,一个城市是一个大脑,所以它整个网络都是为这个智能的城市大脑在服务,它是一样的。就是这个网络在整个智能城市里面其实是一个总线,我们整个城市就是计算机。我们以前说DC是一个计算机,现在整个城市可能是一台计算机,那么网络就是整个城市的总线。我们看到了未来的主要变化就是在城域网上。这是第一个观点。

第二个我们还看到我们把运营商的网络横向和纵向分开来看,首先我们从横向看,就是从外到内,我们看到有三层网络。第一层网络是从设备到设备之间的一个网络、基础网络,就是传统的设备端口级的互联,这个网络通常我们基于IP、光和无线构建的,他主要的需求是大贷款、低时延和高可靠。这个网络是运营商管控的。在这个里面出现了第二个网络就是现在我们讨论非常热的云化网络,他是从传统的云和端的租户级互联,它是基于SDN/NFV构建的,主要的特点就是敏捷和开放,然后我们会发现这个基本上是云管控的,基本上是为云定义为云提供服务的,这个第二个。我们还会看到未来还会出现第三张网络,目前业界有的已经在提了,也就是计算网络。他实现的是数据和计算之间的连接,为什么呢?因为大量的未来整个用户的数据会呈20%的增长,这么多的数据,尤其是在AI化之后,它需要大量的计算,而且计算和数据又不在一起,这个网络作用就是把数据带给计算,带给算力,然后计算完之后把结果推送给云库,就是完成这个工作,他是实心数据和计算之间的业务互联。基于这个网络,现在我们讨论的是基于分布式的网络协议构建的,他主要的需求是实时性和高实时性和随需的特点,就是当我这个数据需要结算的时候我能找到计算资源在哪里,然后把数据传过去,计算完之后把结果推回来,就是完成这么一个工作。这个网络的主要特点是去中心化、对等协商,就是数据和用户之间直接协商来完成。类似于这样的东西,在以前我们历史上的网络里面曾经出现过,就是一些类似的协议,只不过我们把这个整个放在一起看的话,运营商未来是可以参与的也就是基础网络、云化网络、计算网络,而且这三个网络里面不是割裂的,而是相互依托的,我们计算网络要依托云化网络的构建,云化网络又要依托基础网络的大贷款和低时延。

还有一个变化,我们看未来网络的演进的话我们就要回顾一下历史,我们看网络过去二十五年发生了什么,然后再看未来五年会发生什么。过去二十五年,我们看最早的网络,就是第一代也就是我们认为的游戏IP领域,最早的就是思科的智能交换机,他在园区,他替代了传统的CPU或者是计算机网络,进行了专用交换机,实现了高效的园区组网。第二个就是在五年之后的骨干,就是从园区到骨干,当时推出了M40,它的特点是纯IP,他解决了什么问题呢?就是解决了高效转发的问题,就是这个设备是专门做转发的,从通用的东西到一个专用的东西,所以它的效率大大提生,所以在骨干上取得了成功,这个是1998年的时候。然后2003年的时候我们大家就熟悉了,就是ALU的7750,他是综合承载,从骨干的变革走到了城域的变革。然后是2008年的华为的PTN/IPRAN,他实现的就是IP传输,就是把IP和传输结合的一个创新。我们发现这个变化是从数据中心园区到骨干到城域最后到接入回传。我们发现第二轮的变化又形成了,也就是现在的云网络,这个阶段我们认为这个就是云和网络主要是因为商业驱动,它主要实现的是云和网的结合,在这个阶段它的商业驱动还是一个物理变化,就是云和网相对来说是一个独立的东西,就是云的技术用在了我们的领域,实现了网络自动化,然后网络为云提供了一个便捷的连接,就是SD-WAN这个阶段。但是最近一两年,我们发现云和网从物理变化走到了化学变化。为什么呢?云其实在里面是有一些理念的东西,就是原则性的东西,比如说转发分离,这个东西是来自于云的理念,但是它并不是把云的原生的直接搬过来用的,我们并没有干这个事情,我们是把云的理念用在了网络的设备和设计上,设计了转发面,它和云没有关系,但是它是云的理念做了网络的创新。第二个就是设备的羽化改造,这个是把云真正和网络做了一个变化深度结合。

然后我们认为未来一两年对网络最大的驱动是来自于AI,首先第一轮会在城域发生,因为数据是自下而上的,所以会在城域发生。网络还是为AI服务,有两个场景,一个是如何把AI用在网络运维上,就是网络的AIDN,第二个就是考虑网络如何支撑AI,这个AI需求来自企业,这个阶段就会有边缘计算,会有计算网络,但是这个还是一个物理变化。我们再看未来五年,还会发生一些化学变化,就是AI和网络的化学变化,就是我们把AI的一些核心的理念用在网络设备设计上,推出AI的设备,就是这个变化首先我认为会发生在接入端。因为AI的主要特点就是便携计算,低精度、高吞吐,他不追求某一个方面特别高的性能,但是他会几千个核同时工作来实现更大的算力,这是AI带来的核心设计理念,这个理念一旦用在接入上,就可能会实现上千的数据接入。他都是体现在我不追求某一个发展方向上的体制,但是在工程上会把很多的并行的东西组合在一起,形成一个更大的能力,这个东西会出现接入,然后也会出现一些AI的原生,就是会把AI的一些芯片,甚至一些算法直接用在设备上,用在CPE上,接入网络设备上,直接支持AI的芯片,这是一个新的网络设备。未来我们可以看到整个网络从中心到接入,他是一个滚动持续发展的过程,网络从来不会过时,因为网络吸收能力特别强,它出现一个新技术,第一个时间就是网络是为他服务的,第二个是这个技术的优点网络会吸收进来,变成网络自己的东西,所以网络是一个非常有生命力的产业。我们今天主要讨论的问题是在第二个阶段,也就是AI和网络的商业驱动这个阶段,这个是网络的关键焦点,关于第三个点后面将来有机会我再跟大家做一些相关的探讨。

回到AI和网络的关系,我们认为有两个场景,一个是AI for Network,就是支持用户AI业务,网络购价和技术创新,提升AI业务效率,还有一个就是在业务方面,我们知道智能城市会走向AI化,那么它对网络的需求呢?就是如何适配网络业务的发展,构建下一代更有生命力的城域网络,这个是另外一个场景,也就是Network for AI。然后就是刚才唐总说的,AI for Network是不得意为之的,因为之前大量的工作是在内部完成的,但是它的维护太复杂,人类已经没有办法维护这种更复杂的网络了,所以就需要要引入AI、引入算法,引入大量的工具,来实现云化网络的自动驾驶,自动运维。

我们再看一下,现在我们很多在实现网络自动驾驶的时候,我们其实有两个革新的观点,一个是治,一个是简,为什么要治也要简呢?这个治就是通过这么多算法把这么多结果实现自动运维,但是如果太复杂的话,它其实对我们AI工程上实现的难度是一个调整,所以我们提到了第二个问题就是简,就是能不能降低我们的复杂度,把我们的复杂度降低之后,简化我们网络关系,这样就可以让这个数据处理复杂度降低。

我们举一个场景的例子,就是数据中心的场景,我们知道传统的数据中心,它有一个PUE的概念,就是网络数据中心处理,他是瓦特和瓦特的关系,但是这个数据中心对于运营商的CO,尤其是电信的云数据中心其实不是很合适的,因为电信云数据中心主要是解决比特的问题,所以对于运营商的数据中心我们需要考虑全占的PUE,就是我们的能耗是要考虑比特到瓦特的PUE,就是我们要实现机房到设备到网络的多层全占的PUE,这样价值才会更大。然后我们看到如果每一层其实都可以用AI的技术来实现自动化的运维,当然这个过程中也是有很多挑战的,比如说数据共享,这么多的传感器,到设备,到IT,到CT,这些设备怎么数据共享现在开源也在进行研究,然后就是自主决策可靠性的保障,这些东西都是需要技术上去解决的。所以我们认为AI for Network会是一个比较长期的过程,从现在的人工为主,AI为辅,到未来AI为主,人工为辅,这可能是一个逐步过度的过程。

第二个阶段我们讲一下Network for AI,首先我们看一下企业,企业的AI投资领域都是企业服务、医疗健康、金融、网络安全,都是来自企业的需求。AI主要是替代人,替代传统人工在运维,在安全各个领域的人的工作。我们看到AI的这个A,其实也体现了A的核心,A就是上面的少量科学家研究算法,下面是大量的设备提供算力和处理,给客户数据,所以AI的核心就是算法加算力加数据。所以实现AI的高效,因为我讲的题目叫高效AI,AI高效的核心是高效算力,因为数据来自于客户,客户把数据给你,我如何提高高效的算力来帮助客户更便宜的完成计算,那么我们给的概念就是基于相同算法、相同成本、相同时间内可以处理更多的业务数据,这个就是高效算力。在座的都是搞网络的,我提醒一下大家,当我们讲高效网络的时候,是讲的一个完全相同的这个段落是一样的,是基于相同的标准,相同的成本,相同的时间内,可以转发更多的用户的数据,这就是高效网络。所以我们看到高效算力和高效网络完全是一个非常类似的概念,也是运营商完全可以做的一件事情,也就是高效算力和高效网络是一个类似的工作。

然后高效算力包含三个核心要素,第一个要素是专业,我们前面讲了二十五年的网络创新,我们发现一个很大的问题,就是从通用到专用,对吧?为什么大家用网络,为什么大家不用计算机去阻网呢?因为有专业的转发芯片,它的效率更高,所以我们讲高效的时候首先就是专业,从CPU到GPU到TPU到NPU,围绕计算这件事情,尤其是围绕AI这件事情,它有它的专用CPU,专用芯片来解决,所以它的计算量更高,同样的TPU可能是GPU的十倍,如果我确定它的算法做了优化以后,它可以提高十倍,这个就是高效算力第一个原则,就是专业。第二个原则就是弹性,这个算力一定要朝分配和敏捷,这个可以高效算力还要解决毫秒级算力如何开发出来给用户使用。第三个要素是协同,它和网络资源池的概念是类似的。

然后我们讲从过去企业,传统的企业其实也是人工管理为主,未来大量的企业和服务会走向AI,需要这么一张网络,这个网络是连接企业的设备到企业的数字孪生的企业虚拟平面,来实现更支持企业高效算力的服务。对我们来说,它接入层要实现低功耗来满足企业部署的需求,然后整个网络的使用要满足低时延、高可靠,然后在边缘上能支持分布式和强实时的计算网络。我们有机会的话可以跟大家仔细的讨论计算网络的架构协议,今天我们就没有时间展开了。

但是我们可以举一个案例,这个是Network for AI的,就是我们这个部门的网络连接这个部门它是负责从核心网到无线到IP端到端的整个CT网络的建设,所以在这个方面我们首先要看到云核的变化,他会走向电信边缘,他主要的变化一个是C/U分离,边缘极简,从云原生到开放,就是容器和轻计算,实现资源的池化和共享。对承载网的变化我们认为会出现一个程序计算网,他包含三个层面,首先从最内层,它是连接数据和计算,支持强实时和开放的网络,然后转发面我们会有IDN,再往下就是超款、无阻塞和低时延的5G这样的一张网络,来共同支撑企业AI的高效算力和边缘对云的服务。

最后我总结一下,我们认为在城域这个阶段,就是刚才大螺旋的时候主要是讲的城域的第二阶段,它有两个阶段,第一个是AI for Network,然后很快就会出现第二个需求,就是Network for AI,就是网络如何服务企业需求,构建一个新的网络架构,而运营商可以销售的资源,从现在的带宽走上第二个纬度,就是带宽+计算,就是从单一Bandwidth到Bandwidth+Compute,这个是我们未来需要持续探讨的一个课题。但是这个我认为其实是帮助运营商打开了一个新的市场空间。

今天我跟大家分享的主要就是这些内容。谢谢大家。