第二届全球未来网络发展峰会

创新·引领·未来

当前位置:嘉宾致词> > 分论坛三

中国电信SDN/NFV实践情况与经验分享

编辑: 共浏览:958次

我今天给大家介绍的内容主要分三块,第一个还是要不忘初新,跟大家汇报一下为什么我们要做网络重构这个事,可能大家知道中国电信的网络重构是一个很大的工程,所以我给大家介绍这个就是想让大家知道我们为什么要出发。大家知道现在运营商是一个大象,大象现在做跳舞的事情是为什么?这是第一点。第二部分是想给大家看看我们出发以后现在走到哪儿了,最后是在走的过程当中其实也摔过跤,当然也有很多的收获,也想借这个机会跟大家介绍一下。

首先看一下目前整个行业的情况,上午联通的唐总也有类似的材料,这个坦白说不是我自己能想得出来的,这个是我们信通院的专门做行业趋势的一个专家的材料,我借用了一下,这是整个全球目前电信市场的一个发展趋势的预期,就是它的增幅在2%到6%的区间内,所以大家可能听说最近这几年我国的增幅是6%以上,所以这个增幅已经是不错的了。但是这里说一句比较搞笑的话,我们曾经在我们集团做网发部工作,我们私下开玩笑说有的时候我们工作很没有成就感,因为我们每年有大量的投资,然后一算,好像比存银行不了多少,所以我们有时候开玩笑说我们干那么累干什么?我们今年别干了,存银行不就行了吗?这个是额外的话,这句话其实背后是什么意思呢?其实运营商不仅是国内的,全球的运营商整个的发展其实是和政府一样,主要是靠投资拉动,所以我们认为包括整个电信行业,包括国家现在也提网络强国,说到底我们现在是一个大国,不是一个强国,通信业也一样,所以是怎么从大做到墙的一个地方。

那么现在6%左右的增长率是怎么来的呢?这些年主要是靠移动的业务拉动的。但是大家也看一下右边的图,这个也是他们的预测,也就是移动业务马上就会走到天花板,这些年我们国家移动业务发展有几个原因,这个大家都可以体会到,一个是我们的手机出现了二卡槽,你可以多放几张卡,可以用不同的运营商。还有一个是这几年手机的全网通,不像前几年这个手机必须要跟一个运营商绑死。包括最近这一年以来的我个人感觉非常好的,也就是我们践行总理提出的提速降费,提出无限量的套餐,这些都带来了大量的移动业务,但是这些手段用完以后又该怎么办呢?所以这个也是预测到马上运营商的持续增长是困难的。这个图片为什么要花一些时间讲呢?就是说运营商未来怎么发展不能光靠砸钱来简单的做这个能力的提升。

第二个方面,毕竟我还是有技术背景的,我们看看技术的发展,上面这个图大家其实很清楚了,就是技术曲线,这个是什么意思呢?其实我本人接触SDN的时候,多说一句,我应该说这一点我要承认我还是不够有远见的,我记得当时五六年前,当时斯坦福教授在我们那里访问的时候,我强烈的说SDN可能做不成,我当时第一句话就是说我说的思科为什么要支持SDN呢?这不是革了自己的命吗?所以我现在还是反思一下自己,当时还是不够有远见。但是当年的SDN/NFV我们认为还在炒作的一个阶段,但是我们在去年发现一个非常好的一个现象,就是这个曲线里面已经没有SDN了,这就意味着这个产业进入到成熟的阶段。下面这个表就可以看到,这就是现在业界运营商里面部署的情况,大家可以看到有将近一半的服务器买过来是为他们用的,说明了这是大家是共同认可和在做的事,所以我们认为技术的成熟是为我们做一些事情奠定了一个基础。

同时,刚才很多专家也说到了网络要简化,我个人非常的同意,尤其是我自己做了这么多年网络,我认为要想一个产业发展,大家一定要站在这个行业发展的视角,就是把自己的格局做大,不要把东西越做越复杂,越做越复杂会搞死人的,而且会阻碍这个行业的发展,当然我们的专家不认同我这个观点,我认为他们害怕他们丢掉专家的位置。这个图大家都见过,只有网层次简化之后我的性能才会提高,用户使用业务才会最方便,所以这个就代表了先进的生产力。我这个里面举了两个例子,这个细节今天没有办法讲,每一个例子我一讲没有三个小时是讲不完的,我想说MPS为什么要到Segment Routing,其实我2000年我刚参加工作的时候就有类似的技术,但是现在可能找不到了,当年有一个类似的技术,跟这个非常的像,但是后来是因为各种原因做成了MPS,所以我想说的是这个历史是螺旋式的上升的,技术也不例外。但是不管怎么说Segment Routing简化了MPS,所以是一个非常好的东西,包括EVPN也是,我就不多说了。

那么如果我们从互联网的应用角度相关协议的发展,很有意思,这两个协议这次会议上没有专家讲,其实我自己非常关注这两个东西,我觉得很有意思,开一句玩笑的话,就是就算这些网络不简化,别人也在干,比如说我们现在说的HTTP2.0,不就是谷歌提出的SPDY形成的吗?这是一个国外做的实验,大概什么意思呢?就是在同样的网络环境下,如果我承载网什么都不动的话,在现有的网络的基础上有没有布SPDY或者是HTTP2.0,这个唯一的要求就是你浏览器要谷歌的,同时也要下载插件,同样页面下载这个可以节省很多时间。就是说我什么都不动,光这个SPDY这个协议就可以做到用户的提升。这个谷歌还很厉害,除了做SPDY已经做的不错之外,他还发现这个里面还有一些不理想的地方,因为SPDY做HTTP2.0的时候2015年已经发布了,这两年他又在做这个QUIC,也就是我们传统当年我年轻的时候UDP和TCP是分的很清楚的,未来这两个就可能是搞在一起的,这个技术细节我就不多说了。但是我相信这个东西代表着网络技术往前发展,但是不管这个片子和上一张片子,大家都可以看到这个趋势是简化为应用服务,方便客户,方便业务的。

说了这么多,前面我总结一下就是两点,第一点是运营商遇到了很大业务发展增长的难点,第二个是技术也在不断的进步,所以像中国电信这样的运营商发现其实就是有两个方面的原因,一个是技术原因一个是市场原因的一叠加,我必须要对网络进行改变。那么中国电信的整体的战略,未来这些年的三大块,包括所有的网络重构、业务重构和运营重构,细节我也不多说了,简单一句话,网络重构是我们做这些事的基础,因为运营商如果网都做不好其他的都是白搭。我们的技术元素里面就是这三个,也就是SDN、NFV和云。这个片子曾经我们内部很多人认为我们做这些事是为什么技术创新而创新,我在这里说一句,其实运营商做这些东西,我们开一句玩笑的话,我们不是高校,也不是一个纯科研的点,就是说我们肯定是以业务,或者说以利益为主要导向的。所以我们分析了一下,上一个片子说到我们会做业务的重构和智能化,但是我们发现未来的业务里面都提出了对网络的新的要求,比如说大家可以看到左边这边的智能连接类的业务,现在我们就发现这个内容太多了,我不能一个一个解释,像智能连接里面的家庭宽带这一块儿,我们现在也看到未来,其实现在已经有很多出现了,就是对上行带宽的安需的提速是有很大的需求。以我个人举例,我经常协同办公的时候,我需要把我大容量的文件马上分享给同事,但是大家知道,邮箱是有限制的,你好几个G的材料你怎么发给人家?所以这个时候就用到了云的业务,但是如果大家用云盘和类似的业务,大家发现一个现在的障碍是什么?你的上行带宽上不去,就算用云盘你上传也是传个半死,所以这种情况是对我们现有的网络提出了一个新的要求,那么我们认为网络重构其实根本的一点就是我们要把网络的能力去做改造和提升,这是我们未来业务发展的一个基础。所以这个里面是我们简单的一个整理。

第一部分简单给大家回顾一下为什么我们来做,第二部分我再给大家介绍一下我们具体实践的情况。这一张图我们已经发布了一两年了,就是我们中国电信到2025年的一个行动计划,这也是一个里程碑式的节点,我们分了三个阶段,我们先是从SDN/NFV来入手,最重要的计划是我们到2025年左右可以看到一个世纪的效果,就是我们可以看到有40的网元可以用NFV来做,包括40%的的东西是由SDN提供。大家可以看到,我们为什么提的比ATNT,因为ATNT的目标基本上是2020年就实现了,但是我个人观点,我们中国电信还是比较务实的,我们大概分析了,我们打死也不可能在2020年做到ATNT的程度,所以我们要脚踏实地的来讲。所以我们大概我们认为做的比较完善的完美的就是这个,当然那个长远的就是到2025年左右的时间,当然这个也正好是我们中国制造2025,正好也是为他所服务的,可以想他匹配。

那么具体来看SDN的几个我们做的事,在正式开始讲之前,我多说一句,对于现在提的SDN/NFV,我觉得SDN是属于锦上添花,NFV是雪中送炭,为什么这么说呢?一会儿我讲完大家也可以看到,因为现在SDN的发展节奏大家可以明显感觉出来SDN走的更快一点,大家日常也可以感受得到。为什么呢?还是SDN根本上来讲是在现有的网络基础上做了一些附加。比如说控制编排这些,没有SDN概念出来之前我们也有网管、EMS、MNS,只是不灵活,不自动化,但是SDN控制器出来,其实大家现在也知道,实际线网部署当中,那些EMS、MNS的存在,又叠加了或者说更复杂了,这个复杂还是简单我不追究,但是我想说的是这个意思,就是他有点类似于我们家的房已经盖好了,说有一个什么新的,比如说雾霾来了,我装一个新风系统,是在上面做加法,所以整个事情对原有的整套网络体系其实改动并不伤筋动骨,并不大,就像你们家买一个电器加一个东西一样。但是NFV根本上是相当于把你的房子拆了重盖,所以这个东西还是很复杂的,所以大家也很容易理解为什么SDN/NFV会在不同的阶段。但是我想说我个人的观点,NFE因为他是根本上更有效地去降本增效,所以对我们的价值更大,但是它的动静大,所以它会难一点。

那么具体来看我们在SDN实践部署的情况,我们大概做了四个方面的工作,第一个是在我们的IP网,尤其是骨干网上面做流量调度这一块儿,大家可以看一下,右边只是一个示意图,大概的意思是什么呢?就是我们在我们的163和CSDN的骨干上,我们可以看到,控制器是管理下面不同厂家的转发设备来做流量的转发,他在比如说网络流量数据上报之后,其实这个就是传统的协议,只是用控制器把它搜集起来。同时它的配置下面有一堆,包括各种形式我们都试了,同时由编排来解决不同厂家的控制器的协同的问题,同时他会更好的为业务做开放。这个里面我们跟刚才联通的情况不太一样的地方是我们没有去强迫要求去加控制器来管理,因为我们觉得这个动静太大了,所以我们是直接在不同场景下自己开发了一个编排器来厂家设备互通的问题。

那么我们做完这个事之后的一个效果在哪儿呢?有两点,第一个是我们在骨干网流量和城域网的连接方向上,因为我们现在大量的数据流是由城域网到骨干网,这个是一个目前现网当中最容易发生拥塞的地方。但是我们发现很多流量是不均衡的,比如说城域网和骨干网连的地方,他们的上下行链路是不对称的,有的是上行链路,有的是下行链路,所以我们就做了一个铁路的搬运工,严格来讲还不叫均衡,应该是叫负载的分担,均衡是做不到,所以我们大概做了这么一个事。这个事我们现在的效果是什么呢?我们在一些特定的时间段,比如说类似于双十一的时候,我们可以把容易出现拥塞的链路,比如说IDC的出口这条链路上容易发生拥塞,我们发现城域网的那个链路上另外一个方向反而闲着,我们会把它挪过去。在我们江苏在南京这里,我们有一个骨干的IDC,它的链路方向就是不需要因为双十一去给他做特定的临时的扩容了,而是用SDN做流量调度的方式来解决这个问题,我们收到的效果是将近有1T带宽的节省。

第二个是我们在国际的网络这一块儿,大家可能也知道,目前我们访问海外的时候,互联网最大的带宽是在中国电信手里,当然联通和移动都有,但是他们比我们还是少很多,但是我们的用户又是最多的,所以我们有这么大的带宽,我们国际带宽还是不怎么够用,当然现在撤下来是中国电信的用户去访问还是最好的,但是我们收到的实际业务投诉或者是提出要求的还是国际间的要求是比较多的,就是访问海外的质量,我们在这个方面也做了类似的事情,收到了比较好的效果,我们特定方向上的链路的拥塞,尤其是国际段有一个明显的下降。我再举一个例子,在做这个事之前,谷歌美国那边到上海的我们测过的一个访问实验延迟查不到要270个毫秒,做完这个事之后下降了100个毫秒,到170左右,所以我们觉得这个效果还是挺不错的。在这里多说一句,严格来讲解决这一类的问题应该是先做扩容,把端口扩大,但是大家我们也知道,这个老外可能听不懂,我们国际链路是有一个长城的,所以这个链路不是随时想扩就能扩的,所以我们现在在这种情况下,我们需要通过技术的手段来给他提升。这是第一点。

第二个就是云资源池的问题,这个也是老声常谈了,但是我们解决的是什么问题呢?你客户是开云和网同时开通,实际上我们后台开通的时候是拆开的,云是云,网是网的。那么拆单的方式确实是很慢,要十几天才能做出来,但是现在如果真正后台一起开的话,我们大概是一个十分钟左右就能把这个开出来。同时,第二点其实别看字写在这里,其实背后就是开启部署了VXLAN,所以VLAN的限制突破以后,我们在一个限制里面它的用户数会增加很多。这也是我们一个实际部署的经验,我们在进行部署的时候,我们发现是在20G以上的时候才必须考虑硬件网关,背后的原因我就不仔细解释了,这就是一个信息分享给大家。

第三块其实我也不解释了,今天我们的主题是讲SD-WAN,其实我们自己也做了类似的东西,我们在做具体部署这个层面的时候有一个比较有意思的一点,就是我们在这个里面,我们这个SD-WAN的体系架构里面,我们的控制器和编排器之间这个还是比较简单的,我们是采用了这些标准的协议,但是我们在跟设备之间我们采取了两种方式,我们会跟着产业链现状来部署这些事,因为我们不可能等着理论特别完美的时候才布。我们现在布的效果还是挺好的,不瞒你们说,我昨天是从我们重庆公司飞过来,然后包括重庆公司在内,我们在全国有十几个升都布了SD-WAN的服务。为什么我去重庆呢?因为重庆很有意思,我现在不太理解那种网红为什么那么火,我也不懂,但是我知道重庆那边网红有大量的SD-WAN的需求,就是他要随时的上线,随时调带宽然后马上开通,所以我想说的意思是这个在我们那边用的非常好。

最后一个SD-WAN的实践应用是我们的家庭网关,大家知道你跟运营商要宽带的时候他会给你一个路由器的盒子,那个盒子传统没有SDN的时候升级很麻烦,尤其是现在很多智能化的应用上来以后,这个网关要不断的升级,我们发现用SDN的模式来做它其实是一个挺好的考虑。我们现在的实际情况是这样的,就是我们这是一个大概的体系架构我就不说了,我说一个我们的体验,我们发现以后的业务加载只要在这个平台加载就行了,以后这个网关只是一个轻量级的网关,同时我们这么做的时候就是用SDN的方式改造网关,我们有传统的网关,其实做SDN的方式来做这个网关并没有增加对硬件的任何要求,而且这个里面用到OVS的这种模块,来做数据转发的时候,我们也测了一个阶段,就是OVS的转发性能,就是以我们传统的那个硬件网关的同样的性能要求,具体来说就是芯片,内存之类的要求的话,在这个条件下,OVS完全能满足转发的要求。之前有人会置疑OVS行不行,因为大家可能知道现在我们国内宽带走的非常快,我自己用的是100兆的带宽,但是未来国内将会大量的推1G的带宽,当然现在是资费太贵了,谁都用不起,但是我相信这个不是问题,当1G的带宽的时候,我想以我们SDN/NFV的网关来做的时候,我们就是按照1G的要求来考虑的,所以我想大家这个尽可放心。

说完SDN我再跟大家简单介绍一下NFV的情况,NFV中国电信主要做了两大块,一个是面向传统的核心网的所谓的VIMS和VPC,目前来讲我们的VIMS在全国已经部署了,中国电信马上要商用的VoLTE这个业务都是用这个VIMS承载的,今年能够支持三千多万的用户的能力,我们所有的VoLTE业务都在这个上面承载,所以从这一点也可以看出其实也不用担心,之前有人担心V行不行,我们可是一个商用网来有V的方式来做。当然这里也可以说一句,刚才马总也说到NFV推进的还不彻底,我还有一个片子是想推进更理想化的部署方式。第二个应用是在VBRAS,这个虚拟化也是非常重要的,我们做下来的一个实际效果是我们认为和传统的相比,综合成本可以降低20%到30%。今天上午唐总还是段所说的30%,不知道他们是怎么来的,我们是做了很严格的,我们就是不同的场景来算下来,就是在某一些场景下最好才达到30%。

在NFV中说的是不同的部署,同时在技术推进这个层面,我们非常在意要做三层解耦或者是全解耦,我后面会说什么是三层解耦或者是全解耦,这个方面我们在国内甚至是业界第一家发布了相关的技术规范和标准,因为之前经常有一些传统厂家给我们说不是我们不愿意干,是你说要什么,我们就把它的嘴给堵住,我说我们把规范来发了,然后你们来做,所以我们把这个规范发了,这个也是我们后续能够真正把NFV推好的前提。

最后再讲一些具体的经验,NFV这一块儿我们有三个非常好的打勾的,大家一目了然我就不多说了,我想说打叉的,这个打叉的并不是说这个东西不好,而是我们测下来实际部署的情况不理想,第一个就是互通性是一个大问题,所以这个是现状不好的地方,但是我们未来打算采用EVPN的方式来解决它的控制面互通的问题。如果不解决的话,大家其实也比较好理解,我在一个VDC里面就必须被一个厂家绑死了,不能买不同厂家的设备了,而且VDC以后会越做越大,这是不行的。第二个虽然业界现在很多说白盒设备,但是从我们电信运营商的角度来讲,我们觉得白盒目前还部分满足我们规模的需要,所以我们也非常关注,积极的在做这个方面的实验,但是我们现在还不敢引入,说白了是这么一个整体的情况。

第二个NFV这边打勾的也不多说了,刚才部分也说到了,打叉的这一块儿两个问题,第一个是现在的NFV大多数是厂家和厂家自己的软硬件解耦,非常的不彻底。第二个是NFV的硬件能力的性价比还不够好,为什么我这么咬文嚼字,我是说这个意思,用各种加速网卡,NFVI是可以满足要求的,不是做不到,但是运营商毕竟是一个过日子,我们NFV的目的是降成本,如果现在转发面和它一样,现在业界是这个水平,我要达到它我就要砸很多成本在里面,那么就是得不偿失,所以我说很多时候我们要看是为什么而做,而不纯粹的只是做一个实验,所以我们现在的单个技术可以做到很高的转发率,但是性价比不行,相信未来几年我们的技术提升之后这个问题就没有了。

多说一张片子,什么叫三层解耦,什么叫全解耦,这些细节我就不看了,我们认为真正的NFV至少具备这两个特征之一,所以现在的NFV是什么呢?就是我刚才时的是同一个厂家自己和自己解,我们认为这个是达不到运营商真正的要求的,所以我们为什么刚才前面说的我们发布的那个系列的规范和标准呢?就是要求厂家按我们这个指导的方向来推进。

最后我还想和大家分享几点,就是说其实SDN/NFV是一个技术手段,但是这个技术要用和,我们的这个很多思维理念体制要变,具体来讲有这么几点,第一点就是一定要以IT的思维来做这个事,其实大家都很清楚,传统的CT思维就是稳定压倒一切,比如说到今天都没有人说得出来电信网为什么要五个九,这个背后就是能不出事就不出事,这个是理念的问题。第二个是开源的问题,这个也说了很多了,简单的一个结论就是我们必须要拥抱开源,我们没有别的退路了。这个里面目前中国电信这只是举了几个例子,最近这几年在开源方面的组织和社区里的活动,这些我就不多说了。但是这个里面有一个例子刚才不是说到VIM吗?我们目前做了一个统一的VIM,就是我们自己做了一个VIM来管所有的对接,所以这个里面也给大家一个信息,开源也不是不能用的,是可以用的,当然做这个事很痛苦,我们付出了大量的资源和力量。

第三个其实我想说这个图是我自己画的,在我们内部并没有得到官方的认可,但是我想说这个图是大家可以看到这是一个技术层面的体系架构,有很多不同的模块,不是任何一方一个人能做得到的,所以我认为运营商做该做的事,所以我画了不同的颜色,大概的意思就是有的东西你基本上不要去碰,这也是为什么我说白盒我们现在做不了,我想说的是我们现在运营商其实做的最多就是叫灰盒,什么叫白盒?是你把芯片的要求都能提出来,你提得出来吗?所以我们现在提的要求撑死了算是灰盒,这个里面灰色的我们基本上不碰。然后黄色那边我们觉得这个可能要以对方为主,但是我们自己也可以做一些,然后这个里面关键的是什么呢?其实运营商里面最多的是绿色那一部分,是应该运营商自己为主来做这个事的,为什么说这个呢?我根据我这几年自己的工作发现,很多东西尤其是DNFV把自己传统的理念打破了,如果运营商自己不做是没有人做的。这个里面有几个例子,这个是我们现在在做的这方面具体的一些系统的一些项目。这个里面对于我们来讲做这个事最大的难点就是怎么DevOps,也就是怎么做迭代,这个是传统能力很难做到的。

最后我想跟各位同仁说一下,其实这个和上一张片子是紧密结合的,我们发现SDN/NFV引入之后带来一个什么变化呢?在我们现在内部不叫产业链了,我们叫生态魔方,就是我们传统的链条关系变了,更多的是合作和融合的角色了,所以就像一个魔方一样,你中有我,我中有你,每一个环节就像齿轮一样嵌在里边的。所以这个在传统的模式里面其实我们很少去和芯片厂商打交道,也很少和开源社区打交道,这都是新的生态衍生出来了,当然这个里面是举的例子,并不是只有他们,这个是已经和中国电信开展合作的。比如说我们和一些厂商合作,比如说英特尔公司,他以前不靠着,以前我们就像是鸡对鸭讲一下,但是我觉得这个是代表着未来。

最后我们呼吁一下更多的合作伙伴对我们进行更多的支持。谢谢大家。