第二届全球未来网络发展峰会

创新·引领·未来

当前位置:嘉宾致词> > 分论坛三

SDWAN的实践和探索

编辑: 共浏览:774次

谢谢,各位来宾,下午好,很高兴借助这个未来网络论坛和大家进行交流,我今天讲的话题是SD-WAN的探索和实践,主要会跟大家分享一些我们在SD-WAN的架构以及部署过程中碰到的一些问题,以及一些思考。最后会说一些帮助运营商帮助云服务商以及帮助CDM的运营商来部署SD-WAN的一些经验。

首先我想在座的每一位可能都知道SD-WAN,就像陆老师刚才介绍的,它最近是一个风口。那么大地什么是SD-WAN呢?我想问在座的每一位,可能个人都有自己不同的答案,就像这个摸象一样,你摸到的是SD-WAN的一块,另外一个人摸到的是SD-WAN的另外一块,可能很多人就会认为SD-WAN就是把这些连起来,或者说SD-WAN就是一个分支机构到总部连起来,搭一个VPN就可以了,或者利用一个互联网或者是更高的性价比的一种解决方案。这些都没有错,它都是一个PAT的SD-WAN,但是它都不完全。还有一些人可能会说SD-WAN凡是涉及到SD-WAN的那就是一些自动化的配置,一些快速的部署,高的性价比或者是运维最后很简单,这些也没有错,这些是SD-WAN的点,或者说我们部署了SD-WAN想得到一些什么。

那么如果说我们要准确的,我在这里希望澄清一下SD-WAN到是什么,我们可能要从头看一下,当初WAN是怎么来的,这是大家非常熟悉的,最早的时候WAN其实就是一个企业分支机构到总部要打通,打通无非是两种方式,一种方式是租专线,我们运营商联通的A网,电信的CM2,有各自的网络,中间的这个网一般来说就是MPS的一张网,或者通过英特尔,因为虽然internet质量越来越好,性价比越来越高,那么就会有越来越多的企业可能会尝试不走MPS了,或者至少把英特尔作为一个后备,这是最早的WAN就是这样的。后来这几年事情发生了变化,企业的流量模型发生了翻天覆地的变化。

那么变成成什么样子呢?我们看一下,多了两块,多的一块是公有云或者是私有云,在托管机房里面的自己的点我们一般叫做EPC,它其实涉及到了我的流量需要走到我自己的EPC,我的流量也要涉及到到我的SAS,因为我的SAS不在我的公有云上,这个时候你会发现他还有更多的方式,他可以利用原来的这个网走也可以利用internet走,这就是我们这个企业流量的模型发生了很大的变化,因此造成了对WAN的需求就不一样了。我们来看管辖,这个WAN的需求是什么样呢?第一个最重要的一点是我要满足各种互联场景下至少能够联通,这种互联场景包括了什么?大家可以仔细想一想,包括你刚才看到的公有云到私有云等等各种连接,而且你如果作为一个运营商提供这个方案的来说你肯定是多租户的,就是对于不同的租户都要满足这种不同的连接,那么在满足这种大场景应用连接的情况下。

他必须要具备以下的基本特征,第一个最重要的就是安全,因为这个里面大家可以看到,它不光是专线,它走了自己的流量,所以安全非常重要。其次是灵活,灵活在这里意味着什么?意味着你如果有钱就可以走专线,如果没有钱就走internet,或者是不管你是什么样的接入方式,它最终都是一个完整的网络。第三个是质量,SLA,走internet的最大问题就是你的SLA得不到保证,那么怎么我能在性价比和SLA中间做一个比较好的处理方式呢?第四个一般人都会忽略,因为一般人都会认为我SD-WAN就是能保证各种场景联通,但是其实这个里面涉及到很重要的一点,骨干网的流量调度以及接入网的流量调度,在下面我会讲这个流量。成本每一个企业都会在意。最后一个就是非常简单的运维,这也是SD-WAN带来的好处。

我们看到了这么多WAN的需求,或者是现在企业因为流量的变化对WAN带来的需求,什么叫SD-WAN,就是现代企业利用SDN满足现代企业对WAN的需求,其实它现在更广泛的意味着什么呢?我把它叫做广义的SDN,他意味着这个网络是灵活可编程的,我有很多的智能控制,我有很多的数据采集和分析,这个里面涉及到很多的AI,我相信刚才很多嘉宾也说到了这一点,也就是说利用广义SDN的手段和模块,能够更好的控制企业的WAN,满足刚才所说的连接场景以及六大需求,这就是现代的SD-WAN。

下面的话我想谈一下我们其实作为大地云网最早进行SD-WAN的尝试,应该是在两年以前,是和运营商的一些合作,在这个过程中其实我们碰到了很多的挑战,在这里我列了大概五到六个我们碰到的在架构设计以及在实践过程中我们觉得比较头疼或者说我们觉得值得提出来分享给大家的一些挑战,当然后面我会给出一些我们的考量以及我们怎么解决这些问题。

第一个挑战其实很简单,大家看,国外的一些比较成熟的SD-WAN解决方案很多是基于internet或者是端到端,这个在中国不太适合,不太适合的主要原因第一个就是大家众所周知的原因,运营商的互联网。北方比如说以联通为主,南方以电信为主,那么这两个在互联的时候会产生很多问题,到底有多差,我一会儿有一个图给大家看一下。

第二个就是我们普遍是全法公网IP,如果你做点对点连接的话都需要公网IP,一般两边都没有公网IP,那么这样的中间就必须要有一个节点。关于运营商的互联就是一个老大难问题。我这边搞了四台点,三台开在上海,分别对应电信、移动、联通的出口,还有一台在安徽对应移动出口。大家可以看到移动到移动是最后一条线,他是最好同运营商的,黄色是联通到移动,最上面是电信到移动,而电信到移动非常有趣,它最差,而且近乎是一倍以上。如果说我的应用不在意,我时间长一点没有关系,好的,那么看它的这个地方,它时不时来一个分,我这个是一共测了一天的时间,4月16日到17日,我随机的在中间抽了一天时间测。更有趣的是大家看这个位置,这个是发送过去的位置,这个是收的位置,得到可以看到,因为我上面打了点,所以它没有到一个G,但是你可以看最上面的蓝色的线是移动到移动的,上海移动到安徽移动的,不管是收发都可以到1G,但是下面黄色是联通到移动,绿色的线是电信到移动,你可以看这个有的时候是可能到零,而且非常的不稳定。这个就是我们互联的现状,这是一个问题,大家要记住这一个挑战。

第二个挑战,第二个挑战这个也和WAN的变化有关系,现在因为企业把很多APP放到了公有云去,因为传统的WAN就是解决企业内部流量,但是现在就意味着我去这个上面,我们碰到一个企业,他的东西放在国外的AWS上,这个因为是internet的地址,你平常走的就是internet,那么能不能对这个internet的地质利用NTS技术进行加固呢?这是一个挑战。

挑战三其实很有意思,跟我们合作的厂商里面大部分有骨干网,但是有一些没有骨干网。他就问了,我能不能在一些数据中心建一些BGP带宽的机子,还有的是我以前是没有SD-WAN,现在你给我介绍了SD-WAN,很好的一个方案,便宜,而且我不用拉专线了,但是这个网和我原来的网可以无缝融合吗?就是说我internet在你这个上面的里面转,我原来的网在这个上面转,这两张网络怎么进行融合呢?它能和原来的网络进行融合呢?它能和他总部的私有云通起来吗?这是一个非常典型的问题,我们和客户谈的时候的第一个问题就是这样的问题。


挑战四,如果你有骨干网,那么骨干网一般来说我们都是建议建比较长途的,比如说北京到上海,北京到广州。那么这个上面就会有一个问题,一般骨干网上都会有IP陆游协议,但是你会发现从北京和上海之间可能都是占满的,但是北京到武汉,武汉到上海是空的,对于一些应用来说,它并不在意距离是最短的,也就是说它对实验不那么敏感,但是它需要带宽走这个事情。那么我们能不能利用一些其他的空的LINK把流量找一找?如果你用传统的方式实际上是很难的,那么这个里面有没有办法来做呢?这个是骨干网的。第二个是对于接入网来说,我们有专线接入,也有internet的接入,这两者之间能不能有一个比较好的线路来走,或者是有的客户有两路internet,一路是电信,一路是移动,那么这个时候你能不能在判断这个链路的质量,从而使得流量能够负载均衡,能够平均到这两个internet的链路上去,这都涉及到接入网以及在流量网上的工程。

挑战五,这个是在部署过程中的。说实话,我们SDN都是一个集中的大脑,这个没错,很多事情在集中做很方便,因为你有全局的流量情况,所以你很容易的决定我这个流量是不是该从其他地方绕路,是不是我有一个路径的计算算法就可以让全网达到负债均衡。没错,但是很多东西是不能做的。举一个例子,一般我们骨干网要求50毫秒倒换,也就是说在骨干网上如果有一个问题,我们希望你这个50毫秒就能走到其他地方。这个时候我们设想一下,如果我们采用集中控制的方式,也就是它到了的第一反应是我发现有问题了,我上报到Controller,Controller发现了问题重新计算下来,然后中间一般情况下几百毫秒就过去了,而且我们在设计网络的时候有一个很大的原则,就是Controller是随时可以断掉的,不管你用什么网络都有这个可能性,我们希望Controller的断掉积极影响的是新业务的下发而不是已有业务。所以这个时候我们希望有一个分布式的Controller来做这件事,所以它就可以非常快。但是它非常快的时候,我并不要求它选择的陆游是最佳的,这个我可以慢慢做,但是我保证它的连通性,也就是说我们将来网络在一些发现问题的情况下,它可以决定在本地我从哪儿走,保证它的连通性,但是这一点你要注意,你要防止LUK,那么保证联通性的时候,同时我们把这个知道,Controller可以从容的可能用秒级来重新下发到路径,这就达到了所有的结合。那么这五个我相信有作SD-WAN的部署或者是在这个方面有解决方案的可能也会碰到。那么我们下面就会介绍到我们的一些想法和解决方案,如果大家有更好的,也欢迎大家来讨论。

下面的是我们的实践,这个里面我们讲一下我们现在的一些解决方案。第一个这个里面其实最重要的两大部分,我把它放成了两大部分,第一个是接入,你怎么确保让客户灵活多方式的接入过来,第二个是骨干网,我们先看一下接入网络。传统方案大家都知道,internetVPN大家也知道,很自然的就是我们能不能把这两个优点结合起来然后克服掉他们的缺点呢?internet最大的问题是灵活,成本低,但是专线就缺乏了这两点,所以我们现在是把internet作为最后一公里来做,也就是说我不会用点对点的联通方式,原因是因为我们没有地址的问题,然后还有运营商互联的问题,所以一般我们会在城域网或者是靠近你的地方放一个点来控制你的internet流量,从此以后我就有可能走我自己的骨干网,我本来如果有骨干网的话。如果我自己没有骨干网的话,其实现在大家知道,你在阿里云上开一个虚机,你在北京和杭州的阿里云开一个,在中间做一个传输是非常方便的事情,这就相当于一个专线,或者你哪怕都不用,你就用BGP带宽也行,但是走长途的BGP带宽,如果到一定程度你的带宽还不如专线来的便宜。所以这样的话我们就有效地结合了internet加上专线,我又利用到了长途走专线,我又减少了减少最后一公里的问题,因为最后一公里布internet大家知道非常的方便,这里有一个PE,这个PE要承担和原来的骨干网融合的作用。同时我们为园区了一套系统,这是一个统一的平台,就是每一个企业如果你在这个园区的话,我们给你开一个统一的方式,你不需要CPE,而是直接享受园区的可以直接上SD-WAN了。因为时间的关系我下面会加快一点,这些我就不多说了,他是靠客户更近的一个平台。

下面我留一点时间讲一下骨干网,传统的骨干网解决方案其实大家做过骨干网的大家都知道,一般都是MPLS,我们也坚信MPLS是一个比较好的数据面,他的缺点很简单,就是配置复杂。我们的改造方案其实从最初的SD-WAN的应用来自于谷歌,这是很早以前,其实设计理念上和现在有很大的区别,这些所有的改造方案有几个关键点,第一就是要稳定,对于运营商来说这是重中之重,就是控制面和转发面都要稳定。第二个就是我刚才说的你要能够快速监测,快速倒换。第三你要有流量的优化和流量的动态角度。在这个上面我们用的还是MPLS,如果说大家对这个不太了解或者是好奇的话,我建议你们也可以看一下我们公司的网站,上面有一些基本的介绍。这个是我们觉得这个是对于SD-WAN来说可能在未来几年都会得到大力推广流行的一种流量调度的方法。

对于我们最终解决方案SD-WAN的就是这一张图,大家可以看到,对接入来说,我们利用internet做最后一公里,用多种灵活的接入方式,对于骨干网来说,接入那边我们有一个控制器,就是完成了SRTE的,我顺便说一句,就是下面我会讲几个案例,在第一个案例和第二个案例我们都是用的路由器来完成的,但是在我们最新的这次大会的项目中,我们会用交换机来完成这个工作。我们会提供标准的SPI,所以你可以有第三方的APP等等,因为它有数据采集的功能,所以所有的都可以通过它来进行控制。这个是基本的功能组件,如果大家拍不到可以到我们的网站上,我们都是对外进行分享的,这些模式就构成了SD-WAN,也是根据前面的挑战做出来的模块。

我这里显示我还有五分钟,所以我快速的再过一下我们的一些案例,这个就是早晨的联通的案例,那么我们下面其实是有两个不同厂商的,那两个不同厂商的配置,其他的逻辑在我们Super Controller,这个是业界也是第一个,就是在一种Controller之间做HA,这个里面其实它的本质就是MPLS的网,我们把它变成了一个SD-WAN的接入网,大家如果早上注意到的话,我们现在接入了WO云和阿里等等公有云,企业本身的接入他本身是在那边的,所以这样做的话他就把整张A网由原来的网变成了一个DC流量的一张网,所以这就是一个我们对它的改造。这个里面更多的涉及到的是基于SRTE的技术SD-WAN。

第二个我想讲这个案例,这个案例是云公司的一个SD-WAN,这个里面就涉及到了所有的刚才前面讲的东西,他私有云、公有云、托管云,所有的都在里面,并且企业的接入是各种各样的,有原来拉专线的,在这里我们对他们进行了全部的改造,这个网现在也是在商业运行了,这个里面基本上所有的SD-WAN我前面讲过的组建这里都得到了应用,因为他要满足多场景多连接的各种连接方式。

这个是一个全国的科研骨干网,这个地方前面两个是因为我们已经商用了,已经有客户连上来了,这个目前还在POC的阶段,这个里面最大的挑战是我们尝试着用可能很便宜的交换机,甚至是白牌机来代替比较昂贵的路由器,前面两个我们都是用的路由器做的,在骨干网上,在这个地方不管是从接入到骨干,我们都尝试着想用交换机来做这个事情,换言之我们是希望在交换机上取得和路由器差不多的功能,这个里面我们主要有一个挑战第一个就是50毫秒倒换的问题,它的一些性能限制或者是它的软件的OS的限制达不到,那么在这个里面我们现在尝试着做POC,因为时间关系我就不多说使。我希望下次有机会的话等我们这个落地了,应该不太晚,我希望下次有机会的话跟大家沟通一下,我们怎么来利用交换机搭建了这一张网。

谢谢大家,我今天就讲到这里。