2017全球未来网络发展峰会
创新合作共赢 引领未来发展
首先感谢主办方能够邀请我来到这里,尤其感谢我们的教授,在过去七年的过程当中,他和他的团队做了很多研究,我也参与了这个项目,在过去几年当中,我们今天要讨论的话题是一种模型,那就是我们共同研究,我们共同研究的模型,在过去七年当中,我也做了共同的努力,通力合作。我也引导我的一些选择来看到了一些大数据方面的一些努力,在过去的几年当中,同时我还看了一下,这两个话题大数据和网络化如何融合在一起的,融合成了一个话题,在过去几年当中,大数据和网络化。
我们看到这两者会不断地融合,我的中文可能没有像罗拉那么好,所以开场的时候就没法用中文开场,但是我对中国文化很感兴趣,今天就以中国文化开场,中国文化我相信第一个故事你们所了解的可能就是牛郎织女故事,有两颗星星,这两颗星星彼此之间爱慕,一个仙女和凡人,有一个神仙把他们分开,分开之后肉体可以分开精神不能分开,一年会有一到两天他们会搭一个鹊桥,本次之间会去见面。所以我希望用这样一个故事来做一个类比,希望谈一个话题,那就是数据和网络之间。
总而言之这两个领域也是相互联系的,尽管他们有很多的不同,尽管在学术研究如何区分他们,我们去可能是研究,到底是大数据还是网络,可能会把他们区分开来,不管怎么区分两者都有一定的联系,大数据有:高容量、高速率,忠诚度等等,这四个V是有很好的例子,在很多的应用当中,在很多数据类型当中。但是我们接下来要看到是最活的案例,那就是四个V最佳案例。包括网络问题,网络问题是数据问题最好的例子,我们所拥有的,当我们来看一下我们数据进化发展和数据的容量,您会看到数据一开始很少,然后慢慢在增多,随着网络化这个数据的话就以很大的量级不断增加,我们会看这个数据都来自于一个事实,那就是网络在不断演进,我们看多有越来越多的数据在不断地产生,我们看到IOT物联网是一个网络化的话题,所以这也是数据变的不断庞大的前提。如果我们分析一下,那么我们看到是数据之间相互连通和共同发展、共同演化,三个领域在研究话题下,用来描述我们一直以来所做的共同的努力,无论是在中国和中国的科学院联手所做的,首先第一个是网络化,作为大量数据的起源,网络是起源,这样一个研究领域使大数据拥有更大的应用,实际上有很多有趣的激动人心的应用,关于大数据的应用。那么这一切是建立在网络基础之上,网络内部的。所以网络是一个大数据运行赖以生存的来源。
第三个生存的领域也是刚刚设立的领域,这个领域是一个新的研究领域,是未来研究的领域,那就是网络化的系统必须要被设计和建设,设计和建设的频繁性要更加频繁,是用在数据的分析方面,我们未来的网络一个特征要求我们不光光是来处理数据包,同时还来应对未来一些崭新的数据包,所以这样一种网络化的架构很重要,如下是CCN不需要去处理什么IP地址,但是可能要看一下内容,而看这些内容是第一步,目的就是为了能够融入这个过程,处理转变这个过程,如果想融入在其中,我们看一下相互的交融,首先我们看到的是这样一种移动互联网,移动互联网带来了大量的数据流量,看一下中国的微博会发现大量的一些内容,大量的一些观点,在这些微博上,你看到每天都会产生大量的,可能每分钟产生100万条的文章,所以这些都必须要进行处理、传输和分析大量数据,这样一些数据实际上来自于网络的一种应用,所有这些各种各样的例子在不断地增长,所有的物联网的应用等等之类的,都会带来大量的数据。
同时,这些都是来自于网络化的领域,这样一种特征就是即便你在做数据分析的时候。所以我们看到我们有不同的排名,不同的排名看到中国的排名位居前列,同时看到在排名前十网站,其中这个排名前十网站都包括中国的网站。基本上所有的这些所有网站大部分来自中国或者下面我所列的国家,中国实践包括经济活动,网站的浏览量都是非常高的,总的来说现在网站经济其实是非常活跃的,现在对这个方面进行深度的挖掘。大家可以看到有没有不同的数据集,这些数据集可以把相关中国用户连接起来,这些数据集其实是能够覆盖不同中国的一些地区,包括我们的一些这个学区研究机构,或者是相关的一些科技机构,他都是相覆盖的。
同时我们所有域名系统都是能够发送到我们的这样一个网络服务供应商,其实每一个连接在中国在过去的每一个连接,整个量都是非常大,同时这个RSP能够提供我们不同的原IP以及相关的IP地址,以及解决相关IP地址系列栏,从另一方面来讲,我们也做了这样一个清单,这个清单就是会把不同网站做一个排名,这个排名也是通过我们广告和追踪器识进行排名,我们可以看到我们总共的这样一个网站的记录数量是在1亿4千900万级,同时IP数量是18万,整个地址是在71万这样的数量级。那么所有这样一个数据我们做了一个分析,通过这个分析我们是想知道,在中国这样一个流量是怎么样分布,尤其是针对广告这一块,想知道在不同的国家广告流量是到了哪个网站,我们绘制了这样一个图表,大家可以从图表看出来,不同国家他的一个网站上的一个广告排名,以及流量的排名。我们知道大概有70%的这样一个广告公司,都是在美国,同时有22%的广告公司他们是在中国。
如果说现在互联网其实都是免费,人人都可以上网,所以可以看到整个互联网的用户数量也是在不断地增长,那么这个就是在中国这样一个数量流的图表,大部分中间力量用户都是在中国,我们可以看到中国的用户,他的这样一个数量级是非常庞大,但是如果谈到网站上面的广告可以看到,很多流量其实是到了美国这样一个互联网平台。其实我们应该去平衡一下流量和广告这样一个相关性,如果说我们能够使用这样一个数据能够来帮助我们更好的追踪这些流量的来源,以及我们的广告投放的一些来源是在哪里。同时现在跟大家介绍另外一个例子,就是我们NIDS部署,这个能够保证网络流量安全性,如果说你在一个网站上进行浏览或者进行相关工作,大家可以通过这样一个追踪器可以捕捉到你对网站流量的时间以及网络浏览这样一个次数,我们可以看到通过这个CPU这样一个循环或者是字节,我们如果是2.5G是一个(英文),10个是2个(英文),处理器的速度是非常快,对于我们相关一个应用来说,我们在应用大数据的时候,可以通过CPU快速处理,来捕捉更多的数据。同时我们进行数据追踪可以并行进行,同时还可以负载平衡以及相关数据匹配以及兼容性的相关的了解,同时我们可以把相关内容进行匹配,然后相关的用户数据进行匹配。
我们可以通过大数据来提升业务表现,或者是我们数据这样一个表现,通过这个数据能做的很多,我们比如说10000是可以能够有利于我们流量的提升,另外一个就是我们智能应用,现在智能应用是非常广泛的,而且(英文),NFV有更多的灵活性,让我们的用户能够更好的知道系统所能带来的附加值,现在网络带来附加值其实已经渗透到我们智能应用系统和相关领域,现在有很多NFV是能够帮助我们系统更好的去工作,同时我们的使用者或者是我们的用户能够更好的对接,到我们相关系统,现在有很多相关的连接,,我们也提出来包括,是不是有很多价值,是围绕着核心,同时我们也在探讨NFV灵活性,还有另外现在大数据一个系统,大数据系统有很多并行应用,包括聚合和网格。同时我们数据包或者是数据级传输也是其中的一个非常重要的一点。
但是我们现在也面临许多挑战,其中一个挑战就是网络并行性或者系统并行性,通过一个非常重要的就是我们了解了这样一个过程,所以的话这样一个普遍下一定奏效,你可以加强组建在里面,所以目前不会频繁用在大数据,所以你需要改变我们的算法,你会带来一些挑战,能够绘制数据的处理,然后来做数据的管理,这点非常重要的是,保持其网络的联通,就是要有20年的经验,20年的算法可能是很慢的在演进,这个算法是很慢的在演进。
接下来看一下最后的总结,大数据和网络化是不可分割,我们会把它分在不同的学院,不同的研究团体,但是我们还是希望不要分开,希望在未来几年综合的融合,大的融合无论是系统还是数据能够发声,当然也会带来挑战,在研究和基础设施挑战,我们在过去十年有实验床,我相信的话从目前角度对我们不会影响太多,我们看到数据处理是一种软件服务器,但是这不光光在服务器,在网络上发声,在测试床发声,所以还需要融合,所以这样一些需要我们通力彼此合作,我想说的是在过去七年当中,我们做了很多有趣的事情,我也希望在接下来几年过程当中,我们能够一如既往的和你们展开合作,再次感谢各位的聆听,谢谢。
主持人:接下来提两个比较简单的问题。
提问:你好,非常感谢您的演讲。我和您意见一致,那就是大数据和网络相互连接,除此之外我觉得他们不光是牛郎和织女,我想对你的研究结果非常感兴趣,绝大部分都是国外的一些比较好的经验,我的问题是应该如何去确认这个广告的服务器,接收者根据他们的IP地址和公司,我们知道很多外国的公司,有服务器在中国,即便流量在中国,但并不意味着他们就是在中国做生意,服务器是在中国。
Kave Salamtian:第一个网页被下载下来,您会一系列的需求,然后前往不同的广告商,DNS的需求全网广告商,他们有他们的地址,比方说谷歌或者其他的任何的订单,比方说我们有一万个,我们要做的就是我们要看一下DNS,然后我们去分析其需求,跟踪其需求,我们看他的缓存,同时我们还有一些相应的内在的机制,我们要看不同的人,如果一个用户,看他的缓存,我们看同样的网站再看他的缓存,那么可能他们都不相同的缓存,所以会有不同的结果,这个不是共享,目前我们可以说,比方世界上有20%广告商是中国,即便是90%流量是分析过程当中在中国,但是直接广告实际上不是在中国发生的。
提问:非常感谢,这是非常不错的演讲。我的问题因为根据你的演讲,网友的处理是内部的渠道,但是大部分网站都是在美国,所以很多的投资是在美国,根据你的分析,为什么会这样,如何改变这样一种目前的趋势。
Kave Salamtian:为什么会这样,是因为每个人都在一些现有的平台,所以人们有这样的倾向,比方说一些中国的网站,完全是相同的一些,做一些相同的文本,所以最终结果就是产生这样一些流量是在国外的,有些所带来的结果事实就是,中国的广告业可能和美国广告市场不一样,美国广告市场有很多到页面到网页,中国的广告市场根据我所了解主要是看这些广告,人们可能会喜欢做一些地方化的广告,比方说一些汽车站、餐厅,然后去做一些普遍、大规模的广告,所以他们是地方式的,的确我们可能要做有趣的研究,我们会发现相互抵触、相互矛盾的就是这样一个问题,中国的政策来帮当地的一些运营商,百度等等去发展和人人网或者中国的微博,帮助本地的一些平台去发展。但是,当一旦他到国外,这是全球的问题,从经济的角度来讲,所以会带来一些问题,因为大部分广告页面,他们也是一个追踪者,所以法国情况又是怎么样,我想说的是有一些理念,但是不是那么紧急的一些理念,那么人们可能会难以置信,我的中国客户,中国的公司会开放这样一种合作和法国和欧洲公司进行这样一种合作。