2017全球未来网络发展峰会

创新合作共赢    引领未来发展

当前位置:嘉宾致词> > 分论坛八

《Working with Networks》

编辑: 共浏览:673次

我还是不会说中文所以今天只能用英语来演讲,今天要讲的话题简单的讲一下是我们听到过很多基础设施,经济以及这些对于基础设施带来的影响,对于生活带来的影响,所以我今天想要关注的一个话题就是大家所拥有的共同话题,就是软件方面的工具,以及如何让这些东西发生的。所以我可能以我个人的视角来讲一讲,但是这个标题是一个玩笑。我在网络方面已经做了很多年的研究了,不是你们的网络,也不是电信网络,不是互联网,而是我做的网络工具是用软件作为工具,是一种协调性的网络。目前的话我们合作伙伴有(英文),虽然我们有不同的理念在使用,推进这样一个基础设施的发展,所以你们做的是基础设施,而我做的是软件方面的研究,我们的研究不太一样,从基础的角度来讲,我们今天要提的在18、19世纪,当时那个时候可能是像数学的一些自动化的网络,我不知道是否有人听过这样,接下来是我们进入到一个神经网络接下来是数据挖掘,大数据然后是社交网络。所以这样是一个连续的过程,我们可以看到,在这个社交网络当中,有很多不同的应用,这些应用是非常的有趣的,接下来我们所看到的是在20世纪80年代,我们可能那个时候不是在寻求正式的封闭式的理论,我们希望能够得到一种清晰的模型,那种模型可以解释世界,但是世界并不喜欢那个模型,所以在那个时候这个想法就是我们寻找一个正式的封闭的模型,我们可能会了解到底是发生了什么?所以今天所发生的事情我们得到这种平衡型,但是最有趣的是让你了解神经网络,通过神经网络来存储信息,我聊的是1987年的情况,当我们有这样的神经网络过了几年你可以得到的是多层的网络,你有了多层网络,借助与多层网络,你可以在其中学习,我相信这是一个非常大的革新,但我们开始了解这样一种多层网络和了解软件和硬件,我们可能就希望有更新的东西,这是我博士学位的论文,也是我硕士学位的论文。接下来我们就开始的另外一个(英文)的推广。

这是当时1987年的情况,我们又有一个新的想法,这个想法就是延时的神经网络,我们制造出了一个叫回旋滤波器的滤波器,在1989年我们有了延时神经网络,它可以延时我们语言。在1993年的时候,我们就出现了这样可以对我们图像进行延时的神经网络,这些延时网络最终证实都是非常有效的。现在这样的一个延时神经网络已经绝种或者是灭绝不再被人们使用了,我们现在有更先进的神经延时网络。而且这些神经网络都是非常高效的,因为能执行很多这样的任务,但是它的问题也是有的,因为它需要很多这样的层级构架,大家可以看到,我们这些图片,可以看到它的层级都是非常多的,现在可能我们都能够用到比如说30层这样的一个层级,所以说其实是需求是比较高的。同时它的参数也是更多,它的机器可能需要更大的机器里运行这个。

所以说这些要求其实都是非常高的,当我在大学的时候我到了企业里面,我发现如果说能够培训这样不同参数我们需要在企业里面非常有经验的专业人员,比如说我们需要6个人能够共同才能做这样的一项工作,所以说我们在企业里面我发现这样的一个耗费其实是非常大的。所以说是非常不值得的。其实像培训或者是训练一个网络,更像一种艺术不是一种科学,我们可以这样讲,它做起来是非常不容易的。我们做了一些转变,与其说我们去寻找一个全球的闭环的理论来循环我们的系统,我们换了一种方法,通过我们的统计,我们学习不同的参数,了解不同的参数,我们也需要大量的例证和论证我们也希望在我们的计算的时间方面我们更为有效,也希望能够被我们所有的工程师能够使用。比如说像我的这个软件的工具,如果说被我自己使用,那可能什么都不是,希望更多人享用这样软件的工具,同时我们也希望能够解决问题,特别通过我们的数据挖掘来解决相关的问题。这里我给大家举一个例子,我们相关的数据挖掘的一个例子,在10年之前,我们有一个公司,这个公司是在美国,它们的工作就是安装手机或者是移动通讯的网络设备,它当时有一个服务等级协议的签署,这个服务等级的协议其实是能够保证这个公司能够在使用我们的这个数据挖掘的时候监管各种业绩指标。

但是问题来了,这个问题我们在很快就发现了我们的这个问题,尤其是当我们的数据出现报错的情况下我们也能很快识别数据报错的原因。如果说我们得到的这些数据挖掘到的这些数据,这些数据能做什么呢?这些数据能够更好的处理我们日常的运作,同时大概我们可以从我们所有的网络中得到一天就可以得到4000万的这么多条数据,这是2007年的处理能力,4000万的这样一条数据,其实在今天其实不算什么,但是在当时其实是一个很大的数量级。

我们需要做些什么呢?我们需要利用这些数据,通过来运用这些数据来预测我们的一些关键的数据指标,以及业绩指标。我们可以建立一个模型,通过这个模型我们能够识别什么是我们在这个模型中需要识别的失败的一些情况或者是报错的一些情况。同时我们也可以重新再回到我们的模式,发现我们的问题在哪里,与其说我们要派一队人解决系统上的一些错误,我们其实可以更远程的解决这些问题,其实这样的话节省了很大的一笔费用。其实只需要安装这样的软件,如果说当有报错的时候就可以利用这些软件识别我们模型的问题,这样的话我们可以节省很大一笔开支,这是一个好处。而且它也不会破坏你正常的网络运行,它还继续能够来收集数据,处理数据来应用我们的这些数据,在这之后,在2010年,社交网络已经盛行,大家可以看到盛行很多不同的社交网络,比如说在我看到在英国的伦敦这个就是一个facebook的分布图,如果说英国的人可以连接到英国的一个人,甚至其他国家的用户,我们做了这样的连接之后,这样的社交网络的覆盖面其实是非常大的,这就像我们的一个社区一样,这样的一个生态环境其实能够把所有的人聚集到一起,他们可以进行更加频繁的互动,大家可以看到有用户来来自于苏格兰,同时在蓝色的这一块代表的是一个区域,其他颜色代表的是另外一个区域,这个可以看到,所有的这样的一个连接是把各个国家和区域的人连接在一起,之前我的主席他也展示了这样的一个图形,其实这个就是我  所说的(英文)的网络的架构和网络的连接图,在这个中间其实就是我自己,大家自我的一个网络,大家可以看到不同的颜色是代表不同的板块的连接或者是不同的业务或者是领域的连接。不同的颜色代表不同的社区,大家可以看到,通过这样一个图表或者是地图,我可以看到我是什么样的人,我和各个社区之间的连接。从这个图我们可以看到,我们自己可以架构这样的一个网络。我们在美国发现一个一小群的人,他们彼此之间打电话打的特别多,他们仅仅只说一种彼此之间是交流,仅仅只是区间交流,你可以对他们这样的人进行特别的跟踪,了解这样一种言语,了解这样的数据是非常容易的,如果说你使用这样一种社交网络的话,这是另外一个例子,这个不是我来做的,这个例子非常的著名,我们使用这样一个打电话的数据在比利时通过手机来打电话,您可以建立起一种网络,我们会发现,这些点之间是有联系的,表明人们之间打电话,你发现比利时就像这样子的,如果说你了解一下的话,我们会发现有两种语言,有些人可能是说法语,有些人会说的是(英文)是另外一种语言,所以是绿色的点。所以你会看见,如果打电话,你可能会有两种方式,因为这里面有两种不同的类型的人,如果你接下来看到在中间您看到更多的信息,这个是在布鲁塞尔,布鲁塞尔是比利时的首都,他们彼此之间有交流,所以社交网络可能不止是这样一种人们所说的,心里面所想的facebook我们在这里面有数学的东西,了解在身边发生了什么,我们同时也会用其他的社交网络,我们首先用这样的CDR建立一个社交网络,可以提到社交网络的变量,我们建立一个模型,接下来我们用这样一种变量来做一些数据挖掘的工作,我们用数据网络来做模型,这个模型可能更加的智能化一些,可以让你发现一些比方是70%的人,可能在第一行,你可能在这样的模型之下会有一些提升,如果您看一下这个图片,我们会看到不同的变量的重要,其中的话有20个变量当中有15个是非常重要是关于社会、社交的一些变量。

这份是另外一个例子,是我们在网上观察到的,人们在网上买一些东西,你可以用网购,我也经常会用到,我们看网上不断的增加,问题就是我们希望要解决的就是我们能够测量到这种交易是否有欺诈的行为,数据非常大,你可能没有足够的时间,基本上我们会使用社交网络的模型,在上面我们可以看到,越来越多的变量被使用,在一开始可能有37个变量,描述着您的交易,就不断的增多,接下来您有了不同的模型,这个模型会不断的增加,所以以5倍的数量增加,在这样的情况之下,这一点是非常重要建立这个模型,这个模型具有预测性,不光告诉你下面的这些数据同时这是这样的网络,是一个商业的网络,我们来鉴别这个里面是不是有任何欺诈。

基本上这是我们来调查的一些工具,如果真的有这样一种欺诈的行为,那就会和其他的一些商业相联系,所以说你可以使用这样的一种工具来调查,第一起的欺诈事件紧接着顺藤摸瓜来调查其他的事件,通过这样的方式在网上。

所以我所和大家讲述的是不同技术的合并这些技术都在不断的合并,你可以看到数据的挖掘,可以看到大数据在不断的呈现,您也可以看到深度的学习还有我们的神经网络,我们现在所做的就是每一样东西或多或少都能够相互的呈现,相互的合并。如今的人们在提到大数据的时候,在底层的时候,这可能就是我们对于我们来说是非常有用的技术,你们也已经看到了数据挖掘的用处,你们也看到了大数据的用途,但是你可能还没有了解社交网络的用处,但是我想你们可以去关注社交网络,去利用这样一个工具,有一个开放性的问题,可能我还没有回答到的,那就是深度学习将会对于你们来说是非常的有效率,对于很多人都是非常的有效,很多人都希望用深度的学习在不同的情况之下,所以我相信或多或少你会从中获益的。我希望你们能从我今天讲的当中获益,这是我对于未来网络的总结,对于未来的网络你可以很多的数据,有足量的数据,来自于产品、网络,有很多这样开放型的公共的数据,所以您就需要去利用这些数据,合并这些数据,分析这些数据,使用这样的技术,我刚刚提到的技术,有了这样的技术和数据,你就可以产生新的服务,同时有更加积极的方略,而不是被动性的,回应性的方略,所以不要来使用这些预测性的模型,您可以收集数据,使用这些数据的科学的技术,有些人我想在这方面已经有所培训了,谢谢各位的聆听。