2017全球未来网络发展峰会

创新合作共赢    引领未来发展

当前位置:嘉宾致词> > 分论坛七

《智能与时空》

编辑: 共浏览:790次

大家好,我演讲是“智能与时空”。这个更关注的是什么?智能本身是什么?而现在智能这样的系统它的方法是什么?因为方法我认为非常关键,我举一个我自己的例子,我的本科学的是轧钢,我在2012年以本科学历被南京师范大学以特殊人才引进,原因是什么?我是解决的计算机图形学还有GS,包括图形数据库,数据量系统性能这个问题,这里面涉及到一系列的关键技术,在这个领域的话,基本上我们是绝对的领先。而现在2013年的时候,我搞了一个公司,苏州超擎在股权投资上,核心算法是估值3个亿,是微软收购的唯一一个华人企业,也是这个行业国际的专家。而且在2008年,我们当时搞了一个公司,叫苏州新图(音),5个人,投资不到10万块钱,一年的时间把公司做到一个亿的价值,这就是方法的魅力,我讲的时空实际上来讲不是大家传统意义上的时间和空间,而是以时空来思考问题的方法,从智能上来说的话,它是智慧和能力的合成,感觉就是数据获取,记忆数据存储,语言和行为实际上是能力。这也是整个过程的话叫智能。也就是说前半部分是智慧部分,语言和行为是能力部分,主要和制造和人工智能相关比较多一些。

前面因为有一些专家都讲过了,我就不重复它,这里面我就直接讲,为什么说在智能系统里面跟时空的关系,因为现在的方法论是什么呢?是从物质研究得来的方法论,而不是从信息研究得来的方法论,现在的方法论主要是还原论和系统论。也就是说作为智能来说的话,关注的事物是全生命周期,从无到有,到物到无,还原论是我们最常用的,各行业认为是主流的方法论。而系统论研究的是什么呢?混沌和秩序之间的关系,所以这两个跟时空有什么关系?第一个,从牛顿绝对时空观把时空作为一种大的参照系,把物质在这个时空里面做一个参考,是一种线性关系,爱因斯坦发现时空不是线性,后面有复杂理论,是系统论,但是这是有的层面在思考问题,也就是说在智能里面经常遇到的是自组织,遇到很多一些新问题,很多一些要解决的东西都是从无到有的。也就是说这个过程的话,实际上来说时空并不是物质的时空,而是时空秩序。就像DNA一样,DNA的话这里面就已经包含了一个物种全部的时空信息、时空秩序。种瓜得瓜,种豆得豆,要研究一个智能的系统,必须有一种方法论能涵盖系统整个生命周期,我是以我自己的实践来阐述,在以时空、全系来思考问题,解决问题。在智能系统里面的话,作为一个自组织的系统,必须得解决三方面问题,第一方面是什么?有限和无限的第二个是简单和复杂的关系,也就是说很多一些系统一些现象如果是非常复杂,可能连人类自己都没有找到解决办法,如果我们自己没有找到的方法,机器是不可能找得到的,因为机器是靠算法来执行的。

还有一个是线性和非线性的关系,这是在人工智能里面,在智能系统里面遇到的三个非常核心的问题,这里面第一个,有限和无限的关系,我就举一个例子,现在因为地图已经成为我们在各种的一些截面里的标配,地图里面有一个核心的问题,数据量和系统的性能,就是硬件性能。这是一个相对而言是一个有限和无限之间的关系。我当时我们在做这一块,提出一个概念就是数据量不一定系统的运行效率,这个有限和无限涉及到一个什么问题?一个你的视角的问题你是以什么来视角来看你在系统当中不同变量之间的关系的,无限一般是快变量如果有限的视角解决无限的问题,可能得到是有限的结果,现在我们往往以数据本身的角度来看问题,所以说从数据的传输、显示、分析都到了系统的瓶颈,从而从有限的角度,比如说像素,一个屏幕的像素是有限的,在每个时刻,一个像素只能显示一个数据,也就是说我在任何时候,我手机所能够看到的数据是有限的。为什么现在在图形系统里面要做预处理,而且很多功能不能实现?原因就在于里面的视角的问题,主观的视角和客观的视角没有融合在一起,这个专业性比较强了一些。

它是一个有限和无限分开来考虑产生的一个矛盾,如果说我刚才说的,按照有限的视角去考虑无限的问题,无限一定会在有限的这块产生了相互作用,就变成非常复杂的问题了。如果说能把它解决,如果我们先说有限和无限之间的关系,我举一个例子,比如说太湖,有1000万个坐标点组成,我缩到很小的时候,我可能只需要10个坐标点,现在的做法是什么?图形系统是什么?除了切片之外,切片是不得已而为之,把1000万个座标点传过来,用显卡绘制,到最后发现你能看到的数据只有10个座标点,这就是主观的尺度和客观的尺度没有匹配,在客观里面没有把有限和无限包含进去,在建系统里面方法论的问题。也就是说单独在处理。

在这里面我们看一个传统的例子,也就是说前端只要400KB的数据,传输、显示接受都需要1个G,如果以有限的视角,无论多大的数据量都不会影响产品的性能,而我们做的产品,无论在军方、航天、测绘、智慧城市,都在应用,我们解决的都是其他软件无法解决的一些大的项目。这里面显示只需要400K,如果你只用400K绘制,绘制和数据量有什么关系?我不管得到的数据量,因为真正能够显示出来的数据量是有限的,如果说你只传输这400K的数据,传输也不是瓶颈,如果你只读取这400K的数据,也不是瓶颈,如果查询出来这400K的数据,查询也不是瓶颈,从理论上来说的话,数据量本不应该影响到一个系统的性能。这就是我们做的一个产品,(英文)品牌排第一,我们在跟它做测试的,这是2012年江苏省地理信息中心做的一个测试报告,我们跟数据量是没有关系的,一个系统的压力有个最大值,但是像(英文),它的性能在800兆的时候就已经差上1000倍的,我为什么在2012年被南师大以本科学以特殊人才引进进去,原因就是在做测试的时候在这些显示性能的话基本上是压力测试的时候是千倍关系以上。这就是一个真正的一个颠覆性的系统。

这个是在2015年中国电力科学院做的一个检测,因为我们进入电网需要经过他们的权威部门的检测,而这个检测ArcGIS单机,我们用手机,当时是一个美国路网,我们1秒就出来了,不用任何预处理,这里面包含了请求、接收请求、查询、读取、传输、显示,从查询读取、传输、显示,每一个环节不能超过1秒钟,而且的话我们是跟数量没有关系,也就是说即使再大的数据量,我们在军队,在军方500个G矢量数据我们仍然秒机打开,在军方的系统里面当时有12家单位做测试,我们是唯一一个能够秒机打开,其他的半个小时都是打不开的。

我刚才讲的有限和无限是以显示的角度,其实最快的是飞机,为什么?因为真正相关的有感到的数据和具有某种关系的数据是非常有限的,也就是说在空间飞机里面我们可以达到上亿倍,我给大家举一个例子,现在时空领域包括有一个热力图(音)无论是谷歌还是百度,热力计算都是在后台用云来计算,比如说我给你1亿条车的数据,在后台进行热力运算的时候大机器要运算半天,但是真正热力图需要的话,车要是分的,我是桑塔纳还是奥迪,任意的组合可以得到任意数据量的热力分析,可以达到秒级,而且后台没有压力,优化性能是在亿倍这个水平。这里面其实都是一样的,都是在以时空全系(音)建立一个新的方法论。我这本书在6、7月份会出版,书的名字叫《时空》建立一个全新的方法论,涵盖整个生命周期的。

这里面有限和无限要统一,一定遇到了一个问题,线性和非线性,当一个无限的东西,在有先的空间内一定会产生相互作用,作用的结果是什么?是有限。这个是简单与复杂,如果解决有限和无限,必须解决简单与复杂,比如说系统论,从发明到现在已经近100年,但是大家用系统论的情况很少,系统论是以非线性为基础的,非线性的问题非常难以解决,所以说现在的话以简化的思维,以线性来解决依然占据主导,怎么能做到简单与复杂一个统一?首先来说,因为做不到,所以说全世界对这个数据都在做处理,做提前切片的处理。

比如说我们现在,我们去年的时候,我们软件应用在哪里?中国的卫星计算中心,管理中国的卫星,数据量达到PB级,以前的数据卫星接受数据以后,要经过基本上一个星期几个月的处理才能看到,我们现在可以实时接受,实时就能看到影像数据,其实不算核心技术。现在的话有限和无限造成对立的原因,就是用简单的方法解决复杂的问题,比如说刚才我说,以图的角度,以数图的角度来看数据的显示,其实和数据量没有关系因为产生了相互作用,你需要的数据永远来说是有限的,就跟分辨率相关,但是用什么简化呢,数据一个一个传过来,一个一个绘制,最后相互覆盖,最后看到谁就是谁,这就是一种简单的方法解决复杂的问题,造成了有限和无限之间的对立。

这里面为什么说简单和复杂有一个对立,复杂的问题没有找到解决办法,比如这是一个国际难题,比如说太湖有1000万个座标点,我缩到很小的时候只需要10个,沿着太湖还有马路,这个时候我怎么取这个数据,而保证空间关系不变?这一直是一个很多院士一直在说这是国际难题,很难解决这个问题,其实我在2006年把它解决的时候还不知道它是一个国际难题。因为我是学轧钢出身的,也就是说在做这个领域的时候,并没有被理论所束缚,这里面简单与复杂的统一,实际上来说为什么要建全维?有限和无限之间的关系往往是怎么造成的?就是因为你维度太低,思维的维度比较低,你看到的事物是一个无限的。

比如说我们这里面做这个问题的时候有一样把复杂的问题把非线性的问题引入一个维度,在这个维度下,它的空间关系变成线性关系,变成简单关系,所以这个我也不去过多的展开,去谈。这个是能够做到数据量和性能之间一个有限无限之间关系的基础,就是要解决数据建立传输的问题,保证空间关系不变。

线性与非线性,有限和无限其实关注的是一个目的性,简单与复杂也是目的性,但是线性与非线性是一个规律性,其实智能系统是一个什么样的系统?是一个规律性与目的性统一的系统,也就是说线性和非线性能不能够进行统一,是简单与复杂能不能统一的一个前提。也就是说还原论是以线性为基础,系统论是以非线性为基础,但是线性和非线性并不是事物的本质,刚才我在介绍图形显示的时候你从不同的角度来看就是呈现线性或者是非线性,这就是维度的问题,思考问题维度的问题。

这也是举的一个在地图领域一个空间关系计算的例子,在传统方法变成指数级的关系,我们在解决它的的时候解决的有限和无限的统一,不管多大数据量,我计算的时间基本上最大时间是一样的,这也是一个线性和非线性关系的问题,这跟时空有什么关系?你比如说我刚才说的图和数据,这是两个不同的时空,简单与复杂的统一关键在于你以什么时空去看待这个问题,时间表示变化,空间表示存在,时空是存在变化的一个抽象。比如说如果说要有简单的问题来解决以线性的问题解决,那么在时空上来说,第一点时间的变化上尽量不变,是静态的,空间上尽量是简单的。但是,你对应的要解决的问题不是一个简化,比如说我举个例子,刚才说数据抽系(音)的问题,如果以数据本身来看,他们空间关系是个非线性的,因为你每一个点可能都影响到其他点之间的关系,你去一个点本来是相离,但可能变成相交的。但是我们从像素的角度就没有这个问题,因为从图的角度来说,有不同的图层、有道路、水系、绿地,他们之间要进行各个空间计算,但是我从像素的角度,首先一个时刻只能显示一个数据,其次在空间上像素是简单的,它是一个线性关系。所以说从时空的角度来分析线性与非线性,也就是说我们这个也是解决一个瓶颈问题。如果没有避让的话,两个文字叠在一起了,读图效果也不好了。我们看最后的结果,这也是2015年中国电力科学院做的一个测试,也就是说在压力测试的情况下,在50万个要素的时候,我们是0.005秒,但是(英文)已经超过了1万秒,这已经是达到亿级的水平了,上亿倍了。

在我们(英文)里面的话,如果要进行性能对比,达到亿这个水平,只看数据量,看你数据量有多大,这个是一个关键,还有一个比如说阿里下面有一个公司,叫千寻位置网络(音)我们跟它是战略合作伙伴,他们在做测试的时候,有个电子没拦,这个大家可能听说过,划一个区域,什么车能进什么车不能进,实际上就是一个最简单的点和区域的判断,在做压力测试的时候可以查1800多倍,1833倍,也就是说它仍然跟数据量没有关系,这是在空间关系计算上。

也就是说在空间关系计算上优势最明显,原因是我能做到线性和非线性的统一,基础是空间关系计算,也就是说当你缩的小的时候,每一个图源就是看到的路、区划叫图源,它所需要的坐标点是有限的。

我们现在申请的专利发明专利是26个,不是20个,授权的是16个,国内的是10个,有很多被评为高附加值专利,百优专利,没有垃圾专利,都是实打实的专利,现在已经到中午了,我就不占用各位时间了,谢谢各位。