第二届全球未来网络发展峰会

创新·引领·未来

当前位置:嘉宾致词> > 分论坛五

人工智能基础理论研究的新进展

编辑: 共浏览:721次

尊敬的各位同行和非同行早上好,刚才徐雷教授做了一个非常生动、形象而且很丰富的报告,我自己听了也很有收获,我们两个人是老朋友了,今天我这个报告可能跟这个报告形成了两级,他讲讲话的丰富多彩形象生动,我希望利用这点时间跟大家回顾一下同时分析一下人工智能宏观的情况,因为你对一个学科的发展在宏观上可以把握好,那么你理解好了其应用就比较心中有数,所以我们看刚才讲的题目就是对人工智能的一个评论,这个评论包含两个部分,一个是它有什么问题?我是喜欢泼冷水的,讲讲他的问题,因为现在发烧过热,我要讲讲他的问题,然后讲改我们对他这个问题的解决,取得的让我们自己很高兴的成果,大家听了是否高兴我不知道,我们这个团队里面觉得这个成果很值得向大家做一个简单的介绍。

首先看看人工智能简单的历史,但是会有一个比较明确的影响,所以这个叫做“历史现状和面临的问题”。

它的历史非常简单,3段,如果在理论或者一般的思考,真正从比较科学研究这个角度看,人工智能的研究从1943年,两位发表了一篇文章,就是关于神经原的梳理研究模型,这就开始了人工智能研究的最早的阶段,就是神经网络,它是受到人的智能的启发,大家都认为人的智能主要定位在大脑,大脑里面主要又是大脑皮层,这个皮层里面主要又是新皮层,而新皮层是由10的10次方甚至11次方这么多的神经元互相之间错综复杂的连接,具有非常复杂而且很先进的应生系统,所以不同的神经元形成了连接,这样就构成了网络,我们有这个非常简单的说法,就是结构主义模拟,这样一种人工智能的研究方法,现在大家都知道叫神经网络。

黑点就是源,还有很多的模型包括我们徐教授讲了很多,深度神经网络,咱们用这个典型来代表,这个模型应该是很有前途的,但是非常困难,因为你要做到真的跟人脑的神经网络一样复杂,那么工艺上分析上都会面临很多的困难,但是如果你把它简化行不行呢?工艺上可以简化,简化以后他智能的能力又消退了,进有实践上的困难,退也有问题,所以叫进退两难,在四五十年代大家觉得前景很好,但是困难太大。

这是1956年,1956年出现了这样的人工智能,是模拟人脑思维的功能,用计算机作为硬件编制聪明的软件来解决问题,这样一个为什么大家现在把它看作是人工智能起点呢?有一个原因就是因为人工智能这个词是这次会上才提出来的,但是研究是老早就开始了,如果只问这个名词你可以承认是1956年开始,如果是实质的研究应该是1943年就开始了,到现在70多年了,不是60多年。

这个办法你看,虽然现在做了很多非常多的成果,他最简单的模型就是这个模型,把专家的知识获取过来表示为一定的形式,把用户的问题也获取了也表示了一定的形式,这些大家用同样的形式就可以找到专家的什么知识可以解决用户的什么问题,关键是要有一个好的管理策略,不然答案在这,问题在这你找不到解决的问题。这条路看上去容易,实际不容易,不容易在哪里你要有很多的知识,不同的问题需要不同的知识,如果你要解决问题比较复杂就需要比较复杂的知识而这个知识到底边界在哪里,如何获得知识很困难,人工获得太麻烦,机器获取质量太低,获取了怎么表示要用逻辑,而现在的逻辑贫乏,标准的逻辑能力有限,非标准能力跟标准逻辑的兼容,以及这种标准逻辑跟那种标准逻辑的交融都有很多问题,判断也难,获取也难,现在的表示方式也有限,用逻辑表达、纵性表态表达,就是知识的瓶颈,好像一个非常窄的地方,这个好像很容易,但是实际上由于受到知识瓶颈的约束也非常的难,因此又有一帮人说我们还要找一条更好做的路,这样就出来了,就是1990年前有人开始做,但是真正表现出来是1990年是人工智能实验室的主任,提出了一种,这种办法跟前面两种不同,第一种是结构模拟,这个是功能模拟,这个不断什么样的结构不能什么样的功能只模拟这个智能系统的刺激,我们把这个刺激相应感知工作模拟出来,启不是也把这个行为模拟在机器上了,这个叫行为主义,有什么刺激把他识别出来,第一类刺激出来了我产应了动作来响应他,比如我们人今天凉快穿上外衣,如果是升温了我们要减掉外衣,就是外界的刺激跟我们要表达出来的东西是有这种常识知识在支持。

这个办法看上去就很容易做了吧?但是这种容易做的办法也有一个致命的特点,就是他模拟的比较浅层,深层推理这种东西他不能表现,所以一直到现在还是这三种方面在发展,每一种都有他的优点也都有它的缺点,目前的状态仍然是这样的。

那个是个历史,进展太丰富来不及讲,比如说神经网络,现在最热闹,听的最多的就是深层神经学习,他支持深层学习,就像阿尔法GO,很好的成果,做完这样的系统早一点1997年有(英文)打败了世界冠军,还有(英文)打败了两位问题两大的全美冠军,这个是阿尔法GO战胜了全球顶点的象棋高手。

现在有各种各样的机器人,特别强调是有智能的机器人,当然智能水平由低到高不断的发展,每一个办法就是三个路线都有自己非常精彩甚至是吓人的,阿尔法GO出来就把大家吓一跳,所以成果还是不错的。

但是面临着一个非常关键的问题,就是三条研究的路线每一条根据别的两条都不合作,所以人工智能到今天为止没有统一的理论,这件事可能问题就很严重,这是一个最大的问题,具体表示一个3条路线互不沟通,就分成3条路,分成三个片。另外现在的人工智能对信息的理解非常的浅薄,只利用了形势信息,没有利用他的内容和价值,但是智能智能,你如果不了解,试问你可以做决策吗?所以只看到这个形势对我们一般来讲就是叫1001这种数字串、波形,只了解这种对我们有害还是有益,这些就使得人工智能的理解能力非常有限,至于有一些识别,包括阿尔法GO做的很好,那是那些研究人员费劲了心机找到了一个最好的表现场景,因为下棋第一棋盘未知,棋局有限,规则有限,第三你走步我走步信息都透明,他处于这种一种对机器特别有利,对人类来讲非常的困难,因为变换多端,人脑算不过来,人工智能到今天就可以无往而不胜,哪里都可以用,远远不是这个状态,就是因为他还没有一个统一的理论,就因为他还不够深入,特别是对信息的理解,为什么对信息的理解不够深入是有问题的,信息是产生智能的源泉,只要有了信息才可以提炼出知识,有了知识才可以提炼出智能,第一关信息就是一个潜能的,注定你后面不可能全面真正的解决问题,这就是它现在的问题,这个问题的根源在那里,不是说我们的算法不够优秀,也不是程序编的不够有效,更不是因为硬件的速度不够,现在硬件的速度相当的快,如果量子计算再出来那个速度更是不得了,现在都不是克服他问题的关键,因为你看,分成三片光度上,深度上分成三成,只用了一成,这个办法的根源就是经典物理科学、经典物质科学的方法论,就是面对负责问题要分而自知然后合成还原,毛病在方法论上,不在编程、硬件,所以你要解决这个问题的话必须要找他的根源,这个根源就是分而自知。

怎么办?我觉得有两种比较要紧的做法,一种是现有的基础上继续向前推进,这个很重要,因为我们可以已经取得的成果把他改善,然后应用,甚至有可能形成产业,这条路我觉得大部分人都会在这提出,因为这样以来我们就可以把它的成果广大的公众可以用上,不然的说人工智能吹到天上去了老用不上,那不行,所以我觉得大部分的研究工作者应该走这条路,把现有的成果进一步推广、应用。

应用三个方法都有,值得用的地方,这个不细讲了,但是同时不能没有另外一条路,这条路就是“创新研究”应该说每一个人都应该去做,但是我估计真正有志于真正做这件事一定是少数人,有一位教授说创新这个字眼很亮丽,但是你真正做这件事你会感觉很孤单,这个可能是少数人去做。

这个就是要改变它的方法论,方法论是科学研究的范式,才可以利用潜能的继续,才可以解决这个问题,这样的一种研究我觉得如果不做的话我们就会有比较大的麻烦,比如说芯片,美国把高端芯片一卡,我们很多地方系统就不行了,做不出来了,而人工智能基础理论他的重要理论比技术理论的芯片还要更深刻、更普遍,所以要做基础研究。

我们有那么一小批我叫做“敢死队”就是喜欢这件事,没有资助也干这个事,我们干成了一件事,这样给大家一个印象,就是人工智能发展到今天他新的范事已经有了很多的成果,这个成绩我们还没有正式发布,但是可以给大家一个初步的印象,什么叫范事,这个简单说一下,科学研究一般有这么几个层次,受到你对你研究对象要有一个一般的研究,不是低层,就像世界观,你对这个世界增加认识,人工智能这件事你在观念上怎么认识,有了这个认识怎么去做,就是叫做行为方式,这个就是方法论,不是具体的公式,是原则上宏观上怎么做这件事,这两个都是看不到摸不着的,好像是在天上,但是它智慧着你研究的行为,所以这两层如果做的不好,那么你后面肯定要出偏差的。

有了这两层,我们关注的是最底层,就是我们要知道有什么样的概念支撑这个学科,有什么样的原理来解决这个问题,但是有了科学观和方法论比较有很好的转换,这个转换就是要有一个模型,一个恰当的,合理的模型来概括你的研究对象,模型不对,研究一定有问题,有了模型还不够,面对这个模型你到底怎么研究这个路径,从这种路径去研究还是去那个路径研究,路径选的不好研究也会出问题,这些问题都解决了,然后你就知道要有多少概念来支持这个学科。概念之间互相用什么原理联系起来,成为一个整体的有机理论。

其中这几个层次当中最上面这个一般人把它叫做“科学研究的范事”就是你的研究观和方法论,这两个是很重要的,但是又看不到摸不着,无胜于有,一般人往往不太关注这个事情,我觉得在这要呼吁一下大家,我们就想从上面做起,做了上面下面这个根的也要变,我们的观点现在的人工智能有一点张冠李戴,如果把这个范事比一顶帽子,人工智能是用了科学论的方法上来做它的这个问题,所以他可以在局部理论,这三个碎片,每一个碎片都可以取得成果就是不能形成合理,那么我们就想,要把这顶帽子拿掉,这叫做颠覆,然后自己要总结一个适合人工智能研究的帽子,人工智能研究的范事戴在自己的头上,这样的人工智能才有可能,才有可能解决这个问题。

所以我们看,现在我们做出来的结果这个图这边在我的右手边左手边是讲现代人工智能的层次,这边是我们新的人工智能理论得到的结果,我们只给大家对比,具体内容太多了,从我个人讲,从1987年开始研究人工智能到现在,30多年了,所以要在这个地方像大家详细汇报就没有可能,但是有一个结果就是可以很简明用一个列表的办法就可以。

科学观是用了物质的科学观,信息跟物质是两种基本对象,但是性质上有原则的区别,虽然也有联系,所以他物质科学的科学观,我们就总结了一套信息科学的科学观,书上就有这就没有办法跟大家详细解释了。

方法论现在人工智能用了经典物质科学的分而自知,见了什么都分,当然简单的不分,凡是复杂的东西都要分,人工智能智能要分了神经网络、机器人,但是信息上形势信息、内容信息、价值信息,形势现在比较容易,那两个就扔掉了,这个是比较大的问题,是个根源。

现在的人工智能基本上是以脑作为他的研究模型,当然脑是很重要的,但是不是全部,因此我们的研究模型叫做“主题与客体相互作用的一个演进模型”这个相互作用过程中脑发挥作用,但是如果没有输入,脑是空空如也,如果没有输出你的脑子做了再聪明的问题无法发挥实践效果,这个脑到底怎么做要取决于主题的目的,所以这个模型突破了,他的范事颠覆了,不是说把物质科学的整个范事颠覆了,是颠覆了它在人工智能这个地方发挥的通用作用,这个帽子戴错了要搬回去。

首先模型突破了,这个是很重要的一个突破,原则途径也突破了,刚才我们看到三种原则路线得到了突破,我们的路线就是机制主义就是我面对一个问题怎么才能够智能化的解决这个问题,不是看我的结构,也不是看的行为,这些都是表面的,面对这个问题你有你的目的,你有你的知识,怎么样去生长出一个智能的策略,产生智能这个机制是什么?有了这个机制任何问题来了我都用这个机制去对付它,这样就可以解决这个问题。

所以机制是根本的,至于我用这个机制解决问题的时候需要什么样的机构依赖于问题,会表现什么行为那我们机制实现结果自然就会表现出一定的行为,所以结构功能都是服从于机制,而这个行为是机制必须的结果。

这样以来就产生了很多概念上的突破和深化,你看人工智能的概念当然很多,但是最重要的三个概念一个是数据,尤其是大家今天对这个数据高度重视,也有点像智能一样发烧,但是智能现在的热度也已经发烧了,不过我们今天没有时间讲,数据智能,我们研究的人工智能领域概念很多,这也是列出其中比较有意义的一部分,没有原则的信息,信息的概念有客体的信息,有主体感知的详细,这个主体可以是一个人,也可以是一群人,大家的目的是一样的,可以是生物也可以是物体,都叫做主体,有语法信息、有语义信息、有语用信息,没有这个完整的信息你做决策是盲目的,只有在很多很特殊的场合你的决策可能会对,但是一般而言,你会犯错误,知识要分经验知识、规范知识、常识知识,还有本能知识,这几个知识是后天学的,本能知识是首先遗留下来积累给我们的。

认知的基础上就会产生意识、情感、理智,现在的人工智能根本都不管意识,从来没有管过意识,因为不知道怎么做,我估计今天多数人还不知道意识怎么做,但是我们做下来意识的技术实现是完全可以做的,当然做不到跟人一样完美,但是原理技术上实现是可行的。

情感,人工智能很长时间不敢问津,最近做了一些都是技术上自表面的情感表现,都不是内在生成的机制,我们掌握了他的机制这些问题都可以解决了,更多的概念没有时间解释,就是刚才两个可能他没有而必须要有的这些东西。

原理人工智能没有,它肯定有原理但是没有人总结,我们的理论有一组信息转化原理,你可以看到信息是个源头,代表问题,最终智能代表我们解决问题的方法,同这到那有一系列复杂的转换,而且要有创作性的转换,包括技术上大家关注的涌现,不是数学共识推推推就推出来的,凡是用数学公式推出的东西都不是人工智能,你一个方程初始的状态给你,结果推出来。人工智能是面临大量的不确定性,你有了原始数据到底怎么到达这个结果,不清楚有很多未定的因素,这样才把它定义叫做智能,当然我说公式推出来不叫智能也不好,这是人类智慧的结晶,但是里面有不确定性,有这样大的区别。

现在的人工智能发展下来用了分而自知的方法论和经典范事,产生了人工智能三大理论,就是人工行为专家理论,专家系统,最早叫物理符号系统,然后智能机器人理论,我们统一叫人工智能理论,这种人工智能理论跟人类的智能还是很多地方相通,这个非常有意义的。

我最后用一个模型表现一下我们做的那个结果,上面是主体,这是客体,主体跟客体相互作用,他给它一个信息刺激它,经过这么一个复杂的过程产生一个智能行为反作用它,我们人生活在这个世界上就是这样,各种问题刺激我们,我们经过各式各样的研究找到了解决这个问题的研究。

这叫发现问题,认识问题、解决问题,就在不断发现解决问题过程中人类不断的前进,如果没有这些问题我们就停留在原始状态。

这个是感知和注意,搞研究的人都研究注意,加入这个是个大数据的话那么这个大数据进来你每一个地方都要对付这个大数据,这个大概就是死路一条,我们的人工智能系统我们的这一统一理论由于有一个注意的机制,人就有这个能耐,世界信息无穷无尽,但是我的目的是有一定的目的的,如果这些信息跟我的目的没有关系的话,对不起,忽视,视而不见、听而不闻,过滤掉叫做“舍得”,舍那些跟我无关的信息,把我有关,无论是什么信息是跟我有关,这个大数据经过这一关变成了小数据,了不起了中数据,这样最后才好处理。

美国白宫总统科学委员会有一个文件很长,定义了这个大数据,今天我们至少咱们中国人可能把这个定义都忘了或者根本都没有注意,大数据有4个微,最后归结成一句话就是大数据复杂到这么一个地步,现在的信息技术无法处理,你有办法处理的都不叫大数据,所以你不要信现在的媒体甚至我们的中央台经常说大数据调研结果如何如何,然后过春节派出10多个记者,到时候找一个人,您认为幸福是什么?调查了以后告诉我们大数据告诉我们幸福是什么?这哪里是大数据、是小数据,不普遍的,现在很多大数据的结果,如果各位有研究大数据的我就冒犯了,都不是大数据,中数据、小数据都有可能,但是都不是大数据,我们把大数据变成了小数据,然后如果有关跟我们的目的有关,产生了感知信息,这个地方我有形势、有内容、有价值,所以我知道怎么后续处理,通过认知对这个问题就有本质深刻的认识,认识深刻了不等于我们就会解决了,所以要在这个上面把这个信息种到上面,产生技术意识,如果问题比较简单,技术意识靠本能靠尝试就可以产生反映。如果比较复杂就是经验知识情感,如果更复杂要用规范性的知识,包括前面一些值都一样,理智,每一个都可以产生反映,理智跟情感要结合,还是完全靠理智去做,这地方产生了综合策略,通过执行机构智能行为,第二个就是相互作用,一个客体作用于主体,主体反作用于客体,如果很理想这个问题就解决了,一般来说不行,因为很复杂,我们就会有一个误差,对这个误差我们就有一个评判,这个评判如果说有误差返回到这里来重新再走一遍,误差就是一个新的信息,然后你要改进策略,最后作用它的误差就会介绍,如果还不够就是再来一次,螺旋式的,每一圈都会更解决,这就是我们通用人工智能理论的模型。

这个模型通用人工智能理论怎么用就是这么用各行各业将来用这个办法来产生你的智能系统,你面对的问题,椭圆这个面对的问题,上边的蓝字就是你的意志,就是这些问题我就很多都舍了,进来的问题就跟我们有关了,这个问题是它挑选出来了,有了问题他告诉你解决到什么程度就算达到了目标,同时告诉你解决这个问题需要多少知识,在这个条件下人工智能机器就干这个红的这个字,就是信息转换与创造模型,产生了这个以后它就有了智能的行为来反作用这个问题,去求解,所以将来哪行哪业要做人工系统用这个理论的话,你要把问题定义清楚,把经济的目标要告诉我,必要的领域知识一定要提供,你就做这三件事,其他的不用管,得到了这个问题的信息通过复杂的转换变成知识,通过更复杂的转换变成知识策略,有误差的时候误差反馈学习优化,一步步逼近这个目标,这是个通用模型,这个模型得到了一个非常好的结果,就是信息转换与智能产生,是跟物质科学两个定理并列的,一个是物质定理和能量定理,物质定理是无物质转换为物质不能逾越,第二个能量,能量转换以能量守恒,能量也有守恒这个规律,这两个就是我们面对的客观世界这两个规律,但是在这个规律下我们人怎么认识问题,解决问题,求得更好生成发展的机会呢?就是用这个信息了转换与智能创生,利用这个,利用那两个就是可以在现实的世界中不断的认识世界、感知世界不断的发展。

谢谢大家。