
第二届全球未来网络发展峰会
创新·引领·未来
今天很高兴跟大家交流这方面的问题,这些材料实际上是根据国家工程院的领导下经过两年多的论证集体研究的结果,我是代表跟大家做一个交流。
我们都知道国家工程院启动了重大战略咨询的认证,这个认证的结果在2017年在国家新一代的人工智能的规划发布了,当然构想就是人工智能发展到今天有了很大的变化,过去的人工智能强调的是人类社会和物理社会里面模拟的过程,走到了三维空间里面有很多新的智能形态,包括人机制混合智能系统,包括下面向大家交流的群体智能的系统,以及更复杂的城市职能的系统等等。
因此提出了新一代人工智能的发展,在我们国家新一代人工智能战略布局主要是有5个新的智能的方面,一个是大数据智能、群体智能、人机混合智能、自主无人智能、跨媒体智能,就是这5主要的方向。
我今天主要讲的是群体智能,历史是非常悠久的,我们人类社会基本上就是一个群居的社会,这个词在科技文献里面最早是在1906年在参加英国的农业博览会上,他当然有一个观察,猜牛的重量,你参与的人数越多,最后把这个猜的值求和取平均以后就非常接近的值,因此他提出了群体智慧,从现在这个角度看是统计学经典的利用而已,这个例子可以很多放到人类社会的决策上。因此群体之是一个重要的领域。
在我们国家钱学森也提到到了综合集成研讨厅的概念,有远程研讨人参加,有专家群体在中心研讨厅进行最终研讨决策,我们在今天有开放环境下的群智决策,我们网上、网下专家以分布式的交互,通过充分信息的交互分布反馈形成更智能的更准确的判断,因此我们在国家论证当中提出的群体智能的概念,也就是从群体智慧提出了面临人工智能的群体智能,这个定义主要是3个部分,一个是在形成群体智能过程当中一定有智能的人机系统,这样的人机系统可能有大数据的支撑,在这个组织的系统结合下通过大量的数据结合起来,这个定义实际上也可以这样说,从现在的角度它更强调的是人类的群体智能和机器智能相互作用的方式,也就是说是人类和机器教与学的一种交互,首先是我们人产生了海量的数据,形成了网络的空间的数据,这些数据实际上形成了大数据资源可以用来通过积极学习的方式来训练机器,这实际上是任教机器的一个过程,反过来说机器的智能足够先进了以后,它在人的交流、判断当中会起到引导作用,通过人机的互相作用形成更为先进的智能形态。
这里面实际上有很多可以看到的例子,比如说谷歌公司做的这个系统,大家在填写各种验证码的时候,实际上是为真正的古典数据家旧的报纸进行智能的OCR的处理,比如说大家都熟知的(英文),产生了千万量级的数据,对现在CNN这样深度学习的系统有很大的提升,这里数据的来源实际上都是在(英文)成千上万的人对他进行标注才可以做的到的。
ImageNet每年采用竞赛的方式,让大家提交各自的算法进行比拼,汇集大家对于神经网络用在机器学习图象识别这种算法不断提升它的性能,从而使得在专门的领域机器识别的领域已经超过了人类。
所以这就是大数据加上深度学习能够推进人工智能发展的典型的例子,现在的网络已经远远超过我说的上百层的网络,现在已经是几千层的网络了。
还有这个小样本先验知识的AI学习方法,我就不多说了,根据小样本提供这个网络,可以利用人类的先进知识来进行智能。
前面提到的这几种模式跟群体智能都有关系,比如说我们最早的符号主义理念利用知识理论和推理来构建专家系统,这里面专家库和知识来源往往是不完备的,通常的都是需要人提供新的知识,不断的更新这个专家知识库。
现在大数据与统计学习包括经典的定期学习方法、深度学习的方法能力逐渐的提高,但是有很多的问题,比如说缺乏可解释性,数据来源的保证性,可以不断提供新的标注,同时对模型进行合理化的解释,形成对于可信、可依赖的机器学习模型,同时在强化学习当中,虽然强化学习强调的是机器自己进行探索,但实际上也有所谓逆强化的方式,通过人类进行展示,通过案例从那里反向提取优化的(英文),快速的形成机器应该执行的策略,这样的话可以避免说为了实现一个简单的共融需要进行反复的施措所带来的代价。
这些模式的特点就是通过信息化的网络支持把海量的人聚集起来完成传统意义上的单个单位无法聚集的人类的力量形成丰富的知识、创新的成果等等。
实际这种方式已经广泛应用于科学研究和智能创新,比如说最近这里面发表的(英文)科学实验,就是发动10万的支援者,实际上就是通过人产生实际的随机数,来验证爱因斯坦局部性的假设和端研,这是非常经典的例子。
在美国已经广泛的应在像对于天文数据的分析上,比如说蛋白质结构的探索上,甚至以米波物理这上面。
群体智能总的来说是两个形态,一个是通过人类群体贡献大数据就是人工智能,第二个是基于互联网的群体使能的人类智能,在知识、月侧、数据、服务都是有人机融合的系统。
在研究这样形态的里面我们提出了4个问题,因为这样的问题在控制论里面跟其他的人工智能有一个不一样的地方就是人的因素比较复杂,除了有理性的(英文)以外,更是非理性队伍,无法用理性解释的东西来影响它,怎么把它组织好,怎么样涌现可以控制的智能可以有效保证智能的质量,以及通过计算的方法能够实现,这些都是需要解决和攻克的问题。
我们都知道人的人质局限实际上在社会学和认知学里有大量的研究,人的决策能力要受到时间、经历、知识、阅历和掌握知识范围的影响,很多时间我们做的决策并不是基于优化的非常理性的决策,他存在知觉偏见,为了快速作出判断,是通过直觉做到的。
还有很多刚才我提到的因素,在股市上面,社交网方面都做的到,一个是多样性,参与的人是多样的,这些人比较是独立思考、独立工作的,第三个是分布式的组织第四是相对集中的方式,这四条特别是像独立性、独立思考等等,在现实生活当中我们知道并不容易做到,比如说像2016年的美国大选,有剑桥的公司就利用这个(英文)影响大选,实际上就是影响选举的群体的决策和群体的技能,我们许多对群体智能的研究构成真正的AR的平台,这个平台可以机理人们发挥自己的智能,同时可以平衡和协调,特别是要注意消除群体认知里面可能存在的各种偏见和负面的严肃,以至于在很多噪音的情况下人们可以在真正的理性决策当中可以做到判断决策,从而实现不同来源、或者相互冲突的群体智能的有效的会聚,实现群体智能的涌现,这就是我们讲的四个方面里面最关键的地方。
人类的认知学的研究实际上做了很多年,包括我们深度的研究都密切相关,对于不同层面的对于认知,一般的感知,因果分析,规律的判断逻辑推理等等都有大量的原则,通过符号的系统,通过贝叶斯概率刻画来刻画,我们把人类的认知和机器的认知结合起来,形成群体化的智能,这就是我们研究的基本的分子和思路。
在这种思路的指导下,我们首先要有一个交互性的学习框架,包含了很多经典的机制,迁移学习、强化学习等等,以便可以构建可以解释、可以面向多任务的返还能力的方法。
同时我们以前经典的人工智能系统,特别是基于符号主义逻辑的系统应该增强他们的学习能力,这里面的开放逻辑和大量的动态的逻辑系统其实也具备在开放式的环境下自我增加逻辑性的学习能力,在数据和知识层面进行多范事有效的融合,能够产生我们需要的智能,在这个过程当中,因为它有足够交互的方式,可以把人类标注可信的数据灌输进去。
我们目前认为大体上群体智能有主要的形态,在这样的形态里面他们具有不同的任务,同时他们的组织方式可以是各式各样的,比如说通过市场的方式,有的是通过社区的方式,人跟人之间可以进行有效的认知和交流,开展相应的任务,同时人机的设计是高度综合和整合在一起的。
我们最后举两个例子帮大家理解这个系统,大家都知道智能问答系统非常的火热,目前主要的像谷歌、苹果公司做的都有典型的系统做的,最近给个的(英文)有典型的表示,所以他已经具备了自然对话的能力,把这样的系统放在特定的领域里面其实它其是很不够的,如果把这样的系统放在开元开放的社区的管理里面仍然不够,在左边这张突出了我们已经有的AIP的知识包括逻辑的系统放到里面,同时下面需要有人类的智能来帮助他,一方面可以对他生成的答案进行融合,同时可以在不同的领域里面会聚新的支持,同时在特定的有价值的规范和行为规范要求的地方,可以让人类更好的对这样的系统进行约束,比如说在美国用的时候会产生一些偏差,如果有人进行有效的控制对这个问题是可以避免的。
在英国也有人用聊天机器人来动态收集大家的信息,我们相信动作群制会以更多的领域发挥它的作用。
第二个场景就是所谓在软件开放过程中怎么样运用群制,软件开发本来是一个高智力的活动,设计很难,并且软件微机的说法很多年,我们怎么样利用我们人工智能的方法可以有效提升软件开发的周期,提升它的质量,可以降低成本,特别是安全关键的软件里面我们怎么样能够,因为我们所有整个的设备,怎么样做到安全可靠,这是实际上长久研究的一个问题,在新的人工智能的时代里面首先软件开发的过程在一定程度上是群制化了,很多的软件我们都来源于开元软件,汇集了群体智慧,同时我们可以利用群体智能来构建面向理论的知识突出,对于软件的模型生成以及代码生成一系列的问题都可以变得更加简化,另外一个思路就是在过去我们对于程序分析大部分是通过逻辑角度思考的,但是现在的研究可以结合起来,这个分成两个层面,一个是对于一个代码和程序他的各种描述本身是自然语言描述表达的。第二个程序语言被认为是语言程序,可以进行分析和研究,结合这样新的方法论我们就可以构造在设计、编码、继承和代码的验证测试等等很多环境里面利用研究智能的方法构造可以支持程序自动化的工具,我们相信这一天一定会到来,通过这个例子我们可以战时出人类的群制怎么样可以更好的帮助机器提高它的能力,同时反过来支持我们人类自己的智力创造活动。
我的报告就到这里,谢谢大家。