人工智能革命:从能听会说到“能理解会思考”

来源:科学网 发布于2016-11-15 10:14:19 评论(0)

人工智能(AI)什么时候取得突破?以什么方式取得突破?在过去的两年里,学术界、产业界和大众的认知都对人工智能进行着越来越细化的描述。实际上,人工智能不仅是发展火热的自动驾驶汽车、图像识别、语音识别,还是非常严肃的理论、数学、哲学、认知科学的综合。


当下的人工智能已经被我们简化到深度神经网络、人脸识别、图像识别以及一个个现实的机器人身上。当年提出AI的学者可以成为图灵奖得主、信息论创始人和诺贝尔奖得主,他们从最基础的领域诠释了对未来人工智能的憧憬,也为人工智能可以在各种产品上进行应用提供了开创性的理论基础。


历史总在往前进,因为个人计算机、互联网的不断发展,大数据及计算能力的不断增强,人工智能已经迎来第三次发展浪潮。将来,人类的每一项工作或许都能够被分解出来,都可以逐步被日益发展的人工智能所替代。


短期内仍要基于大数据


人工智能为什么重要?人类在动物界的突破是因为我们对语言的精确掌握,语言能更好地描述世界,描述人和人之间的关系。


语言和语音相对应,这些在人工智能里面非常重要。过去两年当中由于越来越多的人接触运算智能、感知智能和认知智能,有些人相信随着神经科学、脑科学的发展,我们可以掌握大脑中的拓扑结构和思考规律,甚至可以用计算机、量子计算机来模拟这个过程,这就是脑科学与人工智能的结合。


另外,互联网和将要到来的物联网将给人类带来大量的数据,利用大数据和现有的神经网络可以构建出大数据人工智能,其处理的数据维度和数据量是人脑不能负载的。


这两种思路都需要对人的大脑进行进一步研究,可能在几十年之后,科研工作者就能够指出人工智能的本质和实现强人工智能的必由道路,但在最近的五到十年里,人工智能仍会基于大数据来运行,工业上的应用红利将会不断产生。


科大讯飞在产业发展上获得的进步,总结经验主要有三大因素。第一是深度神经网络;第二是大数据,大数据并不只是规模比较大,其真正有价值的部分在于实际数据和真正应用中的数据概率分布相同。这在机器学习当中是一个非常重要的理论,即训练数据概率的分布必须和实际使用中测试的数据概率分布相同。另外,利用互联网和移动互联网的快速迭代,小步快跑的产品优化方式可以快速优化人工智能系统,也就是涟漪效应。


利用在工业界的经验和过去在人工智能技术方面的积累,科大讯飞在2014年的发布会上正式提出讯飞超脑计划,并且提出要瞄准运算智能、感知智能和认知智能当中最难的部分——认知智能进行突破。


努力突破认知智能


如何实现认知突破?人类的大脑是生物界当中的杰作,我们可以在不同的视觉和听觉之间进行切换。利用这样的框架结构,讯飞超脑包括两个层面的组织:感知层面上的神经感知系统,上升到概念层面,在概念层面会进行最重要的关于知识的表达、概念的推理和最后的决策,在做完这些决策以后还要把信息返回到感知层面。


利用这样的结构,科大讯飞结合过去五六年中在深度神经网络领域作出的不懈努力,其在国内首次将深度神经网络用于语音识别。科大讯飞在随后的几年当中将深度神经网络拓展到语音合成,再到自然语言理解、语言评测、图像识别等各个方面。


作文是非常复杂的事,对一篇作文评分不仅要给出多少分数,还得给出给这个分数的理由,更要有评语。用机器学习的方法,科大讯飞已经使得机器人找到一种映射关系,从过去的很多已经打过分的作文当中找到这种映射,从而让机器能够批改作文,而且准确度相当高。


进一步探索


技术的成果给科大讯飞带来哪些成绩?在今年的暴风雪语音合成大赛上,科大讯飞再次获得第一名,这体现了用深度神经网络做语音合成的最新进展。


科大讯飞作为牵头单位整合国内29家机构参与国家第一个人工智能重大专项——类人答题机器人。目前科大讯飞用基于CFN框架的语义和简答题系统进行很好的融合,在中文的材料阅读上取得不错进展。


在人机交互界面,科大讯飞也有最新进展,过去的人机交互是一个单工交互的系统,语音识别、语义理解是分别进行的,现在AIUI是多工交互,很多计算机及智能硬件的用户用了该系统之后分析,交互的成功率从原来的40%提升到现在的90%以上。


科大讯飞作为一个平台型的技术公司,将这些技术以免费、商用或者VIP的不同形式开放给用户。因为我们相信,将来中国在本轮人工智能浪潮中一定能够占据优势,无论是核心技术积累还是在互联网、移动互联网积累的产业优势,我们可以在中国用人工智能改变世界,而且我们绝不会满足于只在中国使用人工智能,我们一定能够把人工智能技术发展到世界的更高水平,并且应用到生活的方方面面中去。


(作者系科大讯飞轮值总裁,本报记者贡晓丽据其在AI WORLD 2016世界人工智能大会发言整理。)


责任编辑:宋金玉