+ 谭铁牛
大家“金句”
· 现在的人工智能有智能没有智慧、有智商没有情商、会计算不会“算计”、有专才无通才。
· 深度学习还不能举一反三、不能解释,“知其然不知其所以然”,与人类智能存在很大差距。
· 当前人工智能处于从“不能实用”到“可以实用”的技术拐点,但是距离“很好用”还有诸多瓶颈,理论创新和产业应用发展空间巨大。可以说,人工智能的春天刚刚开始。
人工智能在普遍被看好的同时,确实富有争议。近些年不断上映的关于人工智能、机器智能的科幻大片里,有些把人工智能塑造为暖男,也有一些塑造成给我们带来恐慌的机器人。的确给人们提出了很多悬念和问题:人工智能到底是天使还是魔鬼?
要回答这个问题,有必要搞清楚。人工智能的基本概念、人工智能目前能够做什么和不能做什么、人工智能未来发展走向。
人工智能,即“Artificial Intelligence”这个词及相关概念,是1956年在达特茅斯学院暑期研讨班上由一个叫约翰·麦卡锡的年轻人提出的。这个研讨班的主题就是怎样用机器模拟人的智能。当然人工智能相关研究并不是从1956年才开始,只是在这个时候才正式提出概念。
人工智能研究的主要目的就是探寻智能本质,研究出具有类人智能的智能机器,让机器或者计算机会听、会看、会说、会想、会决策。人工智能的概念提出到今天,62年过去了。从起步时大家的兴奋、到后来提出了一些让人期待但不可实现的目标、接下来的反思,一直到互联网出现以后大数据的涌现,使得人工智能走上一个新的高潮。
今天,人工智能如日中天、火遍全球,因此实事求是地设定科学目标显得尤为重要。1956年的研讨会有十个年轻人参加,其中一个很乐观,认为到2000年人工智能有可能达到人的智能,这显然太乐观了。但人工智能无论是在理论层面、关键技术还是具体应用上的进步是有目共睹的。
专用人工智能就是让人工智能系统专门做一件事——比如下围棋,是面向特定领域或者单一任务的人工智能。它确实取得了一些突破性进展,而且比人做得更好。可以举出很多这样的例子。
除了下围棋的AlphaGo,美国Boston Dynamics公司的人形机器人可以跨过障碍物,四足机器人像狗一样跑得非常快,可以爬楼梯,普通人看了确实会感到一种不安。
中科院自动化所的机器鱼、谷歌最新的语音人机对话都达到了很高水平,科大讯飞的语音识别把维语和普通话的互译做得非常好。各种人脸识别非常火爆,中国也走在世界前列。
过去二十年我一直在研究虹膜识别,这是人工智能的一个特定领域。瞳孔和眼白之间的中间区域叫做虹膜区域,1936年眼科医生发现每个人虹膜上的花纹都不一样,一岁半以后定形终身不变。目前国内很多煤矿的矿工考勤就大量使用这项技术。黑龙江的一家煤矿最早打算使用指纹识别,但人的手指可能会脱皮;如果刷脸,上班没有问题,下班时的煤矿工人满面煤灰,很难准确识别;而虹膜识别就没有问题。这项技术现在推广到国内很多煤矿。特别让我高兴的是,不久前中央电视台报道,虹膜识别可以用于寻找丢失儿童。
专用人工智能还能够成功应用在图像篡改检测上——确定照片是否经过修改。这用肉眼很难看出来,而人工智能根据图像内容分析可以自动实现篡改检测。这有什么用途?2015年有一天我收到一封信,里面有一张糟糕的照片,把别人的头像换成我的头像,要一周之内给他寄二十万。用人工智能就可以证明这张照片是假的。
Boston Dynamics的人形机器人和狗形机器人在2018年都取得了重大突破
面向特定领域的人工智能(专用人工智能)由于应用背景需求明确、领域知识积累深厚、建模计算简单可行,因此形成了人工智能领域的单点突破,在局部智能水平的单项测试中可以超越人类智能。
AlphaGo系列在围棋比赛中碾压人类棋手
DeepStack战胜德州扑克人类职业玩家
人工智能的发展现状
可以说,专用人工智能取得突破性进展,很大程度(特别是这几年)取决于统计学习或者机器学习的进步,特别是深度学习。深度学习其实不神秘,只是借鉴了人的大脑在处理信息过程当中的层次化过程。因为深度学习的涌现,ImageNet图像分类的Top5误差率从2012年的16%降到了2017年的3%左右,图像分类能力开始超越人眼视觉,也就是说识别力高于人。除了深度学习外,通过学习找出最好策略,这就是所谓强化学习。在博弈中学习,使得学习能力不断提高,这就是生成对抗学习。
人工智能值得一提的现状是,技术生态或者创新生态备受关注。科技巨头纷纷推出自己的开源系统、技术软件平台和硬件平台,原因是什么?他们没有忘记信息技术和信息产业发展的历史带给他们的启示。所以从传统的操作系统、硬件,到现在移动互联网再到新时代的人工智能,新老IT巨头都要全面转向人工智能。例如,2017年的谷歌I/O大会明确提出发展战略从“Mobile first”转向“AI first”;微软在2017财年年报中首次将人工智能作为公司发展愿景;百度在2017年明确提出“All in AI”;IBM也在 2017年全面推广认知计算战略……
另一方面,人工智能创新创业如火如荼。2017年全球新成立的人工智能创业公司就有一千多家,人工智能领域获得的投资达152亿美元,同比增长141%。在应用方面,“智能+”已经成为一种创新范式,向各行各业快速渗透融合、进而重塑整个社会发展,这是人工智能驱动第四次技术革命的最主要表现方式。当然其中有的是炒作,把传统的数据分析贴上人工智能的标签。但是人工智能发展迅速是一个客观现状。
人工智能已经加速成为国家战略,我可以举很多这样的例子。过去几年,最早被大家熟悉的“德国工业4.0”,核心就是人工智能;到2018年5月10日,美国白宫组织AI研讨会,成立AI专门委员会,确保人工智能领域美国第一。
在美国,近千名人工智能领域的专家共同签署了阿西洛马23条原则,关注人工智能可能带来的社会影响,以及如何规范人工智能研究和应用,以确保拥有自主意识的机器保持安全,并以人类的最佳利益行事。
但目前人工智能发展的另外一个客观现状是,人工智能领域的误解和炒作普遍存在。例如所谓“人工智能系统将超越人的智能水平”,“人工智能已达到5岁小孩的水平”,都是炒作。某一个特定任务中人工智能达到五岁小孩水平,是可信的,笼统地说人工智能达到三岁、五岁小孩,就是炒作。
这些炒作有的是有意的,有的则是概念误解混淆。比如经常有人把机器学习看成人工智能,但这只是人工智能其中一个研究方向;又有人把深度学习看成机器学习,但深度学习只是机器学习中的一种方法;有人只谈图像识别中的人工智能,这只是人工智能一个方向。还有人把大数据看成人工智能、专家系统看成人工智能、机器人看成人工智能……特别是把人工智能与人类智能、或者机器人与人类看成“零和博弈”,你死我活。这些其实都是误解,人和人工智能是可以互补的。
常有人误解,专用人工智能等于通用人工智能。什么是通用人工智能或者什么是通用智能系统?我们人的大脑就是一个通用智能系统。同样一个大脑,经过学习可以下围棋也可以下象棋,能够举一反三、融会贯通,可以处理视觉、听觉、判断、推理、学习、思考、规划、设计等各类问题,可以说一脑百用。目前的人工智能距离人类智能水平还有很大差距,还有很多人工智能不能做的事,而有的事对人来说非常简单。
所以说,人工智能总体发展水平仍然处于起步的阶段,美国的DARPA对人工智能现状也是这样认为的:从知识规则到统计学习,第二波人工智能技术在信息感知和机器学习方面进展显著,但是在概念抽象和规划决策方面刚刚起步。
2015年,我曾经用“四有四无”概括人工智能总体状况,三年以后还可以这样说,现在的人工智能是:
· 有智能没有智慧。智慧是高级智能,有意识、有悟性、具备综合决策能力,目前的人工智能是缺乏的。
· 有智商没有情商,机器人对人的情感理解与交流还处于起步阶段,与科幻电影中跟人类谈情说爱的人工智能还差得很远。
· 会计算不会“算计”,人工智能系统可谓有智无心,更无谋。
· 有专才无通才,下围棋的AlphaGo不会下象棋。
举一个具体的例子,现在语音翻译已经取得比较大的进展,但如果让人工智能翻译这几句话“他吃食堂,他吃面条,他吃大碗”,谷歌翻译把“大碗”、“食堂”省去了;同样,“那辆白车是黑车”和“能穿多少穿多少”,谷歌翻译也都无能为力。
又例如,学校餐厅打出“欢迎新老师生前来就餐”的横幅,人类理解起来没有问题,不仅知其然还知其所以然;但是人工智能算法就会发生歧义。
所以说,目前人工智能发展面临着数据瓶颈、泛化瓶颈、能耗瓶颈、语义鸿沟瓶颈、可解释性瓶颈、可靠性瓶颈。例如,深度学习很大程度上是黑箱状况,我们还不能完全从数据上论证为什么那么有效,不能完全确保这个多层深层神经网络训练是收敛的,所以有数据瓶颈。深度学习要提供大量已标注数据,还需要大量的人工;它不能举一反三、不能解释,“知其然不知其所以然”,与人类智能存在很大差距。正因为这些差距,人工智能未来发展还有巨大创新空间。
当前人工智能处于从“不能实用”到“可以实用”的技术拐点,但是距离“很好用”还有诸多瓶颈,理论创新和产业应用发展空间巨大。可以说,人工智能的春天刚刚开始。
人类社会经历机械化、电气化、信息化的时代以后,正在向智能化社会迈进。人工智能有望引领新一轮科技革命。世界著名科学家格特纳曾说:“人工智能将是未来十年最具颠覆性的技术,无处不在的人工智能将成为趋势。”
具体来讲,人工智能有八个宏观发展趋势值得关注:
如何实现从专用智能到通用智能的跨越式发展,既是下一代人工智能发展的必然趋势,也是研究与应用领域的挑战问题。通用智能被认为是人工智能皇冠上面的明珠,是全世界科技巨头竞争的焦点。美国军方也开始规划通用智能的研究,他们认为通用人工智能和自主武器,是显著优于现有人工智能技术体系发展方向,现有人工智能仅仅是走向通用人工智能的一小步。
人类智能和人工智能各有所长,可以互补。所以人工智能一个非常重要的发展趋势,是From AI (Artificial Intelligence) to AI(Augmented Intelligence),两个AI含义不一样。人类智能和人工智能不是零和博弈,“人+机器”的组合将是人工智能研究的主流方向,“人机共存”将是人类社会的新常态。
人工采集和标注大样本训练数据,是这些年来深度学习取得成功的一个重要基础或者重要人工基础。比如要让人工智能明白一幅图像中哪一块是人、哪一块是草地、哪一块是天空,都要人工标注好,非常费时费力。此外还有人工设计深度神经网络模型、人工设定应用场景、用户需要人工适配智能系统等。所以有人说,目前的人工智能有多少智能,取决于付出多少人工,这话不太精确,但确实指出了问题。下一步发展趋势是怎样以极少人工来获得最大程度的智能。人类看书可以学习到知识,机器还做不到,所以一些机构例如谷歌,开始试图创建自动机器学习算法,来降低AI的人工成本。
深度学习只是借鉴了大脑的原理:信息分层,层次化处理。所以,人工智能与脑科学交叉融合非常重要。《Nature》和《Science》都有这方面成果报道。比如《Nature》发表了一个研究团队开发的一种能自主学习的人工突触,它能提高人工神经网络的学习速度。但大脑到底怎么处理外部视觉信息或者听觉信息的,很大程度还是一个黑箱,这就是脑科学面临的挑战。这两个学科的交叉有巨大创新空间。
国际知名咨询公司预测,2016到2025年人工智能的产业规模几乎直线上升。国务院《新一代人工智能发展规划》提出,2030年人工智能核心产业规模将超过1万亿,带动相关产业规模将超过10万亿。这个产业是蓬勃发展的,前景显然是非常大的。
大家很关注人工智能可能带来的社会问题和相关伦理问题,联合国还专门成立了人工智能和机器人中心这样的监察机构。前不久,欧盟25个国家签署了人工智能合作宣言,共同面对人工智能在伦理、法律等方面的挑战。中国科学院也考虑了这方面的题目。
一些国家已经把人工智能上升为国家战略,越来越多国家一定会做出同样举措。包括智利,加拿大,韩国等等。
教育部专门发布了高校人工智能的行动计划。国务院《新一代人工智能发展规划》也指出,要支持开展形式多样的人工智能科普活动。美国科技委员会在《为人工智能的未来做好准备》中提出全民计算机科学与人工智能教育。
这八大宏观发展趋势,既有科学研究层面,也有产业应用层面,也有国家战略和政策法规层面。在科学研究层面特别值得关注的趋势是:从专用到通用,从人工智能到人机融合、混合,学科交叉借鉴脑科学等。
人工智能经过六十多年发展已经取得重大进展,但总体上还处于初级阶段。人工智能既具有巨大的理论与技术创新空间,也具有广阔应用前景。
现在回到题目中提出的问题,人工智能到底是天使还是魔鬼?我要说,高科技本身没有天使和魔鬼之分,人工智能也是如此,这一把双刃剑是天使还是魔鬼取决于人类自身。人工智能在天使手里是天使,在魔鬼手里就是魔鬼。因此我们有必要未雨绸缪、形成合力,确保人工智能正面效应,确保人工智能造福于人类。