今天所说的人工智能,它是指在机器上实现的人类智能。包括认知智能、感知智能、决策智能等。我们通常所说的人工智能,实际上是广义的人工智能。现在技术实现的智能,其实分成两类:一类叫做强人工智能也叫广义人工智能,几乎所有人类拥有智能的行为机器都能做,这叫通用人工智能;另外一类人工智能叫狭义人工智能或专用人工智能,它是指特定的智能。比如人脸识别系统,它只能做人脸识别,它是特定人工智能系统或狭义人工智能系统。狭义的人工智能和广义人工智能并不等同,并不是用几个狭义人工智能堆起来就是广义的人工智能,没有这么简单。了解了这个概念,我们可以讲人工智能的“3144”了。
人工智能三个阶段
人工智能的3144,第一个“3”,是指人工智能到现在为止经历了三个历史阶段。第一个阶段,叫做基于符号逻辑的推理证明阶段,第二个阶段,叫做基于人工规则的专家系统阶段。第三个阶段,是从2006年到今天,叫做大数据驱动的深度神经网络阶段。第一阶段从1956年开始,当时大家认为,所谓人工智能是在机器上实现人的智能,人和动物最大的差别是逻辑推理,如果能进行逻辑推理就有智能。所以用计算机实现逻辑推理是当时最核心的动机。为了实现逻辑推理,当时采用布尔代数、演绎推理、三段论,后来又专门设计。
第一阶段数学的几何定理证明。1956年,卡内基梅隆大学就罗素所著《数学原理》的定理做了证明。到1959年,洛克菲勒的数学家王浩把所有350条都证明了,这是比较顶级的工作。由于开始时很顺畅,大家很乐观,1958年有两位非常著名的人工智能专家,提出非常著名的四个寓言:十年内,计算机将战胜国际象棋冠军;十年内,计算机将证明数学定理;十年内,计算机能谱曲;十年内,计算机将能实现心理学理论。只做了数理证明其他遥遥无期,再加上一个英国学者在1973年写了一篇文章,对人工智能狠狠地泼冷水,人工智能第一次跌入低谷。
1976年以后人工智能慢慢回暖,有两个原因:一是研究人工智能的人反思了一下,人工智能总做阳春白雪、数学定理证明不行,必须接地气,要做专家系统,让老百姓真正接触到。当时有人做心理咨询专家系统、故障诊断专家系统、治病专家系统、医生专家系统,各种专家系统。国内在20世纪80年代开始有各种各样的系统,比如农业专家系统,是那个阶段主要的方向。在那个时期,专家系统主要用两种工具,一个工具是用逻辑推理的,基本是基于规则的。另外一个技术基础是神经网络。
又发展了十多年,遇到瓶颈,总有压倒骆驼的最后一根稻草。第一根稻草是日本研究第五代机器化,不成功,草草收场;第二根稻草是美国以斯坦福大学的专家为主做知识图谱,把百科全书所有知识输入到计算机,有什么问题,百科全书都可以回答。这个系统做了十多年,互联网兴起后,很快被互联网超越。所以這个项目也失败了。这两个项目的失败,导致大家又对人工智能失去信心。
第三次是算力加上大数据共同发力导致的人工智能的浪潮。这次完全是从数据驱动的,这也是这次和前两次的区别。
这次人工智能浪潮的里程碑是2006年有一名加拿大学者叫Geoffrey在科学杂志上发表了一篇论文,提到深度神经网络可以进行大规模的学习,可以训练、进行推理。2012年Geoffrey的学生用他的思路做了神经网络并参加比赛,一鸣惊人,把第二名远远甩在后面。
华人的贡献在2015年,当时在微软亚洲研究院工作的孙剑博士,领着他的团队提出“残差网络”。残差网络提出后,在比赛里取得第一的好成绩。孙剑错误率降到了3.57%,远高于排在第二名的谷歌团队的6.7%。当时孙剑的成绩已经超过人的图像分类的能力,当然他使用的网络也不一样,别人用的网络是22层、19层的,他是用152层的网络。这个网络现在非常有名,大家知道,AlphaGo后面是AlphaZero,AlphaZero用孙剑的网络,这个网络就是非常有名的深度学习的工具。
AlphaGo,2014年4:1战胜韩国的当时世界围棋冠军李世石。回去以后团队进行了分析,原来李世石走了一步棋谱里没有的棋,机器不知道怎么下,随机走了一步就输了比赛。当时人类能够有记录的棋谱共3000副,所有可能的棋谱是1.5亿副,当时用来训练AlphaGo的数据,占所有可能数据的20%多,还有70%多的数据是没有的,因为没有数据,当遇到你没有的数据时可能会输。最后AlphaGo重新设计了系统,设计了AlphaZero,并让其自己互相下,走棋谱里没有的棋,把所有可能的棋都下了一遍,用1.5亿个棋谱训练了AlphaZreo,所以AlphaZreo是无敌的。
人工智能的一个判断
做智慧广电,要用深度网络学习,深度网络学习要有最全的数据、好的算法、足够的算力,三个加在一起会做出出色的智慧广电。数据、算力、算法是这一轮人工智能最基本的三个要素。这轮人工智能发展还有一个特点,所有顶级的人工智能科学家都是和企业一起研究。因为企业的数据是最完整的,要想做一个好的智慧系统,没有大数据是不能实现的。
人工智能3144,“1”一个判断。现在就弱人工智能或专项人工智能来说,只要数据够全,就可以做得不错。为什么会有那么成熟的人脸识别系统、语音识别系统、机器翻译系统?因为数据用训练可以做得好。弱人工智能大规模应用已经“成势”,要乘势而上,顺势而为。人工智能是不是行了呢?强人工智能现在还不行,还有非常长的路需要探索,可能是10年、20年,30年、40年也都有可能,这个取决于现有的机器架构,做强人工智能是马太效应,大车要用更强的系统拉,那个系统是什么,现在不知道。有可能是类脑系统、量子系统,也可能是其他系统,现在的算力做强人工智能还不够,弱人工智能没有问题,这是基本判断。
人工智能的四个优势与短板
3144中的第一个“4”,是我们国家发展人工智能有四个优势条件。第一是有政策优势,我们国家对人工智能非常重视。第二是数据资源的优势,我们国家拥有海量数据,这是其他任何一个国家没有办法比拟的。第三是丰富的应用场景优势。我们有非常丰富的应用场景,不管是城镇化、老龄化、制造业转型升级还是互联网市场。所有这些都给我们提供了非常好的应用场景。第四个是我国的青年人才,储备非常充足。我们有全世界最大的高等教育体系,工科学生占的比例非常高,这些学生都是将来进入人工智能领域潜在的青年才俊。当然我们也有四个薄弱环节:一是起步晚,再加上前些年科技领域的评估需要短平快,所以一个人很难研究一件事,冷板凳坐30、40年。像有一位加拿大那位教授研究了40年,最后发出一篇论文引爆这个领域。由于这两个原因,我们原创性的东西略微差一些,这个我们实事求是,必须要承认。所以真正原创的研究,大多数来自美国、加拿大和英国。二是高端芯片。不管GPU、ASIC、FPGA,主要掌握在别国企业的手里。不光是芯片,也包括传感器,对这部分研究,我们也需要补短板。三是缺乏有国际影响的人工智能开源开放平台。现在有影响的开源开放平台基本都是别国做的,像谷歌、微软、亚马逊、Facebook、IBM。国内企业也在推广,但影响力非常小。第四是高端人才的短板。我们高端人才不足,刚才说青年才俊很多,但是高端人工智能的人才和美国相比,只是美国总数的20%左右。
(根据高文院士的公开演讲整理而成,未经本人确认。)