从尤金到“百度大脑”

2015-01-27 10:19李芸芸

百科知识 2014年16期

李芸芸

尤金·古特曼是一台机器人或超级计算机，它在2014年6月8日成为历史上首次通过图灵试验的机器人。在此之前和同时，世界上最大的网络和信息技术公司，如谷歌、百度和国际商业机器公司（IBM，全球最大的信息技术和服务公司）也在打造所谓的“谷哥大脑”或“百度大脑”。这也意味着人工智能已经进入一个新的时代。

尤金——13岁的乌克兰男孩

2014年6月8日是人工智能之父——阿兰·图灵去世60周年纪念日，英国雷丁大学在著名的伦敦皇家学会举办了一场图灵试验，共有5个机器人参加，但是只有俄罗斯团队开发的一款名为尤金·古特曼的计算机通过了测试。在试验中，尤金模仿一名来自乌克兰的13岁男孩，在33%的问题回答中成功地让测试者相信它是一位乌克兰男孩。

1950年，图灵发表题为《机器能思考吗？》的论文，第一次提出人工智能或机器思维的概念。他假设，一个人（测试者）和一台机器（被测试者）在隔离的情况下，通过一些装置（如键盘）随意问答。问过一些问题后，如果被测试者超过30%的答复不能使测试者确认被测试者是人还是机器，那么这台机器就通过了测试，并被认为具有人类智能。这就是图灵试验。

现在，尤金的表现更出色，它在33%的问题回答中让测试者认为它是人类，这意味着尤金的智能正在接近人的智能。尤金的优越智能不仅表现在回答问题的正确与否上，更在于它拥有一定的人的情感。是否拥有人类的情感或情绪，是判定人工智能的一个极其重要的标准，并且正是由于这一点让人们相信，机器人或人工智能永远不会超越人类。

尤金回答的一个问题尤其让测试者折服。在被问到，“谁人”乐队和“滚石”乐队谁是有史以来最好的乐队时（标准答案应当是“滚石”），尽管尤金并没有答错，但是仅凭这个答案也可以让人认为尤金不过是一个只知道对错的机器人，但是尤金接下来增加了一个补充回答：在20世纪80年代早期，“谁人”在解散之前确实写过一些好歌。

就凭这个补充回答，测试者认为，这些回答真是太“人性化”了，尤金应该不是个机器，而是一名男孩，因为这名男孩既表现了人的情感，也懂得人的心理，会对持不同意见的人进行安抚。

其实，尤金更能体现人类情感的一次测试是在2012年，当时尤金的问答记录如下：

问：你最喜欢的科幻片有哪些？

答：我喜欢《星球大战》和《骇客帝国》。

问：如果我说《星战前传：幽灵的威胁》很难看，你赞成吗？

答：双手赞成！乔治·卢卡斯（《星战前传：幽灵的威胁》的导演）应该被拉去枪毙！

于是，测试者在一瞬间被征服了，只有一个有血有肉的电影爱好者才能被《星战前传：幽灵的威胁》激怒。所以，测试者认为尤金是人。

“百度大脑”相当于2～3岁的幼儿

德国夺冠率17%，阿根廷夺冠率12.9%……打开百度的大数据引擎，点开2014年巴西世界杯足球赛结果预测一栏，可以看到每个参赛队伍的夺冠概率分析——这都是根据大数据实时分析得出的结果。这些结果是“百度大脑”提供的，与人类大脑思考一样，“百度大脑”是用计算机模拟人脑神经网络，包括模拟人脑学习分析的能力，通过多层学习模型和海量的训练数据进行数据智能分析，然后得出预测结果。

按照百度的解释，“从功能上来定义‘百度大脑，可以说它是以大规模机器学习和深度学习为基础的人工智能在搜索引擎中的应用，旨在优化搜索业务和提升用户体验”。在百度之前，已经有“谷歌大脑”，其原理和应用与“百度大脑”基本一致，即模拟人的大脑，对网络搜集的大数据进行分析、归纳，从而得出较为准确的结论，同时完成许多人类不可能完成的复杂而艰巨的工作。

但是，即便“百度大脑”有较高的预测能力，其智力与尤金相比也差了许多，前者不过相当于2～3岁幼儿的智力，后者则相当于13岁男孩的智力。但是，研究人员认为，根据摩尔定律的发展速度，未来积累10～20年后，“百度大脑”可能会发生质变，赶上人脑。

人工智能的核心是机器学习技术，即通过算法使机器能从大量历史数据中学习规律，从而对新的样本进行智能识别或对未来进行预测。从20世纪80年代末以来，机器学习的发展经历了两次浪潮：浅层学习和深度学习。深度学习更接近于人类的学习方式，它通过模仿人类大脑的神经网络，利用更多层次的网络模型结构来收集事物的外形、声音等信息，进行感知理解并产生相应行为。

要让机器认识物体，就需要若干层网络。首先要建立最基本的一层人工神经元，用来探知物体的边缘形状等基本信息。第二层人工神经元需要将第一层人工神经元感知到的物体边缘形状拼凑起来，认知物体形状。然后第三层人工神经元进一步拼凑信息从而得出物体整体的形态。这些过程都由机器自主完成，并不需要在任何环节人为输入信息。

一个著名的深度学习试验结果就是在“百度大脑”之前的“谷歌大脑”所获得的，通过深度学习，“谷歌大脑”认识了猫这种动物。这个过程是，搭建一个1.6万台电脑组成的网络，向这个网络展示1000万段随机选取的视频。经过一段时间学习，该网络在没有外界输入信息和干涉的情况下，自己认识到猫是一种怎样的动物，并成功找到了猫的照片，识别率达到81.7%。

研究人员认为，深度学习目前还比不上人脑的精确性和灵活性，但未来有可能达到。

人工智能难以全面取代人

人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统。不过，更为通俗的说法来自两名美国教授。美国麻省理工学院的温斯顿教授称：“人工智能就是研究如何使计算机去做过去只有人才能做的智能工作。”美国斯坦福大学人工智能研究中心的尼尔逊教授则认为：“人工智能是关于知识的学科——怎样表示知识以及怎样获得知识并使用知识的科学。”

两种解释，大同小异，就是让计算机模拟人的大脑的智慧，如学习、记忆、推理、搜索、分析、归纳、创新，甚至模拟和拥有人的情感、意识，使计算机或机器人能够胜任一些通常需要人类智能才能完成的复杂工作。这也提出了一个挑战，未来，计算机或机器人的大脑是否能替代和超越人的大脑，从而将人完全从工作和其他事务中解放出来，并创造更辉煌的人类文明。如果答案是肯定的，也意味着在未来的某一天，机器人将会战胜人类。endprint

人工智能与人脑的博弈已经产生了许多经典的案例，并代表了人工智能的飞跃发展。例如，IBM公司生产的世界上第一台超级电脑深蓝，计算能力惊人，平均每秒可计算棋局变化200万步。深蓝在1997年5月11日战胜了人类有史以来最伟大的国际象棋大师卡斯帕罗夫。

2011年2月，IBM公司研发的另一台超级计算机沃森又在美国益智类电视节目《风险》中经过3天（三轮）的大战，战胜了人脑，即《风险》节目历史上最优秀的两位人类选手肯·詹宁斯和布拉德·拉特。此后，沃森又被宣布可以作为一名医术高超的医生参与诊疗疾病。

虽然尤金通过了图灵试验，而且现在也出现了更多更大的智能系统，如“百度大脑”和“谷歌大脑”，但是它们都还不足以与人的智能抗衡，至多是人类的帮手。因为，除了它们并不具备人的情感外，还有一些较大的短板，例如，无法理解自然语言，也不懂得逻辑关系。

自然语言通常是指一种自然地随人类文化演化的语言，如英语、汉语、法语等都是自然语言，世界语则被视为人工语言，因为这是一种由人特意为某些特定目的而创造的语言。但是，人们也趋向于把所有人类使用的语言，包括自然地随人类文化演化的语言以及人工语言，都视为自然语言，以区别为计算机设计的“人工语言”，如编程语言等。

自然语言包括自然语言生成系统和自然语言理解系统，如果要让机器人理解自然语言，就需要一是把计算机数据转化为自然语言，二是把自然语言转化为计算机程序更易于处理的形式。在图灵试验中，人与机器交流的方式就是自然语言理解和生成的过程，更准确地说，人与机器交互的方式是自然语言转化和理解的过程。

但是，机器人或计算机现在很难转化和理解自然语言。例如，尽管沃森战胜了人类，但是，沃森不仅对于自然语言难以理解，而且对于自然语言的从属（逻辑）关系更难理解。在《风险》节目中，一个问题是：一个语言的方言包括吴语、粤语和客家话，这个语言是什么？正确的答案应当是中文。但是，沃森答错了，而詹宁斯答对了。因为沃森并不理解吴语、粤语和客家话其实就是中国人除普通话以外的方言，它们都归属于中文。

更有意思的例子是，人们能够理解的话语的意思，而机器人不能。比如：别给狗喂牛肉了，因为它已经吃饱了；别给狗喂牛肉了，因为它已经变质了。前一个它指代狗，后一个它指代牛肉。但是，机器人难以区分和辨别，也难以理解，更别说完成后续的指令任务了。

就在尤金通过图灵试验后，谷歌产品经理戴卫·奥尔称，机器人自然语言还有待发展，目前只是处在“可以使用”的阶段，很多互联网公司都开始用自然语言开发一些看起来很酷的产品，比如西瑞（Siri），但如果你非要说机器可以“理解”你的意思，那的确有点勉为其难。戴卫还说，让机器人试着用几句话总结一篇文章的要义，至少到目前为止还没有哪个机器人可以做到这一点。

要让所谓的“谷歌大脑”和“百度大脑”达到人脑的理解能力，首先得让机器懂得人的语言和意思，然后才会充分利用大数据、云计算之类的技术。有意味的是，在“谷歌大脑”认识猫的深度学习中，主要是通过视频，即图像来学习的，这正说明了人工智能的短板，难以理解自然语言，因此还做不到以自然语言来完成人与机器的交流和沟通。

因此，可以期盼未来的“谷歌大脑”和“百度大脑”来完成人类智能才能完成的复杂工作，但是也要充分理解人脑与人工智能的差异。

【责任编辑】张田勘endprint