张羽
人类的思维是逻辑性的,而计算机能够运行逻辑性的命令。因此,我们的大脑应该是可计算的。计算机科学家由此认为,二十年之内,或许不超过十年,我们就可以看到这样激动人心的事情:人们无法根据对话分辨出,对方是计算机还是人类
6月7日是计算机科学之父阿兰·图灵(Alan Turing)逝世60周年纪念日。这一天,在英国皇家学会举行的2014图灵测试大会上,聊天程序尤金·古斯特曼(Eugene Goostman)“首次”通过了图灵测试。
在现代社会,无论是GPS导航系统与Google搜索引擎,还是自动柜员机与苹果Siri,更遑论象棋大师深蓝(Deep Blue)和满腹经纶的沃森(Watson),人工智能无处不在。但是,在这以前,没有一台计算机被公认通过了图灵测试。
大多数科学家认为,只有通过了图灵测试,才能被认定具有了人工智能。
尤金是怎样通过图灵测试的
尤金最初在2001年由弗拉基米尔·维西罗夫(Vladimir Veselov)、谢尔盖·乌拉森(Sergey Ulasen)和尤金·杰姆琴科(Eugene Demchenko)在俄罗斯圣彼得堡共同开发,它模拟的是一个13岁乌克兰男孩。“尤金诞生于2001年。”维西罗夫介绍道:“我们当时的主要想法是,尤金能够声称自己知道所有事情,但考虑到他的年龄,他不知道所有事情也是很合理的。”“我们花了很多时间去使他具备可信的人格。今年,我们改进了尤金的‘对话控制器,使得跟只会回答问题的程序比起来,尤金在对话中更加像人类。”
这届图灵测试大会由雷丁大学系统工程组织。按照大会规则,如果在一系列时长为5分钟的键盘对话中,某台计算机被误认为是人类的比例超过30%,那么这台计算机就被认为通过了图灵测试。此前,从未有任何计算机达到过这一水平。
2014图灵测试大会共有5个聊天机器人参与,其中尤金成功地被33%的评委判定为人类。负责区分参赛者是人类还是计算机的评委包括了英国演员罗伯特·卢埃林(Robert Llewellyn),他曾成功发起要求政府授予图灵死后赦免状的运动。
雷丁大学的客座教授、考文垂大学副校长凯文·沃里克(Kevin Warwick)参与了大会的组织工作。“某些人会说其实图灵测试早已经被通过了,世界各地的类似赛事上都有图灵测试的身影。不过,这次活动所包含的同时比较测试是史上最多的,也通过了独立认证。”他说:“至关重要的是,在这次测试中,对话是不受限制的。真正的图灵测试正是不预设问题或主题的。所以,我们很骄傲地宣布,图灵测试是在这周六才首次被通过的。”沃里克说,图灵自己在逝世前不久就曾预言图灵测试迟早会被通过。
“我希望祝贺每一位曾经参与开发尤金·古斯特曼的人。我们整个团队都对此结果感到非常兴奋。”尤金的创造者维西罗夫在会后表示:“这对我们来说是项了不起的成就,我们希望能借此激发人们对人工智能与聊天机器人的兴趣。”他透露,接下来他们计划让尤金变得更加聪明,并继续致力于提高他的“对话逻辑”。
沃里克指出,计算机能让我们将他人甚至其他东西当做自己信任的人,这无疑在网络犯罪方面为我们敲响了警钟。图灵测试正是对抗这些威胁的重要工具。“理解这类实时在线交流如何让人们对某些事信以为真并对他们造成影响,是非常重要的事情。”沃里克说。
什么是图灵测试
图灵是20世纪最伟大的数学家之一。作为现代计算机概念的缔造者,他的密码破译工作在第二次世界大战中起到了决定性的作用。在那个创意无限的计算机黎明时代,图灵率先提出的测试,说来似乎很简单:如果一台计算机通过对话,能使人们认定它是人类,那么这台计算机便被认为是具有智能的。
从那时起到现在,在尝试通过图灵测试的漫漫征程上,模拟人类思维的愿望不断激励着我们。这一原动力,对计算机科学乃至认知科学的发展,产生了深远影响。
图灵第一次进行他的测试,是在一次聚会时。他巧妙的实验令人印象深刻:参加者努力让评判者相信他们的性别是伪装的(图灵本人由于他的同性恋取向受到了严酷的迫害)。那时候,这种创建等效于人类大脑认知方式的低水平神经网络的想法还不存在。然而,复制人类的思想似乎很有可能,相比之下似乎更简单。
我们一般认为,人类的思维是逻辑性的,而计算机能够运行逻辑性的命令。因此,我们的大脑应该是可计算的。计算机科学家由此认为,二十年之内,或许不超过十年,我们就可以看到这样激动人心的事情:人们无法根据对话分辨出,对方是计算机还是人类。
这个过分简约的构想,被证明是建立在错误的理论基础上的。认知过程要远比20世纪中叶的计算机科学家及心理学家所设想的复杂得多。并且令人沮丧的是,在运用逻辑学描述我们的思想过程时,科学家遇到了非常大的困难。并且我们越来越清楚:根据人类大脑所特有的,适应快速变化的外界环境、整合信息碎片等一系列特殊功能来看,模仿人类思维几乎是无法完成的任务。
“对于现实中众多不确定性而言,符号逻辑本身过于脆弱,”斯坦福大学研究机器智能模拟的计算机科学家诺亚·古德曼(Noah Goodman)如是说。尽管如此,现在被我们认为已经失败的传统AI,技术上依旧颇具启发性。因为它们彻底改变了,我们对于人类大脑运作方式的看法。挫折过后,不断涌出的是许许多多极其重要的认知科学新观点。
下一步,人工智能
直到20世纪80年代中期,图灵测试一直都是被放弃闲置的探索领域(尽管今天,它衍生出了专为虚拟聊天机器人设置的年度Loebner奖,同时即时虚拟广告机器人在我们的日常生活中与此同时衍生出的是现代认知科学和人工智能的两个主要研究方向:
1.推算事件发生的概率,做出准确判断。(称为概率性)
2.在与简单、微小的程序的互动过程中,得出复杂的行为模式。(称为连结性)
和那些像深蓝(Deep Blue)(曾因击败国际象棋大师Garry Kasparov扬名)一样使用“蛮力”的电脑程序的计算特点不同,人们认为这些程序至少精确反映出了,人类思维中产生的某些特有现象。
迄今为止,所谓“概率性”和“连结性”这两大人工智能研究新思路,指导开发出了一系列现实生活中被广泛使用的人工智能产品:自动驾驶汽车,Google搜索引擎,自动机器翻译,以及IBM开发的能巧妙回答任何刁钻古怪问题的Watson电脑。
但是美中不足的是,它们在某些方面能力仍旧有限——“如果你说:‘Watson,给我做晚饭好不好,或者‘Watson,写首十四行诗吧。他会憋炸的。”德曼这样说道。但是人们不断上涨的使用(或调戏,好吧)欲望使它们的性能得以飞快进步,数据库更详实。
“你所说过的、听到的、写下的、或者是读到的每一个字,每一句话,以及每一个看到的场景,每一段经历的声音片段,一并同其他成百上千、甚至成千上万的人们的相关数据,都被录制下来并可随时调用。久而久之,甚至触觉以及嗅觉传感器也可以被接入以全面丰富我们这个充满图像和声音的数据库。”作为对MIT(麻省理工)研究员戴伯·罗伊(Deb Roy)的相关研究的延伸,弗兰茨在《科学》杂志上这样设想。戴伯曾经录制了9万小时的视频,内容是关于他襁褓中的儿子清醒状态下的认知发展过程。
假定我们拥有可以编目、分析、串联和交叉全部海量信息的处理软件,以及备有上述数据库和分析系统的程序,应该完全能够使得一台计算机回答现今的AI们无法回答的棘手问题。这最终意味着通过图灵测试。
密歇根大学的人工智能专家赛汀德·辛(Satinder Singh)对数据所显示的前景充满了信心:“大容量数据库终会造就一台极具灵活性的人工智能机器。”
但这样来说,梳理所有曾经学习过的问题数据就显得重要了许多。计算机要懂得:什么更值得记住,什么更值得去预测。可是,如果你把一个孩子领进屋内,让他自由自在、随心所愿,不交给他任何任务,他为什么会自发地做他想做的事情呢?所有的这类问题都变得异常有趣。
“为了变得更渊博,更灵活,更有能力,一个人必须要被动力和好奇心所驱使,从而提炼出重要的事情,”辛说:“这些对计算机来说,都是巨大的挑战。”
“一架机器要通过图灵测试,一定要充满着人类的情感与欲望吗?就像是弗兰肯斯坦(玛莉·雪莱(Marry Shelley)笔下的人造人),或者有生命的泥人(Golem希伯莱传说中用粘土、石头或青铜制成的无生命的巨人,注入魔力后可行动)一样吗?”墨西哥国立自治大学的计算机科学家卡洛斯·格申森(Carlos Gershenson)充满了疑问。但是这和更基本的问题一样,难以回答。