质疑图灵测试

2018-08-23 02:07邱元阳

中国信息技术教育 2018年13期

邱元阳

人工智能（AI）被认为是本世纪最有潜力的前沿科技之一，虽然发展尚不完善，AI的盛宴却已开幕。但在AI大展神威的同时，人们也发现了它的很多缺陷。而最让人诟病的，则是各种聊天机器人“人工智障”般的表现。

阿兰·图灵曾经给出过一个方法，用来评价人工智能的智能程度，这就是大名鼎鼎的图灵测试。早在1950年，图灵就在论文中预言了创造出具有真正智能的机器的可能性。由于当时还没有人工智能的概念，对“智能”难以确切定义，他提出了著名的图灵测试：如果一台机器能够与人类展开对话（通过电传设备）而不能被辨别出其机器身份，那么称这台机器具有智能。1952年，图灵有了更具体的想法：让计算机来冒充人。如果超过30%的人误以为和自己说话的是人而非计算机，那就算作成功了。

图灵测试是人工智能哲学方面第一個严肃的提案，半个世纪以来，很多计算机程序试图通过图灵测试，都没有成功。2014年6月8日，名为“尤金·古斯特曼”的计算机聊天程序成功地让人们相信它是一个13岁男孩，有史以来首次通过图灵测试，这在当时被认为是人工智能发展的一个里程碑事件。

通过图灵测试意味着什么？真的印证了图灵“思考的机器”是可能被创造出来的观点吗？恐怕很多人仍然会怀疑聊天机器人的智能水平，即使它们通过了图灵测试。

2015年11月，《科学》杂志公布了一项研究，一种AI系统通过了图灵测试。2018年I/O开发者大会上，谷歌展示了通过图灵测试的人工智能新应用Duplex。即使这样，人们也未必认为这些通过测试的程序会比AlphaGo更智能。AI系统是多元的，用对话的方式进行智能测试本身可能就是有问题的。

图灵指出：“如果机器在某些现实的条件下，能够非常好地模仿人回答问题，以至于提问者在相当长的时间里误认为它不是机器，那么机器就可以被认为是能够思维的。”图灵在人工智能中的地位毋庸置疑，但图灵测试的结论与思维关联，却会引起质疑，因为目前已知的通过测试的程序还都不具备思维能力。

图灵测试试图从人们能否区分人和机器来确定机器的智能水平。但实际上，这里已经有了一个隐藏的前提：即人工智能的智慧程度一般达不到人类的水平。否则，测试的结果为什么不用来评测人的智慧程度呢？在图灵测试中，如果区分不了人和机器，那就说明机器的智慧水平在某一方面已经接近或高于人类了。

但是，我们为什么不会想到，二者无法区分时，不是人的水平高于机器的结果呢？

参照本来就是相对的。当人工智能的水平发展到一定高度时，强AI就会反超人类，让机器和人类也容易区分开来。这个时候，如果一个AI程序让我们分不清它是人还是机器，那么反而说明这个AI的智能程度还比较低，仅仅达到人类的水平！

当图灵测试反过来是用来检验人工智能是否会弱智得如同人类时，不知道人类是应该骄傲还是应该悲哀。也许，那时候机器也会发明出一种测试，用来检验人类的超高智商，并且，它们极有可能也把这种测试命名为“图灵测试”，以纪念曾经给它们以合法名称的图灵。