邱元阳
人工智能(AI)被认为是本世纪最有潜力的前沿科技之一,虽然发展尚不完善,AI的盛宴却已开幕。但在AI大展神威的同时,人们也发现了它的很多缺陷。而最让人诟病的,则是各种聊天机器人“人工智障”般的表现。
阿兰·图灵曾经给出过一个方法,用来评价人工智能的智能程度,这就是大名鼎鼎的图灵测试。早在1950年,图灵就在论文中预言了创造出具有真正智能的机器的可能性。由于当时还没有人工智能的概念,对“智能”难以确切定义,他提出了著名的图灵测试:如果一台机器能够与人类展开对话(通过电传设备)而不能被辨别出其机器身份,那么称这台机器具有智能。1952年,图灵有了更具体的想法:让计算机来冒充人。如果超过30%的人误以为和自己说话的是人而非计算机,那就算作成功了。
图灵测试是人工智能哲学方面第一個严肃的提案,半个世纪以来,很多计算机程序试图通过图灵测试,都没有成功。2014年6月8日,名为“尤金·古斯特曼”的计算机聊天程序成功地让人们相信它是一个13岁男孩,有史以来首次通过图灵测试,这在当时被认为是人工智能发展的一个里程碑事件。
通过图灵测试意味着什么?真的印证了图灵“思考的机器”是可能被创造出来的观点吗?恐怕很多人仍然会怀疑聊天机器人的智能水平,即使它们通过了图灵测试。
2015年11月,《科学》杂志公布了一项研究,一种AI系统通过了图灵测试。2018年I/O开发者大会上,谷歌展示了通过图灵测试的人工智能新应用Duplex。即使这样,人们也未必认为这些通过测试的程序会比AlphaGo更智能。AI系统是多元的,用对话的方式进行智能测试本身可能就是有问题的。
图灵指出:“如果机器在某些现实的条件下,能够非常好地模仿人回答问题,以至于提问者在相当长的时间里误认为它不是机器,那么机器就可以被认为是能够思维的。”图灵在人工智能中的地位毋庸置疑,但图灵测试的结论与思维关联,却会引起质疑,因为目前已知的通过测试的程序还都不具备思维能力。
图灵测试试图从人们能否区分人和机器来确定机器的智能水平。但实际上,这里已经有了一个隐藏的前提:即人工智能的智慧程度一般达不到人类的水平。否则,测试的结果为什么不用来评测人的智慧程度呢?在图灵测试中,如果区分不了人和机器,那就说明机器的智慧水平在某一方面已经接近或高于人类了。
但是,我们为什么不会想到,二者无法区分时,不是人的水平高于机器的结果呢?
参照本来就是相对的。当人工智能的水平发展到一定高度时,强AI就会反超人类,让机器和人类也容易区分开来。这个时候,如果一个AI程序让我们分不清它是人还是机器,那么反而说明这个AI的智能程度还比较低,仅仅达到人类的水平!
当图灵测试反过来是用来检验人工智能是否会弱智得如同人类时,不知道人类是应该骄傲还是应该悲哀。也许,那时候机器也会发明出一种测试,用来检验人类的超高智商,并且,它们极有可能也把这种测试命名为“图灵测试”,以纪念曾经给它们以合法名称的图灵。