网络变得更聪明了

2012-04-25 14:49加利马库斯GaryMarcus

中国传媒科技 2012年9期

文｜加利·马库斯（Gary Marcus）

网络变得更聪明了

文｜加利·马库斯（Gary Marcus）

5月16日，谷歌低调地发布了一款名为“谷歌知识图谱”的新技术。输入“弗朗索瓦·奥朗德（法国总统）”，你就会得到奥朗德的孩子、夫人、生日、教育等等附有链接的简历。短期来看，知识图谱不会使你的世界产生很大的不同——你可以通过访问奥朗德的维基百科页面得到大致相同的信息，很多人可能更喜欢询问周围的朋友。但深入来看，这代表了世界上最大的搜索引擎公司在工程领域中的重大变革。不仅仅如此，在一二十年内，科学家和记者们可能会回首这一时刻，将其视为挖掘海量无意义数据的机器，与开始有点像人一样思考的机器的分水岭。

成立伊始，谷歌就主要使用简单匹配算法（brute force，穷举算法）来组织互联网知识，这是有原因的。谷歌有世界上最大的并行操作计算机群并拥有世界上最大的数据库。你的搜索查询之所以这么快会被响应，就是因为它们被外包给了巨大的数据中心，借鉴了海量预编译数据，并且每一秒都会被数百万抓取网页的虚拟谷歌“蜘蛛”所加速。在许多方面，谷歌的行为会让人联想起IBM公司的“深蓝”国际象棋计算机，它战胜了所有人类挑战者，但不是通过更“聪明”的下棋，而是更快的计算。“深蓝”通过穷举算法赢得了比赛，而不是像人类那样通过思考。计算机有“蛮力”，但没有“策略”。

当然，有时蛮力也有它的优势，谷歌巨大的计算资源革新了人工智能中经典问题的解决方法。拿拼写检查的过程举个例子，使得字处理软件第一次流行开来的功能之一就是自动拼写检查。微软等公司的工程师将人们常犯的错误归类，例如字母重复或错位（如poeple），然后根据这些模式建立目录以对用户的意图进行猜测。而谷歌以一种完全不同的方法来解决拼写错误问题——也更有效——通过简单的查看用户改正自己错误的巨大数据库。用户在发现错输入了“peopple”之后接下来会输入什么呢？啊哈，是“people”。

谷歌的算法对字母重复、错位或人类输入拼写的心理学一无所知，仅仅知道人们在输错后会改成什么。好像这就是说，拥有了足够大的数据库和足够快的计算机，那么即使不用对人类心理有多少了解，人类问题也可以迎刃而解。

过去十年中，在人工智能领域的大部分工作都和谷歌的方法类似：更大更快的计算机配上容量激增的数据库。但是，面对如此复杂的世界，无论数据库有多大，仅靠数据挖掘也是不够的。“深蓝”在国际象棋领域可能征服了世界，但是人类仍可以在古老的围棋方面痛挫计算机，因为围棋有更大的盘面和更多可能的走法。即使在谷歌最擅长的网页搜索，穷举法在同音字面前也是无能为力。比如，“Boston”既可以指马萨诸塞州的波士顿，也可以指一个乐队；“Paris”既可以指巴黎也可以指喜欢出风头的社会名流。

为了处理“Paris”这种一词多义的问题，谷歌知识搜索重新使用了二十世纪五六十年代首次提出的语义网络的想法，语义网络是对人类大脑如何解释信息最早的猜测。这些网络解释了独特实体之间的关系，而不是词与词之间简单的关系。作为地名的“Paris”和作为人的“Paris”有各自独一无二的ID——就像条形码或社会安全号码一样——简单的关系被解释实体关系的注解分类所替代（或补充）。所以，“Paris1”（巴黎）通过一种内在关系与埃菲尔铁塔相联，而“Paris2”（人）通过取消关系与各种真人秀相联。当所有的地点、人物和关系都互相联系起来时，这些网络便开始类似于巨大的蜘蛛网了。从本质上来说，谷歌现在正尝试重塑互联网，并为它的“蜘蛛”抓取提供一个更聪明的网络。

虽然语义网络在二十世纪七十年代非常流行，但到八十年代研究逐渐衰落，而被将大脑简单的模拟为统计积累的神经网络取而代之。神经网络应用了覆盖学习规则（blanket learning rule），这个规则将所有联系视为等价，所不同的仅为它们在世界上出现的频率。作为地点的“Paris”与作为人的“Paris”用神经网络是无法区分的。这场有关结构化知识和巨大的统计数据库之间的争论是心理学和哲学史上最长的争论之一。“先天论者”（比如柏拉图、康德，近代有诺姆·乔姆斯基和史蒂芬·平克）认为人的头脑中生来就有重要而基本的知识，而“经验论者”（比如约翰·洛克和B.F.斯金纳）认为人生来就像一张白纸，所有的知识均来自于联系和经验。

谷歌曾本质上是一台经验主义者的机器，几乎没有先天知识，仅具有巨大的容量，通过以比特计的信息来学习事物的联系。（这导致了谷歌对信息的无限索求，从而引发了对个人隐私的侵犯的问题）。现在，谷歌正在改变，在先天主义和经验主义之间寻求平衡，它通过内置含有包括人、物、地点的结构化目录的数据库而拥有了强大的统计能力，这是经验主义者所渴望的，同时先天主义者也可能会喜欢。谷歌的搜索引擎仍是追踪搜索“Paris”出现的数十亿的结果，并查看结果与用户的提问有何关联。但现在尝试不仅将这些结果互相联系起来，而且将它们根据人、地点和公司联系成目录。

有不错的理由支持谷歌向这个方向发展。先锋发展心理学家伊丽莎白·史培基宣称：“如果儿童天生具有感知人、物、地点的能力，那么他们可以使用自身的感性经验以学习这些实体的属性和行为……仍不清楚儿童如果不能将实体与周围环境分开，是如何学习这些实体属性和行为的”。计算机也是同样的道理。

从算法到编码和检索庞大的信息仓库，计算机变得比我们更快更可靠。我个人一直都很羡慕谷歌和它主要的竞争者——微软的必应能够在虚拟的指尖上获得如此多的信息，但我们人类也留有一手。看到计算机工程师仍旧经常需要从人类的思想中偷个页面还是令人感到振作。