李世石输了，人工智能是否胜利

2016-05-30 10:48王凯

新天地 2016年4期

王凯

3月间，全世界围棋爱好者最津津乐道的，莫过于韩国围棋顶级高手李世石九段与谷歌公司开发的围棋人工智能程序阿尔法狗（AlphaGo）之间的人机围棋五番棋大战，结果，李世石1：4不敌阿尔法狗。

棋战20年史

人类与人工智能的棋战，始于1996年。那一年，IBM公司开发的计算机深蓝与当时号称国际象棋有史以来最强的世界冠军、俄罗斯象棋特级大师卡斯帕罗夫，6盘战下来，卡斯帕罗夫以4∶2获胜。1997年，IBM改进后的深蓝卷土重来，与卡斯帕罗夫再次对战，结果卡斯帕罗夫一胜两负三和，总比分败北。

此后20年间，人工智能不断挑战人类游戏的历程。电脑工程师们开发的人工智能不断提高性能，先后在各类脑力游戏中击败人类。唯独围棋这个领域，一直是人工智能难以逾越的高峰。

为什么围棋让人工智能一度无法取得进展？这是因为，围棋下法的可选择性太多，比如第一步起手时，理论上一个棋手可以有361种落子选择，而他的对手的回应则有360种可能性。一盘围棋下来，按照150回合计算，可能出现的局面即10170种，这样的计算发展到中盘以后已经超出了电脑的计算能力。而且围棋的规则过于简单（理论上只要围住一枚棋子的四个点即可），导致人工智能能使用的有效条件过少，人工智能在相当长的时间里，很难对棋局的形势作出有效评估。

人工智能的这种困境直到人类在这一领域引入了蒙特卡洛搜索树算法。这个算法基于模糊数学，不再追求精确的结果，而是通过选取无限接近正确答案的那个最优解来开展计算，从而缓解了巨大的运算压力。用我们通俗的说法来说，这就是用科学的计算方法在下棋的时候“蒙”——每次都选最大胜利可能性的那一招落子。

谷歌开发的阿尔法狗，正是通过蒙特卡洛树搜索算法和两个深度神经网络合作来下棋。在与李世石对阵之前，谷歌的研发人员首先用人类对弈的近3000万种走法来训练阿尔法狗的神经网络，让它学会预测目前人类的几乎所有专业棋手（当然也包括李世石）怎么落子。然后让阿尔法狗每天自己跟自己下棋，从而又产生规模庞大的全新的棋谱。通过不断的积累和分析，实现人工智能自己的经验累积和深度学习。

李世石是怎么输的

如果从这场人机五番棋战的结果来看，李世石作为世界顶尖棋手，仅仅赢了人工智能阿尔法狗一盘，其余四盘尽墨，可谓不折不扣的大败。五番棋战后，各大媒体也都在渲染人工智能对李世石的压倒性胜利。

然而，事实并非如此，如果我们仔细考察这五盘棋的每一盘对局过程，我们会得出与上述结果差异极大的结论。

这五盘棋中，李世石下出“神之一手”的那盘赢棋之外，只有一盘是被人工智能压倒性胜利，其余三盘都是局面一直焦灼混乱，最后电脑乱中取胜。而且这三盘中至少有两盘是李世石在占据很大优势、甚至可以说是胜算在握的情况下，莫名其妙多次出缓手或昏招，浪费掉多次胜利机会后，输给了人工智能。

由于李世石在对弈时出的这些明显的匪夷所思的错误，导致曾与他对弈的中国棋手在讲棋的时候甚至半开玩笑地说：“李世石如果只是这样的水平，我当初怎么会输给他呢？”

当然，这三盘焦灼的交锋中，阿尔法狗也犯了很多人类棋手眼中的低级错误，只不过李世石没有抓住。

按照观战的中国围棋棋手的预估，阿尔法狗在开局阶段表现出的能力大约是人类棋手六段或者七段的水准，而在中盘搏杀时则能表现出超过人类顶级棋手战力的十一二段水准。

也就是说，阿尔法狗胜的并不轻松，而且也并非跟结果显示的那样无懈可击。也正是因为这样复杂的比赛过程，一些棋手们大胆推测，如果这次五番棋战，不是邀请李世石这样的弱于序盘而强于搏杀的“僵尸流”棋手，而是邀请更讲究开局的稳重型棋手，胜负犹未可知。毕竟，李世石能够长时间身居世界顶级棋手之列，很大程度是因为他擅长心理战，经常通过出其不意的搏杀和“不讲理下法”来打乱对手的心理，进而让对手犯错，而他的这一优势在面对人工智能时完全没有用处，因为人工智能根本没有心理波动。

然而，即便是这样曲折地赢了比赛，人工智能仍旧表现出了巨大的发展潜力。正如中国新锐棋手、多次战胜李世石的柯杰九段所言：从这场五番棋战来看，人类终究有一天会被人工智能所超越。

谁是赢家

我们在感叹人工智能此番战胜人类棋手的同时，必须要清楚，双方下棋之前的准备是完全不对称的，阿尔法狗占有绝对优势。这是因为，阿尔法狗的数据库里几乎拥有李世石以往的全部比赛棋谱和下法，而李世石在比赛前只是看过此前阿尔法狗与人类棋手下过的几盘棋。对于职业棋手来说，没有长时间与对手的练习赛或者交锋，是很难准确把握对手棋风的，也就很难采取相应的胜利策略。

因此，在五番棋战后，不少人类棋手说，如果让李世石与阿尔法狗连续下一个月的话，相信李世石能够在后续的比赛中明显提高自己的胜率。

这也正是人类相较人工智能来说最自豪的优势——自主学习能力。从目前来看，虽然阿尔法狗号称拥有更强的学习能力，但是并没有在五番棋战中表现出明显的进步。而且在五番棋战中，阿尔法狗也暴露出了一些具体的不足，比如计算出现错误后修正能力不足、对劫财的运用能力不足等等，这些都是未来阿尔法狗需要继续改进的地方。

其实，“人工智能是否能战胜人类”这个话题本就是个伪命题，作为人工智能的创造者，人类的上限目前决定了人工智能的上限，而在未来，即使人工智能有可能突破这个上限，这个突破何尝不是人类突破自己上限的又一次胜利呢？

（责编：石磐）