人机对弈珍珑棋局人工智能扑面而来

2016-05-14 12:45王彦彬

通信产业报 2016年9期

关键词：李世石局面世界冠军

王彦彬

举世瞩目的围棋人机世纪大战——谷歌人工智能系统“阿尔法围棋”（AlphaGo）对决韩国高手李世石（五番赛第一回合），于北京时间3月9日12时在韩国首尔准时拉开帷幕。

继2015年10月份AlphaGo在没有任何让子的情况下以5∶0完胜欧洲冠军职业围棋二段樊麾之后，AlphaGo向李世石发起了挑战。

面对拥有众多国际冠军头衔的九段高手李世石，AlphaGo已经连下两城，取得2∶0的领先。

三万个“深蓝”

其实人工智能征服人类的智力骄傲是个漫长的征程。

1997年，IBM的“深蓝”战胜了国际象棋世界冠军卡斯帕罗夫。欧美传统里的顶级人类智力试金石，在电脑面前终于一败涂地。这让重达1270公斤、拥有32个微处理器、每秒可以计算2亿步、计算能力达到11.38GFLOPS的“深蓝”声名显赫，轰动世界。

但在长期以来围棋AI一度举步维艰，顶级AI甚至不能打败稍强的业余选手。但是现在一台笔记本的计算能力就已经远远超越了“深蓝”，成功战胜了围棋世界冠军李世石。

人工智能正在指数级快速增长。据了解，AlphaGo计算能力是当年IBM计算机“深蓝”的3万倍。

揭秘AlphaGo

谷歌于2014年收购了英国人工智能公司DeepMind。今年早些时候，DeepMind的团队发表论文，介绍了AlphaGo击败职业棋手、欧洲围棋冠军樊麾的情况。

AlphaGo的核心是两种不同的深度神经网络。“策略网络”（policy network）和 “值网络”（value network）。它们的任务在于合作“挑选”出那些比较有前途的棋步，抛弃明显的差棋，从而将计算量控制在计算机可以完成的范围里，本质上和人类棋手所做的一样。

其中，“值网络”负责减少搜索的深度——AI会一边推算一边判断局面，局面明显劣势的时候，就直接抛弃某些路线，不用一条道算到“黑”；而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋，有些棋步是明显不该走的，比如不该随便送子给别人吃。将这些信息放入一个概率函数，AI就不用给每一步以同样的重视程度，而可以重点分析那些有戏的棋着。

AlphaGo利用这两个工具来分析局面，判断每种下子策略的优劣，就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下，就能判断在哪里下子赢的概率会高。

人类在下棋时有一个劣势，在长时间比赛后，他们会犯错，但机器不会。而且人类或许一年能玩1000局，但机器一天就能玩100万局。所以AlphaGo只要经过了足够的训练，就能击败所有的人类选手。

不必过于惊慌

AlphaGo战胜李世石，人工智能研究者面对这样的成就当然欣喜。深度学习和强化学习等技术完全可以用于更广泛的领域。比如最近很火的精准治疗，我们可以训练它们判断哪些治疗方案对某个特定的人有效。

就像十多年前的“深蓝”战胜国际象棋世界冠军一样，今天，AlphaGo战胜李世石也必将引发超出围棋自身领域之外的讨论。人工智能还将在其他层面上继续碾压人类吗？传统认为人工智能不可能完成的任务是否也都将被逐一打破？人类最后是会进入人工智能的乌托邦还是被人工智能淘汰呢？

没人知道答案。但有一点毫无疑问：面对人工智能不用过度惊慌。人工智能一定会进入我们的生活，并且将极大地改善我们的生活，我们不可能躲开。

人机对弈珍珑棋局 人工智能扑面而来

人机对弈珍珑棋局人工智能扑面而来