人机对弈珍珑棋局 人工智能扑面而来

2016-05-14 12:45王彦彬
通信产业报 2016年9期
关键词:李世石局面世界冠军

王彦彬

举世瞩目的围棋人机世纪大战——谷歌人工智能系统“阿尔法围棋”(AlphaGo)对决韩国高手李世石(五番赛第一回合),于北京时间3月9日12时在韩国首尔准时拉开帷幕。

继2015年10月份AlphaGo在没有任何让子的情况下以5∶0完胜欧洲冠军职业围棋二段樊麾之后,AlphaGo向李世石发起了挑战。

面对拥有众多国际冠军头衔的九段高手李世石,AlphaGo已经连下两城,取得2∶0的领先。

三万个“深蓝”

其实人工智能征服人类的智力骄傲是个漫长的征程。

1997年,IBM的“深蓝”战胜了国际象棋世界冠军卡斯帕罗夫。欧美传统里的顶级人类智力试金石,在电脑面前终于一败涂地。这让重达1270公斤、拥有32个微处理器、每秒可以计算2亿步、计算能力达到11.38GFLOPS的“深蓝”声名显赫,轰动世界。

但在长期以来围棋AI一度举步维艰,顶级AI甚至不能打败稍强的业余选手。但是现在一台笔记本的计算能力就已经远远超越了“深蓝”,成功战胜了围棋世界冠军李世石。

人工智能正在指数级快速增长。据了解,AlphaGo计算能力是当年IBM计算机“深蓝”的3万倍。

揭秘AlphaGo

谷歌于2014年收购了英国人工智能公司DeepMind。今年早些时候,DeepMind的团队发表论文,介绍了AlphaGo击败职业棋手、欧洲围棋冠军樊麾的情况。

AlphaGo的核心是两种不同的深度神经网络。“策略网络”(policy network)和 “值网络”(value network)。它们的任务在于合作“挑选”出那些比较有前途的棋步,抛弃明显的差棋,从而将计算量控制在计算机可以完成的范围里,本质上和人类棋手所做的一样。

其中,“值网络”负责减少搜索的深度——AI会一边推算一边判断局面,局面明显劣势的时候,就直接抛弃某些路线,不用一条道算到“黑”;而“策略网络”负责减少搜索的宽度——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。将这些信息放入一个概率函数,AI就不用给每一步以同样的重视程度,而可以重点分析那些有戏的棋着。

AlphaGo利用这两个工具来分析局面,判断每种下子策略的优劣,就像人类棋手会判断当前局面以及推断未来的局面一样。这样AlphaGo在分析了比如未来20步的情况下,就能判断在哪里下子赢的概率会高。

人类在下棋时有一个劣势,在长时间比赛后,他们会犯错,但机器不会。而且人类或许一年能玩1000局,但机器一天就能玩100万局。所以AlphaGo只要经过了足够的训练,就能击败所有的人类选手。

不必过于惊慌

AlphaGo战胜李世石,人工智能研究者面对这样的成就当然欣喜。深度学习和强化学习等技术完全可以用于更广泛的领域。比如最近很火的精准治疗,我们可以训练它们判断哪些治疗方案对某个特定的人有效。

就像十多年前的“深蓝”战胜国际象棋世界冠军一样,今天,AlphaGo战胜李世石也必将引发超出围棋自身领域之外的讨论。人工智能还将在其他层面上继续碾压人类吗?传统认为人工智能不可能完成的任务是否也都将被逐一打破?人类最后是会进入人工智能的乌托邦还是被人工智能淘汰呢?

没人知道答案。但有一点毫无疑问:面对人工智能不用过度惊慌。人工智能一定会进入我们的生活,并且将极大地改善我们的生活,我们不可能躲开。

猜你喜欢
李世石局面世界冠军
11岁的世界冠军
——王子今
打好同心牌 共筑“根魂梦” 开创港澳侨和海外统战工作新局面
一所农村学校“跳”出10个世界冠军
世界冠军武大靖:平凡少年的逆袭之路
梦之队,世界冠军2016!
李世石不代表人类
“四个结合”开创基层党建新局面
面对复杂局面必须找到突破点
一步一脚印 开创新局面
李世石“天才”继承人