陈劲松
2016年12月,美国著名的科普网站,科学新闻(ScienceNew.org)在评选十大新闻中,名列第一的是“AlphaGo战胜李世石”。
“AlphaGo在克服复杂问题上爬过了一座陡峭的山峰,在最复杂的智力游戏中战胜了人类”,在回顾中,科学新闻评价道,“现实世界的复杂程度远超这些游戏,但AlphaGo的进步让大家看到了电脑解决复杂问题的曙光。”
是的,由于AlphaGo的出现,人类作为一个整体应该意识到,世界不一样了,另一种文明,已经崭露头角。
时间倒回到2016年3月10日,首尔光化门的四季酒店,这里正在进行围棋“人机大战”第二局。在9日进行的第一局比赛中,谷歌的程序AlphaGo击败了李世石,取得了历史性的突破。在第二局的比赛中,AlphaGo下出的第37手,一个简单的肩冲,又让李世石进入了难局。
观战室里还有一名职业围棋选手,他是三届欧洲围棋冠军樊麾(Fan Hui)。一开始,第37手也令他感到困惑。但他和AlphaGo很熟悉,有五个月时间,樊麾与这台机器进行过成百上千局对弈。樊麾经常输给AlphaGo,但他也渐渐比任何人都明白它。在樊麾眼里,那一步肩冲不像是人类会下的一步棋。思索了十秒后,樊麾才恍然大悟。“这步太漂亮了,”他又重复了一遍,“太漂亮了。”
日后这一手不断被职业棋手所模仿,包括世界排名第一的柯洁,棋迷们也将这手称为“阿狗流”,与围棋战法中著名的“秀策流”、“中国流”并列。在李世石眼中,37手的阿狗流,表现出了围棋棋手所说的“直觉”——一种让它能以像人类一样的方式,甚至超越人类的方式下出优美棋局的能力。
在决定与谷歌的AlphaGo对决前,李世石对他的对手几乎一无所知,虽然AlphaGo已经以5:0战胜了欧洲冠军樊麾,但五盘棋谱尚未公布,李世石并不知道AlphaGo有多厉害,甚至没过问奖金一事。直到签完保密合同后才知道,奖金为100万美元。李世石说,“这个比赛本身的意义,比奖金大得多。这是因为,我代表人类同计算机对战。”
人类的代表李世石,在第37手面前陷入沉默。一分钟过去,又一分钟过去——整整15分钟过去了,最终,李世石拿起了一枚棋子放在了棋盘上,在对方肩冲的黑子上贴了一手,事后证明,这一手是本局的败招,4小时20分钟后,李世石选择认输。
谷歌虽然是一个美国公司,但AlphaGo的创造者是两个英国人,大卫·席尔瓦(David Silver)和戴米斯·哈萨比斯(Demis Hassabis),他们是剑桥同学,专业都是计算神经科学。1998年毕业后,两人合开了一家电子游戏公司。
哈萨比斯经常和一名同事下围棋,席尔瓦在他的影响下也开始自学围棋。他们还加入了当地围棋俱乐部,和二三段棋手对弈,这是围棋中非常低的水平,两个高智商的家伙并不满足于此。他们忍不住思考,为什么电脑可以打败西洋跳棋、国际象棋的选手,却从未破解围棋。
对人工智能来说,围棋游戏的难度在于,决策空间实在太大。决策(Decision Making) 是人工智能的关键要素,使得机器能够在人类的世界中发挥作用。在围棋以及任何游戏中,一次决策往往使得游戏更新到一个新局面,于是影响到接下来的决策,一直影响到最终游戏的胜负。人工智能的关键就是在决策空间中搜索达到最大效益的路径,最终体现在当前决策中。围棋棋盘上棋子可能的组合方式的数量就有10的170 次方之多,超过宇宙原子总数。在近乎无穷的决策空间中,去暴力搜索出当前棋盘的下一步最优定子是绝对不可能的事情。
2010年,哈萨比斯在伦敦成立了一个名为DeepMind的人工智能公司,席尔瓦随后而来,在这里他们开始了真正的人工智能之旅。这家公司之后又被谷歌公司收购,这也解决了他们的资金问题。
在伦敦国王十字车站附近的DeepMind办公室中,这支团队将3000万步人类下出的围棋步法输入到一个深度神经网络中,这个网络的硬件和软件能大致模拟人脑中的神经网。
神经网络其实很常见,Facebook用它给照片中的人脸加上标签,谷歌则用它来识别安卓手机收到的语音命令——给它输入足够的话语,它就能识别你所说的话。输入3000万步围棋步法,它就能学会下围棋。在经过五年的进化之后,AlphaGo取得了重大突破,成为第一位击败职业棋手的程序,而第一滴血,就是观战室的樊麾二段。
樊麾是西安人,职业二段,2000年移居法国,随后成为欧洲最强棋手。2015 年9 月底,樊麾第一次去Deepmind 公司参观,纯粹抱着旅游的心态。双方确定了比赛时间、比赛方式等等。樊麾发现他们对于人工智能方面可能很擅长,但对于这个比赛要怎么弄,一点经验都没有。最让他惊讶的是对方询问: “万一机器赢了,下围棋的人会不会恨我们?会不会因此伤害到很多人的利益?”
樊麾和AlphaGo的比赛定在了2015 年10 月5 日至9 日,共5天。比赛是一天两场,一共10 盘。5 盘正式的,还有5 盘非正式的快棋。正式的比赛樊麾0:5 败,非正式的快棋樊麾2胜3 负。2016 年1月,哈萨比斯等人在英国 《自然》 杂志上发文说,在英国围棋协会见证下,AlphaGo 以5:0 战胜欧洲围棋冠军、前中国职业棋手樊麾,成为第一个击败人类职业棋手的电脑程序。
在围棋界,职业棋手第一次输给电脑是个非常令人震惊的 “意外事件”,在AlphaGo战胜樊麾之前,最好的电脑围棋也要被顶级棋手让四五子。职业围棋选手纷纷对这个结果表示震惊,他们不愿意接受这个消息,甚至开始怀疑樊麾的水平只有业余五段左右。但随即,AlphaGo团队向李世石发起了挑战,人类和人工智能的重要对决终于到来。
在与李世石进行的五场比赛中,两位解说员都称AlphaGo为“他”,而不是“它”。李世石刚出场时,还向那个看不见摸不着的对手——不知疲倦亦无忧惧的AlphaGo君鞠了一个躬。
比赛之前,谁也没有想到AlphaGo会强到如此地步。世界冠军常昊预计正常情况下李世石是一盘都不会输,如果AlphaGo赢一盘已经是非常大的突破了。在职业围棋界,99%的人都和常昊做出同样的预测。只有一些计算机领域专家,审慎认为AlphaGo能赢一到两局,比如李开复。但结果,AlphaGo第一局就赢了。围棋界一片惊呼不说,韩国的媒体甚至将这一局的意义和人类登月相提并论。
从第二局开始,形势已经发生了逆转。在此之前,是AlphaGo挑战李世石,但在此之后,已经是李世石在挑战AlphaGo了。韩国报纸上开始称AlphaGo为“阿尔法十段”。在韩国,围棋九段与中国古代的一品一样,称为“入神”,十段差不多就是“神”的意思了。
李世石紧接着输掉了第三局,AlphaGo在五局三胜中取得了胜利。在后来的新闻发布会上,李世石坐在哈萨比斯旁边,因为让人类失望而道歉:“我本可以拿出更好的成绩,带来更好的结局。”
李世石发言时,一种意料之外的感觉开始啃食哈萨比斯的内心。作为AlphaGo的创造人之一,看着这台机器实现了人们认为其不能实现的成绩,他感到骄傲,甚至飘飘然,但他同时也因为自己是人类的一员而感到不甘。他开始希望李世石能够赢下一局。
第四局下了2个小时。李世石这局下得咄咄逼人,对棋盘上的特定区域发起猛攻。但是AlphaGo采取了更加豪迈的风格,以着眼整体的方式对整局局势进行衡量。
AlphaGo已经赢得了整场比赛。李世石不再为了胜利下棋,而是为了人类。他用右手的前两个手指执起一枚白棋,放在了紧挨着棋盘中心的地方。这是这局棋的第78手,一步“挖” 步,即在两片大范围紧密的地区中间插入一棋。在AlphaGo的控制室,运行机器的人们都停下了手里的工作,盯着他们的显示屏看。在李世石下出那绝妙的第78手前,AlphaGo计算自己的胜算为70%。八步之后,这一数字变得不值一提。李世石的78手被古力称为“神之一手”,这手棋让AlphaGo崩溃,让人类棋手保留了最后一丝希望。
2016年3月13日,韩国首尔,2016年围棋人机大战第4局,李世石艰难赢得一战。
五局比赛的最终结果是四比一,AlphaGo也凭借这五局棋一直排在世界第二的位置,威胁着世界第一人,中国棋手柯洁。8月份,DeepMind团队在波士顿宣布,AlphaGo已经从李世石对战的第18个版本进化到了V25,现在这个版本可以让顶尖职业棋手两子。随后,中国棋圣聂卫平宣布柯洁将不会与AlphaGo进行比赛,为职业棋手保全最后一丝颜面。
然而,人工智能的大门已经打开,一个新时代,已经到来了。“2016年是人工智能走向主流的元年”,微软亚太研发集团前主席、百度公司总裁张亚勤接受媒体采访时说。这一年,除了AlphaGo与李世石的“人机大战”,IBM、微软、Facebook等互联网巨头,都投入巨大的人力、财力和精力在人工智能平台。Facebook创始人扎克伯格甚至预言,“人类基本的听、说、读、写等核心感知力,在未来5-10年,计算机一定能做得比人类自己更好。”
到那时,人们或许才会更真切理解这场“人机大战”的意义,也才会更清楚,公元2016年3月10日,AlphaGo下出37手的那一刻,对人类到底意味着什么。