王杰夫
4月17日,和人工智能系统AlphaGo的赛程敲定后的一周内,柯洁将自己的微博昵称从“柯洁大棋渣”改为“棋士柯洁”。他清楚,自己将不仅仅以柯洁的身份,而是作为所有棋手的代表,带着人类的尊严去迎战一个超人般的存在。
一个月之后的5月23日,DeepMind研发的围棋人工智能AlphaGo与排名世界第一的柯洁(九段)在浙江乌镇对战三局。和“人机大战”第一季有所不同的是,这一次无论输赢都会下满三盘,双方各有三小时。
在场的每个人似乎都已判定,这是一场必输的比赛。判断柯洁必败的理由很简单,今年农历新年前夕, AlphaGo曾化名Master现身中国线上围棋对战平台,一周内60战60捷,无一败绩,柯洁参与了其中三盘,三战皆败。
2016年12月30日,柯洁与Master两战两败。“像是被打了一记冷枪,这是哪个世外高人啊,”柯洁回忆道,“与李世石对战的V18(AlphaGo)还是人类的下法,但Master下棋很仙。”这也是他一开始不相信Master是AlphaGo的原因—它的进步实在太快了。
在接下来的半年时间里,为了钻研Master的棋谱,柯洁几乎废寝忘食,把Master下的60盘棋谱找来研究,试图理解对方的下法。后者基于策略网络和价值网络算法背后的人工智能系统,对围棋的布局、开局都超越了人类的想象。2017年1月3日再次败北后,柯洁的身体再也支撑不住,急性肠胃炎将他送进了医院,这也是他人生中第一次住院。
在乌镇比赛之前,没有人比柯洁自己更清楚,几乎没有人相信他能赢。
但没有多少人能体会到,柯洁承受着一名职业棋手可能承受的最沉重的压力。在对战的前一天夜里,他在新浪微博上发表《最后的对决》,表示与AlphaGo的三番棋会是他与人工智能最后的三盘棋。“我是一名棋手,作为棋手,从来只有输和赢,输棋的痛苦,外人无法想象。只有胜利是唯一真谛,所以不惜我的一切,真的去拼了。”
第一天的比赛结束后,柯洁解释了这个决定背后的原因:“与人工智能的差距不是靠自身努力可以弥补的。”随着将来人工智能的继续发展,获胜的可能也越来越渺茫。
5月23日的第一场,下午2点51分,这场持续4小时17分钟,共计289手的对弈结束了。柯洁收完了最后一个单官(单官即占不到棋盘上空交叉点的一手棋),一只手在自己的棋盒里打着转,另一只手托着腮,眼睛直勾勾地盯着棋盘,似乎想从裁判的手中再抠出哪怕半子。但结果如同他已经心算过几十遍的数字—落后1/4子。
在一个多月的备战中,柯洁曾反复思考击败AlphaGo的策略。在当天的比赛中,他在第三手就用了AlphaGo擅长的点三三下法,希望能够借此取得优势。然而出乎柯洁的意料,AlphaGo不但处理得很好,反而还占了上风。
“我印象中它是非常贪恋实地的,今天这盘棋(我)也在贯彻先捞后洗的策略,没想到被它打破了意图,棋完全进入了它的调子中,”柯洁说,“如果用棋手比喻,这个AlphaGo和去年完全是两个人,那一次他的棋很接近人类,但现在更接近我理解中的围棋上帝。”
在很多人眼里,柯洁以1/4子这个围棋中影响胜负的最小目数落败,至少说明双方的差距不是很大。然而对于只在乎如何实现胜率最大化的AlphaGo来说,它要确定风险最小的获胜机会,或许与柯洁这样的高手对弈时,每扩大一点目数的优势就意味着风险的提高。
柯洁很清楚,盘面上看他只输了1/4子,但这是AlphaGo给的安乐死。“(Master的)60盘棋每个人都是安乐死的,”这是柯洁最不想看到的输法,“死得太安逸了。”
5月25日第二场,柯洁中盘告负,但这却是他离战胜AlphaGo最近的一场。
这一场,柯洁的战术表现堪称完美。他主动出击,全场引战,试图将局面复杂化,以干扰AlphaGo对于局面的判断。整场战斗,需要巨量的计算力作为支撑,围棋盘上职业棋手以下出“四龙”或“六龙对杀”(即六块棋互相绞杀)局面为荣,当到第114手棋时,棋局被柯洁拉升到十龙对杀。
“在前50手,柯洁的每一手都是AlphaGo计算中的最佳解,”AlphaGo之父、DeepMind创始人Demis Hassabis向所有人透露了后台的数据:“而在前100手也从来没有哪位棋手能够像柯洁这样与AlphaGo Master版本在胜率上咬得如此之紧。”
柯洁赛后称,自己曾经一度有“可能战胜AlphaGo”的预感,这也是当时在比赛现场他反复用手按住胸口的原因,“我的心在跳,我想让他跳得慢一点。”但极度的兴奋却影响了他的判断,在关键手上出现失误。
不过,这一场证明了柯洁的想法,与其安乐死,不如玉石俱焚。他请求最后一场继续执白,这样更方便引导AlphaGo进入火拼状态。
遺憾的是,奇迹并没有出现。在5月27日的最后一场,柯洁在布局阶段就走出恶手,在之后的棋局中,AlphaGo没有出现任何失误,他毫无机会地输掉了比 赛。
比赛中,在局面不利时,柯洁一度离开棋场。他躲在比赛的宣传板后,一个人失声痛哭,比赛停滞了20分钟,直到裁判长找到他。
当比赛宣告结束时,柯洁的战斗似乎还没有停止。他左手手肘支着脸颊,右手执着的在棋盘的左上方码着棋子,把几个子抠掉,又把几个子填回来,像是希望在这里使用什么时间倒流的魔法。
“今天我有点失态,和AlphaGo下棋非常痛苦。”柯洁在赛后媒体发布会上说道,声音有些哽咽,“每一步我担心的棋它都会下,而我想不到的棋它都能下得更好,它太过完美了。”
应战一场胜算几乎为零的比赛,柯洁没有选择退缩的原因或许很简单。这名90后的世界冠军少年,曾在新浪微博上多次吐槽没人看围棋比赛,即使有直播也没人看,在他看来,和赢同样重要的是希望有更多人喜欢围棋—这项可以向人类智慧致以最高敬意的游戏。
身为棋士的骄傲让柯洁难以接受自己输得如此难堪,但身为人类的观众更在意的是他在与人工智能对决中,展现出来的独属于人类的品质—荣誉、智慧与英勇。在当天的发布会现场,每当柯洁说完一句话,现场都会响起鼓励的掌声。
柯洁输掉了比赛,但这三场人类顶尖棋手与人工智能的对决,将成为围棋世界的宝贵财富。AlphaGo的开发公司DeepMind在赛后表示,他们将与柯洁合作,深入研究三盘对局,共同分析比赛,并将分析做成视频与全球的围棋爱好者共同分享。
毫无疑问,AlphaGo的出现对于每一位职业围棋手都意义重大。周睿羊(九段)现在尊称AlphaGo为“阿老师”,即便面对的是冷冰冰的机器。“AlphaGo的对局让我们感受到围棋的自由性,没有任何一招棋是绝对不可能的。如今,每一名棋手都在尝试新的风格,这在过去是不可想象的。”周睿羊表示。
围棋一直被认为是最复杂的策略性游戏,也是人工智能难以攻破的终极智力活动。即使1997年,IBM的电脑“深蓝”(Deep Blue)战胜了当时的国际象棋世界冠军卡斯帕罗夫,大多数人仍然这么认为。
但现在,超越深蓝的人工智能出现了。
对于站在历史变革节点的柯洁来说,某种程度上,他也是幸运的。虽然在赛前,他曾调侃AlphaGo始终是冷冰冰的机器,感觉不到它对围棋的热情和热爱。但不可否认的是,AlphaGo的棋风正在激发人类棋手挑战创新的边界,并赋予一些传统套路以新的生命。
在和AlphaGo比赛结束的两天后,柯洁轻松晋级LG杯世界围棋棋王战32强。在序盘阶段,他用了对付AlphaGo的点三三下法,中盘期间,带有“阿老师”风格的招法也随处可见。
取得大胜后的柯洁恢复了心情,赛后他在新浪微博上写道:现在才发觉,原来和人类下棋,是可以这么的轻松、自在、快乐。下围棋真好。