棋手的焦虑

2016-03-22 09:07肖文杰沈从乐徐涛李蓉慧叶雨晨
第一财经 2016年10期
关键词:柯洁李世石棋手

肖文杰+沈从乐+徐涛+李蓉慧+叶雨晨

上帝死了。他又活了。

这样描述胡盼盼那几天的心情不算夸张。准确地说,那几天指的是3月9日至3月15日。这7天,举行的可能是人类历史上迄今为止最重要的5盘围棋比赛。对弈双方是世界冠军李世石和Alphabet旗下子公司DeepMind研发的人工智能(Artificial Intelligence,AI)系统AlphaGo。Go是围棋的英译名。这几天在中文社交网络上,AlphaGo被称为“阿 狗”。

李世石输掉第一盘后,胡盼盼晚上没睡着觉,她有些不甘心,认为李世石输在失误上。胡盼盼曾休学4年在北京的道场学棋,参加过职业冲段赛,现在是一名围棋教师。但接下来,李世石连输两盘,胡盼盼觉得自己对围棋的信仰崩塌了:“原本我为围棋里的虚的东西而着迷,认为这是无法言明的,但现在看来不是。

围棋一直被认为是最复杂的策略性游戏,也是人工智能难以攻破的终极智力活动。即使1997年,IBM的电脑“深蓝”(Deep Blue)战胜了当时的国际象棋世界冠军卡斯帕罗夫,大多数人仍然这么认为。

深蓝的原理很简单:依靠摩尔定律背书的超强计算能力穷尽每一步棋的可能性,选择最优解。国际象棋的棋局可能性约有10的47次方,而围棋大约有10的170次方,比全宇宙已知的粒子总数多100个数量级。这意味着,摩尔定律无法战胜围棋。

在此之前,最强的围棋软件仅能达到业余棋手的水平,它们能在局部围出领地,但当人类突然转移战场,或是摆出飘逸的布局时,软件很容易出现奇怪的错手,这就是所谓的“电脑棋”。

直觉、棋感、势,包括胡盼盼在内的所有棋手将这些视为围棋最与众不同之处。

也许正是因为这些经验,在DeepMind发出挑战书后,李世石只花了几分钟就答应了。他认为自己“必须以5:0或者4:1赢下”,如果输的话,“岂不是显得人类太绵软无力了”。即使他知道,在去年10月,AlphaGo已经首次战胜了欧洲围棋冠军樊麾二段。

如果李世石知道得更多,他或许会谨慎一些。在樊麾输给AlphaGo前两个月,围棋对弈平台弈城围棋网上,一个ID叫“deepmind”的棋手刚刚升入9D(准职业水准)。要知道,2014年年初,刚注册时,deepmind还是5D(业余初段水准)。比飞速进步更不寻常的是,它的进步不是渐进式的,而是在一个等级上停留一阵后,突然跃升一个档次。

与樊麾的对战棋谱公布后,AlphaGo的开发者之一黄士杰(Aja Huang)承认是他注册了deepmind这一账号,但否认账号背后是AlphaGo在下棋。2月底,9D“棋手”deepmind开始在弈城围棋网上与真正的职业选手对战,互有胜负。

柯洁九段不久前刚刚战胜李世石获得世界冠军,看到AlphaGo和樊麾的对战棋谱他很吃惊,因为这个AI没有下“电脑棋”。

不懂电脑的他开始搜索蒙特卡洛算法、深度学习等信息,并在接受采访时向科技记者打听原理。他大概理解了AI能不断进步,但即便如此,他也不相信AlphaGo能在5个月内从准职业“选手”变成顶尖高手。

几乎所有的职业棋手都不看好AlphaGo,他们等着李世石在3月9日捍卫尊严。而DeepMind的CEO哈萨比斯只是平淡地说:“我们测试的结果不太一样。”

谁也没想到李世石会连输3盘。

第二盘对柯洁的冲击尤其大。李世石在没有巨大失误的情况下完败。胡盼盼则被AlphaGo的第37手彻底震撼,这步棋初看损失巨大,“如果职业选手这么下会被骂死”,但随着棋局深入,胡盼盼越发怀疑自己的判断,她觉得37手有可能是步极有远见的好棋。

柯洁在李世石输掉第一盘后发布并置顶了一条微博:“就算阿法狗战胜了李世石,但它赢不了我。”而在李世石输掉第三盘后,这条微博被撤下了置顶。

樊麾则以日本名誉棋圣藤泽秀行的话做了评价:“棋道一百,我只知七。”

这时,AI专家以外的人才意识到,AlphaGo与之前所有的围棋电脑都不一样。它像人一样懂得布局、判断大势,它计算精准、棋风稳健,胡盼盼评价它下棋像李昌镐。在李世石之前,李昌镐曾称霸世界棋坛十几年,因为内心强大,被称为“石佛”。

柯洁的焦虑很直接。“当时就觉得下棋没意思了。以后职业棋手可能不再是围棋的权威。一个入门级别的观众在看直播时都可以通过AI来点评这步棋。作为竞技的乐趣大打折扣。”他对《第一财经周刊》说。

如今,即使是对围棋和人工智能都不了解的人,都能简述AlphaGo两个网络的决策模式:“策略网络”(policy network)推荐几种下法,“价值网络”(value network)评估这几步棋的优劣,选择胜率最大的一手。这种模式与人类落子的决策类似,通过对3000多万盘棋的深度学习(deep learning),它成了顶尖高手。

某种程度上,人工智能把围棋“祛魅”了。

人们的心态在变化。一些职业棋手开始下赌注,不服气的就赌李世石赢,另一些从理性出发赌阿狗赢,但内心希望自己赌输。

焦虑不仅仅属于不安的棋手和围棋爱好者。Google的一份内部报告显示,全球约6000万人观看了首场比赛。1997年,深蓝的国际象棋比赛以流媒体方式在网上直播,观众数量以百万计。

一个普遍的疑问是,如果代表最出色的智力和策略决策的围棋冠军也能被打败,那么人类会不会被机器打败?

和李世石一样,大多数人没意识到现在人工智能已经能做哪些事情。

在这场比赛之前,人工智能技术已应用到了Google的30多款产品中,用来改善搜索效果,例如如果搜索一部电影,它很可能会把周边电影院的排片表也顺便告诉了你,而如果你用Google Now,它会根据你的路程和路况告诉你应该提前多久启程。

事实上,人工智能不单单是逻辑推理和决策,如果将人工智能视为对人类能力的模拟,那科学家在视觉、听觉、触觉、精细动作等方面的模拟都有了许多突破。

在摩尔定律的影响下,传感器越来越便宜并能捕捉更多的环境数据,而算法上的突破能让人工智能利用这些环境数据不断做出反馈。“相比深蓝,AlphaGo有一定自主的学习能力和判断能力,并在算法上有根本的提升。”匹兹堡大学进化智能实验室主任陈怡然对《第一财经周刊》说。

“人们曾认为计算机不擅长解决那些由于答案主观而难以衡量的问题,但如果有一些数据和结果相关联,并且你可以试着建模,那么那些曾被认为需要由人类主观判断的问题,完全可以用一种我们此前不曾想到的方式来解决。”Shawndra Hill说,她是沃顿商学院运营、信息管理与决策专业的兼任教授。

即使没有意识到,很多普通人都已经在使用人工智能技术—如果你曾调戏过iPhone中的Siri,或微软的Cortana,它们被赋予“听觉”,能识别不同人的话语,并给出回答。

在模拟人类精细动作方面,和DeepMind同属一个母公司的波士顿动力(Boston Dynamics)发布了新一代人型机器人Atlas。即使在雪地里,它也能像人一样走路,被实验人员踹倒后也能自己爬起来。如果你看过那个用“DARPA(美国国防部国防高等研究计划署)机器人大赛”剪辑成的搞笑视频,你会知道直到一两年前,大多数人型机器人还没法正常走路、开门或捡东西。

但如今,像职业棋手那样工作的人工智能,已渗透到不同的角落。在胜任重复性的精确工作并代替了流水线上的工人后,人工智能也在星巴克这样的连锁零售公司中承担排班工作,或化身无人机对照图纸监督建筑工地进度。(详见《第一财经周刊》第383期大公司特写《我的上司是机器人》)

2011年,IBM的人工智能Watson还只是以称霸智力竞猜电视节目《危险边缘》(Jepardy)闻名。但现在,它已经与北美十几家癌症治疗机构合作。

2013年,牛津大学发布了一份叫做《就业的未来》的报告。它警告说,未来,美国47%的职位将被机器代替,包括管理、金融销售、艺术家。美国莱斯大学(Rice University)的科学家Moshe Vardi甚至为这个预言加了一个时限—2045年。

面对悲观的论调,棋手们的心情却发生了逆转。在3场全败之后,柯洁说,如果AlphaGo能像App那样方便,那“我肯定可以用它来精进棋艺”。一个事实是,柯洁早就在用不那么聪明的AI来提高棋艺。网络对弈是新一代棋手主要的训练方式,这使得他们的训练量比上一代棋手更大。“深蓝”战胜卡斯帕罗夫19年以来,国际象棋的棋手们也像这样改变了传统的训练方式。

柯洁每年下上千盘网棋,在围棋网站上,他的ID是“潜伏”。

在经历了4个不眠之夜后,胡盼盼也逐渐接受了事实,她和同为业余围棋高手的丈夫不再视AI为可怕的敌人,而是完美的老师,他们想尽快跟AlphaGo学棋。

那些更早接触AI,并思考AI和人类未来的人,看起来都有类似观点。

普利策奖得主、《纽约时报》驻硅谷记者约翰·马尔科夫(John Markoff)就将自己的新书命名为《与机器人共舞》,他认为未来人工智能能帮助人类提升效率,人类不擅长的地方,机器人可能很擅长,比如计算、重复劳动和逻辑推断;但人类习以为常的小事,机器却难以达到,比如察言观色、安慰小孩,甚至倒一杯咖啡。这类人工智能的准确称呼应该是智能增强(Intelligence Augmentation)。

对于亟需劳动力的市场来说,人工智能的广泛民用将会带来变化。事实上,除了非洲,全球绝大多数地区都面临老龄化和劳动力短缺的威胁。工业革命时期,机器的普及让英国的农业人口比例从30%下降到5%,同时催生出更多工作种类。

但技术带来的变化是未知的,这或许是恐慌的根源。不过这也迫使人思考,什么是机器擅长的,而什么不是—更重要的可能是思考人之所以为人的那些特质:情感,毅力,反思,沟通,不按常理出牌,以及想办法克服逆境。

为了更了解自身,人们需要更了解机器。

马尔科夫描述了AI和IA这两大阵营的关系。在汽车问题上,Google选择了无人车,丰田、通用、特斯拉等公司则选择用技术辅助驾驶员减少事故。另外,你可以把正在艰难学习人类幽默感的Siri看做AI,而把纯粹的工作助手Google Now看做IA。

尽管所秉承的技术方向相反,但目前两者的差别没有那么大,所采用的技术(比如名声大噪的深度学习)也类似。两种思路会并存于一个公司内,专家们也在两个阵营间转换。

最近的技术进步已经显示,下一个像iPhone一样改变一切的产品将诞生在人工智能领域。它可能是医疗机器人、无人车或是一个现实版的大白。“人工智能对人类社会的影响将远超互联网和计算机在过去30年所做的。”约翰·马尔科夫(John Markoff)对《第一财经周刊》说。

真正需要为AlphaGo担心的,可能是来自Facebook的对手。与硅谷其他创新不同,人工智能的主要竞争发生在巨头之间,独立的创业公司很难挤进战场。Facebook也有一个围棋AI项目,并被认为处于领先地位,战胜过AlphaGo以外的所有AI,但还没赢过职业选手。

“对数据的巨大需求,这种研究的投入不是创业公司能承担的。投资者也未必能准确判断。推动这个领域的是大公司和政府。”零售机器人助理公司Fellow Robots的方正钦(James Fahn)对《第一财经周刊》说。

大公司的责任会变得空前地大。人工智能与先前的技术的不同之处在于,它的发展很大程度上由看得见、摸得着的少数科学精英决定。硅谷元老杰里·卡普兰(Jerry Kaplan),曾警告他在斯坦福大学人工智能实验室的后辈:“你们今天写入系统的内容,日后可能决定整个社会处理问题的方式。”

这也是为什么人们对此总是特别小心。对“终结者”的恐惧当然不会完全消失。这也是为什么伊隆·马斯克要建立非盈利组织OpenAI,并呼吁法律束缚住人工智能研究的手脚。

马尔科夫在新书的前言中引用了“控制论之父”诺伯特·维纳的一句话:“我们可以谦逊地在机器的帮助下过上好日子,也可以傲慢地死去。”

就在逐渐承认AI对围棋的统治后,胡盼盼又一次被冲击了—3月13日,李世石赢了第四盘。

他设计了一个庞大的诱导战术,让AlphaGo误以为处于优势,然后突然在78手使出从未有过的招数,打破了对手看似牢固的优势,之后AlphaGo连下两着错棋。

DeepMind又一次对李世石表示赞扬—这次可能更真心一些—这次比赛的重要目的之一就是让顶尖选手来测试AlphaGo的漏洞。

在告诉记者“下棋没意思”之后5分钟,柯洁就坐到了电脑前,登录弈城围棋网,以“潜伏”之名继续一场网络十番棋,对手是韩国顶级棋手朴廷桓。柯洁赢了。

胡盼盼为学生准备好的关于人机比赛的发言没有用上。不到10岁的棋童们似乎对这场金字塔尖的风暴所知甚少。在李世石扳回一盘后,胡盼盼和丈夫出去吃了顿饭庆祝。他们没像之前那样对最后一盘下注,只想看场好棋。

就胜败而言,人类输了。但围棋还是那个古老而诱人的游戏。

柯洁在13日当晚发布了一张照片,看上去是一场职业棋手的聚会,柯洁似乎睡着了,桌上是空了的啤酒瓶,一旁的古力看上去心情不错。那条被转发3万多次,先前撤销置顶的微博,又再次被置顶了。

猜你喜欢
柯洁李世石棋手
2019年下半年男子棋手等级分
怕,就输了一辈子
柯洁中国围棋的“盖世英雄”
李世石不代表人类
90后棋手走在路上
李世石“天才”继承人
业余棋手错觉
业余棋手的错觉