何永华 朱卫纲 唐晓婧
【摘 要】本文主要从围棋人机大战中AlphaGo的表现谈起,尤其是被赞为“神之一手”的称其有“吴清源”之风的“黑37”步棋,可能包含了无穷无尽的计算、判断与预谋。AlphaGo的胜利,让如今已经很火的深度学习益发成为人工智能领域的焦点,昭示了未来几年人工智能很可能会以超出我们想象的速度发展,也许能够胜任更多人类智力所不及的任务。但是,人工智能在某种程度上来说,也许并不在它的创造者的控制范围内,出于失控的风险考虑,是否有一些人工智能从一开始就不应该被发明出来?
【关键词】李世石;AlphaGo;人工智能
在今年三月份这场历史性的围棋人机(李世石和AlphaGo)大战中,世人的目光都集中在李世石和AlphaGo身上——一个是当世最伟大的围棋手,一个是全世界最好的人工智能专家花了两年时间开发出来的强大的自学习系统。
纵观韩国围棋界,李世石是继独步天下的李昌镐之后,韩国最具代表性的棋手,自2002年加冕富士通杯以来,10年时间里他共获得14个世界冠军,数量仅次于李昌镐的17个。
比赛结果是李世石1:4落后于AlphaGo。在这场举世瞩目的人机大战中,很多人折服于AlphaGo的精准、聪明和大局意识。人们问AlphaGo为什么如此厉害,工程师给出的答案是它有“两个大脑”;一个输入了3000万盘人类顶级棋手对弈数据,通过“自我对战”来进行增强学习,改善此前的决策网络;另一个通过价值网络来进行整体局面判断,决策网络与价值网络协作决定落子位置。
关于这场万众瞩目的世纪大战,赛前最大的悬念,也是构成比赛最大的魅力之一就是,赛前没有人、连谷歌DeepMind的工程师都不知道AlphaGo的棋力到了什么水平。即使比赛之后,人们仍然搞不清楚AlphaGo的棋力到底到了什么水平,以及他能够达到什么水平。
大家记忆中应该还深刻记得,最为意味深远的一幕是在第二局,AlphaGo在下第37手棋时,突然从右下角的战役中离开,跑到右上侧开阔的疆域作战。当时现场解说员迈克。西蒙(西方唯一的围棋九段职业棋手)吃了一惊,说:“这一着很怪。”另一个显然水平比较差的解说员附和着笑了一下,不经意的说:“也许是机器又犯傻了”。但李世石看到此棋一落,突然一言不发,面无表情的出去了,回来以后喝了一口咖啡,陷入了漫长的15分钟沉思。还记得李世石在赛前宣称自己将以5:0全胜。他相信下围棋这件事情里面有一些东西是机器不可能模仿的。作为人类代表,他发誓要守护围棋之美。但事实上,从第二局开始,形势已经发生了惊人的逆转。在此之前,是AlphaGo挑战李世石,但在此之后,已经是李世石在挑战AlphaGo了。10秒钟后,AlphaGo下的那一颗看似与之前的棋子毫无关联的黑棋,奇迹般的以燕尾之势与它之前的18颗黑子相联合。在围棋职业棋手们事后的不断回味中,AlphaGo的这步棋(黑37)被人赞为“神之一手”,其中似乎包含了无穷无尽的计算、判断与预谋,现场解说员甚至称其有“吴清源”之风。
AlphaGo的技术框架采用的是模仿人类大脑神经的模式,通过深度学习把人工神经网络的层级大大增加,提升了计算能力。AlphaGo的胜利,让如今已经很火的深度学习益发成为人工智能领域的焦点。
简单地说,人工神经网络是一种从信息处理角度对人脑神经元网络进行抽象,按不同的连接方式组成不同网络的算法数学模型。它由一层一层的神经元构成,层数越多就越深。而所谓深度学习就是用多层神经元构成的神经网络,以达到机器学习的功能。这些多层的电脑网络像人类大脑一样,可以收集信息,并基于收集到的信息产生相应的行为,也就是“认识”事物,并做出行动。
按照谷歌DeepMind的联合创始人德米斯.哈萨比斯赛前的说法,这也是创造AlphaGo出来的初衷:让机器学会像人类一样学习。
到目前为止,人类仍然是这个星球上最擅长学习的物种——李世石可以在四盘棋局里不断调整策略,并成功找到AlphaGo的弱点,而AlphaGo在此期间却没有任何办法做任何调整,因为机器学习需要庞大的数据和漫长的训练时间,单棋局的经验对它来说毫无意义。很多人以为AlphaGo能从与李世石的对决中学到很多东西,其实几盘棋根本无法对AlphaGo产生作用,它至少需要上千个棋局的数据和一个多月的时间,才能训练出新的版本出来。
AlphaGo的胜利昭示了未来几年人工智能很可能会以超出我们想象的速度发展。我们对李世石的感同身受,恐怕就是因为多少嗅到了其中危险与刺激的气息。
在那个瞬息万变的棋盘上,作为过去10年公认的全球最优秀的围棋手,李世石不仅在代表人类与机器进行一场智力上的对决,而且也在代表我们第一次“探访”一个全新的世界——一个机器智慧与人类智慧共存,甚至在某些层面超出人类控制的世界。人类曾经在小说与电影中无数次想象过这个世界,其中有憧憬,也有噩梦,但从没想过它会来的这么快。
在此之前,我们恐怕从来没有把“人工智能”这件事情当真过。是的,机器曾经在很多智力游戏上打败过人类,跳棋、国际象棋、拼字游戏、智力问答……但一直以来,在一切创造性领域,机器的智慧与人类相比仍然不值一提。但是,AlphaGo这一次是在人类最引以为自豪、代表着人类某种最该智慧形式的围棋上打败了人类。
在三天的观赛期间,德米斯.哈萨比斯不止一次对AlphaGo的精妙棋法表示“惊奇”。他的“惊奇”可以从以下两个方面来解读:
一方面,AlphaGo的学习与决策能力如此之高,意味着它可以为人类所用,帮助人类棋手在围棋上达到更高的境界,开拓出更多的可能性,甚至胜任更多人类智力所不及的任务,比如气候变化、药物研发、金融系统、疾病诊断……等等。
但另一方面,哈萨比斯的“惊奇”也暗示了AlphaGo在某种程度上不在它的创造者的控制之内。这样的失控在棋盘上固然无关紧要,但一旦应用到现实世界,必然会引发道德与伦理上的问题。比如:当AlphaGo的未来版本为我们开车,诊断疾病甚至防止犯罪时,我们应该给它们多大的权限?我们应该如何在如此复杂的人工智能里嵌入人类控制?出于失控的风险考虑,是否有一些人工智能从一开始就不应该被发明出来?
【参考文献】
[1]陈赛.我们的对手是未知还是自己[J]. 三联生活周刊,2016(12):34.
[2]陈赛.AlphaGo到底有多聪明[J].三联生活周刊,2016(12):37.
[3]李翊.李世石和一代代棋人[J].三联生活周刊,2016(12):50.
[4]曹玲.AlphaGo背后:深度学习的胜利[J].三联生活周刊,2016(12):61.