横扫围棋棋坛的AlphaGo(阿尔法狗)如今遇到了对手,不过战胜它的并不是人类,而是它的升级版Alpha⁃GoZero。据英国《金融时报》19日报道,在高调推出AlphaGo不到两年后,谷歌旗下位于伦敦的人工智能公司Deep⁃Mind宣布开发出人工智能技术的又一里程碑。该团队以一种新的“强化学习”方式创造出AlphaGoZero,并在科学期刊《自然》(Nature)发表了相关细节。
AlphaGoZero仅拥有4个TPU(张量处理单元),无人类经验。《金融时报》称,前几代AlphaGo最初都是通过分析成千上万场优秀人类玩家间的对决来发现制胜招数。而新开发的Alpha⁃GoZero则未用到任何人类围棋数据,开发者仅向其教授了围棋规则。英国《每日电讯报》称,在未经过指导的情况下,AlphaGoZero用3天时间自我摸索,通过与自己下棋,从数百万份棋谱中找出了最佳对弈方法,并在与AlphaGo的对弈中,十分轻松地以100比0取得胜利。在随后的40天自学时间内,Alpha⁃GoZero又与自己对弈了2900万局,学到了人类积累3000多年才得到的下围棋经验。
英国围棋协会主席罗杰称,Alpha⁃GoZero的出现不仅体现出其在围棋方面的成功,还意味着人工智能的发展取得重大飞跃。DeepMind团队表示,人工智能的最大挑战就是要研发一种能从零开始、以超人类的水平学习复杂概念的算法。AlphaGoZero之所以如此强大,正是因为它不局限于人类的知识。DeepMind首席执行官哈萨比斯认为,在接下来的十年内,AlphaGo的更新版本很有可能被应用于多个科学领域。▲
(李晓骁)