十年前的天才少年,如今的AI黄金一代

2018-06-28 02:49罗婷
博客天下 2018年11期
关键词:清华

罗婷

2005年前后,一众天才少年在中国计算机界如群星涌现。他们就读于清华姚班与上海交大ACM班,是这两个著名的计算机科学实验班培养出的第一代学生,也是中国第一批在国际大学生程序设计竞赛(简称ACM-ICPC)中获得奖牌的本科生。

十多年后,他们已成为各家人工智能企业的创始人,公司估值总和已超过50亿人民币。他们分别是旷视科技的创始人唐文斌、印奇和杨沐,pony.ai的创始人楼天城,第四范式的创始人戴文渊,依图科技的创始人林晨曦。

在知春路、上地、北苑路的办公室见到这些人时,会有时空交错之感。他们背后的墙上写满了算法与公式,眼睛发亮之时,谈的都是20年前机房里那个小心翼翼研究Pascal 语言的小学生。

这是值得记录的时代故事:关于天才们如何在年少时就发现此生的使命,理想主义的教育又如何滋养他们,使他们互为见证,长成今天的模样。

乐园

整个体育场都是彩色的。420个穿着不同颜色T恤的年轻人,正对着桌前的电脑,键盘敲得噼啪作响。不定时地,一些人座位旁会升起一颗彩色气球。某些时刻,还有人会得到一颗色彩更鲜艳、个头更大的心形气球。其他人会在此刻放下手中的工作,站起来鼓掌、欢呼。

今年4月19日,北大邱德拔体育馆是一片绚烂的海洋。人们看起来轻松愉快,但实际上,这里正在进行的ACM-ICPC是世界上难度最高的大学生竞赛之一。

戴文渊当天到了现场观战,而他的老朋友唐文斌没来,唐文斌出差了,但一直用手机看官网直播的选手积分榜。每年这天对他们来说都是特别的日子。这两位先生分别是2005年的世界冠军、2008年的银牌得主。如今他们的学弟学妹就坐在考场里,十几年前训练他们的老师,依然坐在场外的教练席上。

这个计算机领域最具历史、规模和影响力的竞赛,每年都会聚集极有天赋和能力的选手。今年是420人,3人一组,共用一台电脑,在5个小时内解决所有题目。解决一题,得到一个气球;全场第一个解决某道题,可以得到一个心形气球。

5个小时的比赛,挑战的是人类脑力和体力的极限。要应对的是由数据结构、图论、计算几何与数论、算法、机器学习、模式识别等科目混合而成的考题,解答它们需要严密的思维方式和长期训练的思维能力。它还考察你的团队协作能力、以及在强手如云的氛围里能否应对自如的心理素质。

但对天才少年们来说,这里是他们的乐园。

中国计算机界著名的“楼教主”楼天城曾分析过,俄罗斯选手训练刻苦,编程能力极强;另一霸主波兰,他们的选手灵气洋溢,程序设计在他们手中充满艺术气息。

这个比赛创办后的24年里,一直都是美洲、欧洲选手两分天下。变化发生在2002年。这一年,上海交大学生林晨曦、陆靖、周健在美国夏威夷的决赛获得冠军,这也是亚洲的首个冠军。3年后,同样是交大的学生戴文渊、赵爽、杨博海再次摘桂。清华大学姚班是另一支实力强劲的队伍,学生楼天城曾两次获得金牌,而清华也是入围决赛次数最多的中国高校之一。

李开复对记者回忆,1998年他到微软亚洲研究院时,雇了第一批应届毕业生做研究员,“没有一个人(水平)是过关的”,他只好创造了一个助理研究员的职位。

但到了2005年,中国已经有楼天城、唐文斌、戴文渊这样计算机水平位于金字塔顶尖的人出現了。他对他们的评价是,“未来推动中国互联网产业发展的中流砥柱”。

美好的、愉悦的

这群少年的交集,要远早于2005年。线索已经在飞速迭代的互联网世界里消失。但采访时我们发现,某个词就像通关密码,读出来,故事会被和盘托出。

这个词是“IOI FORUM”。

这是一个已经关闭的BBS。上世纪90年代后期,BBS还是人们最先进的网络社交工具,尽管设计粗糙,但迅速把天南海北的人聚在一起。IOI FORUM,就是为编程爱好者而建。

编程竞赛的圈子小,一个论坛口耳相传,很快每个人都注册了ID。当时就读于绍兴一中的唐文斌,ID是bamboo;苏州中学的戴文渊,取名Arthur King,后来他嫌这名字太长,改成了AK;来自杭州的楼天城,当时还不叫后来著名的ACRush,而是用了他的真名;来自竞赛名校东北育才学校的贝小辉是bell,贝壳的意思。

现实生活中属于少数派的编程爱好者们,不再是孤独地敲着程序了。他们一边解题,一边在论坛里自由对话。现在已经是新加坡南洋理工大学助理教授的贝小辉,向记者回忆起那段热气腾腾的时光:“那时候氛围真的非常好,大家讨论非常热烈。年龄差了10岁的人在一起聊天,信息竞赛的金牌得主,也给你解答问题。”

直到2011年,还有人试图重建这个论坛,他在召集宣言里写:2006年关闭后至今,时常有怀念的声音,就像珍珠港的军舰虽然沉没几十年了,每天仍有油花从海底漂起。

论坛也极大扩展了少年们的视野。大家开始知道,世上还有一种叫编程题库的东西。网上做题最大的好处是,你可以把答案提交上去,它告诉你对不对。在贝小辉的记忆里,“当时我们所有人最希望看到的,就是那个红色的accepted,意为提交的程序正确,这也是当时所有人眼中最美好的一个单词。”

年轻人们在这里声气相求,互为挚友与对手。高一那年,唐文斌在论坛里认识了一个东北的同学。两人隔着一千多公里,你追我赶,花三个月一起刷完了有300多道题的题库。那是他进步最快的一段时间,也曾居于题库榜单的第一、二名。但令人生气的是,有个ID后来一直雄踞榜首,“楼天城,也不知道他哪里来的时间!”

但在此之前,少年们其实已经拥有了强烈的自我发现与确认。

1991年,在苏州古城区读小学二年级的戴文渊,考了三次数学全班第一后,加入计算机兴趣小组。10岁的他已经开始在机房的电脑上写logo语言,书架上有了C语言的书。上机的时间对他而言非常珍贵,他把它形容为“和巴菲特午餐”。

在辽宁沈阳,小学生贝小辉照着老师给的几页纸输入了一段长长的程序,按下运行键时,屏幕上出现了一只机器猫,他高兴得“哇”了一声。

几年后,绍兴新昌的初一学生唐文斌获得了一把机房钥匙,这在他看来是无上的荣耀。在那里,他觉得时间过得飞快:“你能够用代码和指令的方式,让计算机去执行一件事情,最后能够输出一个你想要的结果,牛逼啊。”

但戴文渊不认为这是他内心逻辑的起点。“最重要的是,我在这件事情上得到内心的愉悦。这个事情是我感兴趣的,并且目标坚定,我没有想过其他的事。”

恰逢其时

如果拆解戴文渊所说的目标,那么一定有一环,是读一个好的计算机系。天才少年们对未来确信不疑。但没有想到的是,他们后来会在交大与清华分别遇到一场计算机教育改革,并因此受益终身。

在交大,改革的关键人物是俞勇,时任计算机科学与工程系主管教学的副系主任、ACM队的教练。

2002年,交大在夏威夷拿到了ACM-ICPC决赛的第一个世界冠军,队员们获得了最高规格的奖赏——凌晨落地时,校长抱着鲜花在机场迎接,把他们吓坏了。

俞勇知道,时机到了。4月26日拿到冠军,6月16日他就向学校提交了成立ACM班的申请,以“培养中国自己的计算机科学家”。两天后,他得到回复——“同意”。当年9月,ACM班招生了。

在交大闵行校区逸夫楼的办公室里,俞勇说起16年前的往事,纤毫毕现。这个愿望在他心里埋了多年。他毕业于华东师大,从1996年起,带学生参与ACM比赛8年,深深明白课堂教育存在问题,“这个比赛考核的其他能力,课堂里是没有的。我们好像只教硬的东西,但又比不过别人。没人去强调沟通能力、表达能力、合作能力这些软的。我慢慢发现,这是核心竞争力,我们的学生都缺。”

ACM是美国计算机协会的缩写,这是颁发“图灵奖”(计算机界的诺贝尔奖)的机构。俞勇从未隐藏他的野心:“我的目标并不是多拿几个世界冠军,更希望能够去培养一些计算机科学家,希望在前沿科学上,也有我们占领高峰。”

就在俞勇创办ACM班的2002年,另一场关键的会面也发生了。那年,普林斯顿大学教授姚期智到中国访问,时任清华计算机系系主任的周立柱教授与张钹院士联络他,希望他帮忙指导研究生——谁会愿意错过“图灵奖”唯一的华裔得主、现代密码学基础的奠基人?

最让姚期智感动的是,清华方面还请了杨振宁先生与他会面,这是他一生仰慕的学者。2004年,姚期智辞去普林斯顿终身教职,到清华大学任教,并在2005年创办“姚班”,要培养全世界最优秀的本科生。

少年们恰逢其时。2005年,姚班第一次校内招生,计算机系大二的楼天城、贝小辉被录取,一年后,新生唐文斌、印奇也加入其中。

而在交大,戴文渊已经进入了ACM班。信息学竞赛时他以一名之差错失清华,曾自嘲说:“就像是奥运会,非常有实力去竞争体操冠军的人,结果从平衡木上摔下来了。”俞勇寄了一张填有他名字的保送推荐表到苏州中学,他接受了交大的邀请。他的师兄林晨曦也从交大材料系转入ACM班,自愿降了一级。

新世界的大门打开了。

CS很年轻,但哲学已经老了

清华曾流传一句话,半国英才聚清华,而清华一半英才在姚班。能进入姚班的学生,是数学、物理及信息学竞赛的金牌选手,是各省高考前三名。但縱使是他们,在感受计算机之美时,也遭遇了前所未有的挑战。

每一门课都非常难。05级学生张旋记得,姚期智教的那门《理论计算机科学》,习题之艰深,让他不得不每周花费一半时间。大二时他们才刚学编程语言,老师就给了几个选择,做一个能使用的压缩软件、桌面搜索或输入法。“我们觉得老师疯了,肯定做不出来,但老师不为所动。”结果出乎意料——他们确实做出来了,每个人都是。

张旋从陕西安康的一个厂矿中学考到清华,有时无比自信,有时又陷入自我怀疑。回忆大学时代时,他似乎想清楚了一件事情,那就是姚班给他的最大好处是什么。“你总会接到一些任务,觉得自己做不到,然而压迫之下做到了。再回头看,会觉得很惊奇。没有想象的那么难。也许你真的可以做,有时只是想得不够,不是能力不够。”

还有一些人被其他东西打动。在课堂里,姚期智讲的是人类共同的境遇。比如现在算法做到了什么程度,还有哪些有挑战的事物,有多少没被解决的问题。“我要解答的是大家都不知道的问题,好像我是有使命和责任的,是在为全人类探寻知识的边界在哪里,这种感觉是不一样的。”贝小辉觉得自己被感召了。

这种教育之下,年轻人们开始思考一些更深邃宽阔、更具思辨性的问题。2005级的学生刘贺,对计算机科学和哲学的关系曾有过一段形象的描述。他说,CS(计算机科学)很年轻,但哲学已经很古老了,所以很多哲学命题都对CS有借鉴意义。比如分布式计算,原理的本质是时空相对论和因果律;而人们关于程序语言应该实用还是优美的争论,与哲学上关于逻辑语词的讨论不谋而合。

选择从事研究的贝小辉,则体验到了学术生涯里最美妙的瞬间。不止一次,他在路上突然解开一直解不出的问题,非常兴奋,最想做的事情就是找到纸笔演算。“你会有这种感觉,知道一个全世界这个时候只有你知道的东西,哪怕只有这短短的一瞬,但这个感觉,没有其他能比得上。”

ACM班的教育同样如此。俞勇有一门开了多年的课叫《学子讲坛》,这学期他讲的是伟大的思想与伟大的文明,讲古希腊诗人阿尔基诺库斯的残句:“狐狸知道许多事情,而刺猬只知道一件大事。”这命题看似与计算机科学毫无关系,但他希望的是,“能培养他们独立观察世界的角度。”

成立十周年时,ACM班出过一本回忆录。师生们忆起共度的岁月,有一个细节让人印象深刻。翁慧玉老师写道,学生们经常猛地站起来说:“老师,这好像不对。”这在课堂上经常发生,她从“惊吓”,后来慢慢变成一种享受。

重回赛道

天才少年们的大学时代,世界还不太喧嚣,没有这么多的泡沫和热钱,人工智能的浪潮也远未到来。他们度过了探索自我的几年,开始思考自己一生真正要追逐的东西。

戴文渊是这群人中最早接触到人工智能的。2005年,就读大三的他夺得ACM-ICPC冠军后,面临的第一件事是选择实验室与研究方向。在他的描述里,AI当时是个“一点都不火”的专业,大家热捧的是选图形学,做CG渲染,能去好莱坞。那AI是什么?一个被选剩下的专业,他只能这么跟人解释,有部科幻片叫《AI》。

交大没有人工智能领域的老师,戴文渊被送到了港科大,师从杨强教授。港科大建在山上,实验室没有窗,手机也没信号,他关在里面,过得不知白天黑夜,又将信将疑,觉得自己在做一个所有人都做不出来的东西。

但杨强是坚信并热爱人工智能的“狂人”。学生们总开玩笑,说他们是《西游记》里的师徒,除了师父,其他人都心怀鬼胎,根本不想去西天取经,只觉得纳闷儿:“这么遥远的事,为什么这人几十年如一日坚持,并且从没动摇过?”相处的时间一长,戴文渊也信了,大家的理想都变成了推动人工智能发展。

ACM的训练曾让戴文渊成为一个目标导向的人。当时为了夺冠,他和队友们住到一起,肩负起让一个“喝了可乐就能写出好代码”的队员随时能喝到可乐的工作,并和另一个队员一起看他根本不感兴趣的动漫,只为了与他们训练默契度、达成相互理解。

在AI这件事上他同样如此。2009年,他已在顶尖期刊发了论文,却发现只有做出真正的应用,AI才能有发展。他放弃博士学位,入职百度,4年里使百度的广告系统效果提升800%。这个数字公布的瞬间,是他在百度最风光的时刻,也是他决定离职的时刻,因为意识到“这个技术的力量太大了,不应该局限在一家公司”。后来他到了华为,想看看更广大的企业服务是什么样子。不久后自己创业,做了如今的第四范式。

与此同时,楼天城在清华有了新外号——“楼教主”,他对计算机的热爱成了校内的段子——清华军训很累,白天结束,晚上所有人都躺在床上,根本动不了。楼天城那时说了一句话:“今天真是累得不行了,我需要去机房做两道题放松一下。”

毕业后,楼天城辗转Google、Quora,又在百度担任无人车领域的首席架构师。2016年,他拉了一帮人创办无人驾驶企业pony.ai,找到了深耕的方向。

2010年的清华学生节,因为排话剧,唐文斌对同班同学印奇有了印象。那时唐文斌在微软亚洲研究院做图像搜索,印奇则在隔壁组做人脸识别,两人熟了起来,常在西格玛附近的一个日餐馆聊天。后来擅长数据挖掘的师弟杨沐加入,有了如今旷视科技的三人组。2012 年,他们为这个公司写下注脚,要做“最好的人脸识别云平台”。

几乎是同一时段,中国首位ACM竞赛冠军林晨曦离开了工作多年的阿里云,与儿时好友、MIT 实验室担任博士后研究员的朱珑一起,创办了依图科技。

4年后的春天,AlphaGo与李世石为整个人类社会贡献了一出载入史册的围棋比赛,似一枚信号弹,将人工智能、深度学习,以及这群早已准备多年的天才少年推到台前。

穿过小径分岔的花园,他们又回到了相同的赛道。

他们是博士、硕士,是在顶尖计算机期刊上发表论文的最优秀本科生。如今他们的新角色是独角兽公司的CEO了。但很多瞬间,还是能从他们身上看到科学家的底色。

有好几个姚班的学生,都在受访时提到一个词,impact,意为“影响”。这是姚期智多年来一直在提的词语。他希望他们要做对科学界和人类社会有impact的事情。

在旷视科技和第四范式,都有首席科学家的职位存在。旷视科技的是孙剑,微软亚洲研究院曾经的首席研究员,中国深度学习领域的领军人物。第四范式的就是杨强,戴文渊在港科大的“唐僧”老师,杨强在迁移学习领域的论文引用数居世界第一。他们如今仍在参与人工智能领域的基础性科学研究。

在AlphaGo战胜李世石的当天,戴文渊在知乎上第一次回答了问题,他强调发起者有多重要:“其实我们缺的并不是有理想有抱负的科学家,而是发起者。所以真正挑战人类的其实是IBM,不是许峰雄;是Google,不是DeepMind团队。就像真正修成圣彼得大教堂的,是天主教会,而不是米开朗基罗。”

在一封内部公开信里,印奇也告诉他的员工:“评价一个好的研究者和一个好的技术公司,标准是一致的,既要有大的洞察力,也要从内而外的踏实,并且还得真正耐得住寂寞。”

楼天城到了更源头的地方。他在今年春天回到姚班,讲了8周的《自动驾驶》课,在清华学堂102号房间,每周三下午,一个半小时。他认为自动驾驶是一项将产生深远影响的技术。

还有一批姚班学生,如今已在海外谋得教职。4月底,记者联系上在美国印第安纳大学伯明顿分校做助理教授的周源,他是姚班05级的学生。他又向我推荐了如今在杜克大学工作的鬲融,在斯坦福大学工作的马腾宇,在香港大学工作的黄志毅,在布法罗大学工作的栗师,以及在匹兹堡大学工作的吴越。他们已在各个大洲扎根,有了自己的研究领域。

在南洋理工大学做助理教授的贝小辉,也一直关注着昔日同窗们的研究成果。他读了鬲融在杜克大学做的研究,难掩赞美。鬲融试图从数学的角度去解释机器学习,“大家就知道这个东西好用,它是告诉你为什么好用,更深地去解释运行的机制和秘密。有些人可能认为没用,但是我认为它非常重要。没有坚实的理论基础,这个行业不会发展得那么远。”

在对贝小辉的采访中,有一个很动人的瞬间。我问他,你觉得你在(计算机)这件事情上面是有天赋的吗?

他迟疑了3秒,羞涩地笑了,轻轻点了点头,“是的”,随后语气又更加确认了,“是的是的”,然后又更加羞涩地笑了。“我觉得我蛮有天赋的。我喜欢它,我也做得蛮不错的。我觉得能做一些确实是对别人有更大impact的东西,为什么不继续呢?”

后来我又在另一位姚班学生脸上看到了同样羞涩又坚定的神态。那是一个视频,2013级的陈立杰在2016年清华特等奖学金答辩会上发言。这段视频曾在计算机圈内广泛流传。

陈立杰在台上这样讲道:“这么多同学在科研上前赴后繼,不禁让我想起姚先生说的一句话,现在是计算机科学的黄金时代,也是全人类的黄金时代,能够站在这样的黄金时代里,我感到无比的荣幸,我梦想能够成为黄金时代大潮中的一朵浪花,为人类智慧添砖加瓦。”

来源:每日人物(微信公众号:meirirenwu)

这个比赛创办后的24年里,一直都是美洲、欧洲选手两分天下。变化发生在2002年。

猜你喜欢
清华
黄清华作品
繁芳删尽地清华(钢笔画)
清华十《四时》中一种特殊写法的“中”字
清华党组织公开
Notes
孙清华作品
清华简第八册《心是谓中》补说
骑行上清华
何清华:邂逅心理学
释清华简《越公其事》之“憂”字