张超 为大国网络筑牢安全基石

2024-08-19 00:00:00华南王琦
中华儿女 2024年8期

张超(左一)参加GEEKCON大赛

人工智能时代已悄然来临,科技正以超过预期的速度爆发式发展,互联网的运行逻辑似乎也在被改写。

在新的游戏规则中,传统的互联网系统是否依然安全可靠?

新的人工智能技术何以赋能互联网安全?

当新的攻击来袭,互联网是否有能力自动防御?

……

这些问题,在普通互联网用户看来遥远、神秘,却是中国青年科技工作者协会理事、中国人工智能学会人工智能与安全专委会常务委员、清华大学网络研究院副院长张超的日常思考。

随着大模型等AI技术的发展,新技术应用不断涌现,网络威胁也随之升级。提升安全防护能力,筑牢安全基线,成为保障数字经济发展的关键。从事互联网安全研究近二十载,他曾作为“蓝莲花”战队一员参与各类攻防演练,也曾带领美国团队研发自动攻防黑客机器人,如今作为清华老师带领团队研发智能攻防大模型。在模拟与现实的虚实变换中,张超对网络安全的理解日益加深。

亲历中国网络安全事业发展

张超是一名“85后”,生长于湖北大别山区的小山村,在上大学前,他没有接触过计算机、互联网,在广播中听过“千年虫”、“红客大战”。因为在数学奥林匹克竞赛中获得优异成绩,2004年,张超被保送进入北京大学数学科学学院学习,第一次真正接触到了互联网,并迅速地产生了兴趣。大三时细分专业方向,他选了信息数学,“觉得理论数学离实际还是有点远,我喜欢实践性偏强的学科。”

人生的路至此慢慢转向,最终引领他走进网络世界。2001年,中美撞机事件发生后,网络大战愈演愈烈。自4月4日起,美国黑客组织PoizonBOx不断袭击中国网站。对此,我国的网络安全人员积极防备美方黑客的攻击,最终夺取胜利。这让年轻的张超热血贲张,也明白看似无形的网络世界,同样事关国家安全。

2008年,张超本科毕业后,坚定地选择了跨院系推免直博进入北京大学王选计算机研究所,正式跨入网络安全领域学习的门。彼时这一领域在我国刚刚起步,“甚至没有成为一个专门学科,只在小范围内有应用场景,国内做这方面科研的人并不多。”幸运的是,张超遇到了导师邹维和韦韬。他们带领实验室取得了许多突破性成果,在国际上发表了多篇论文,可以说带动了国内网络安全领域的发展。在他们的指导下,博士期间张超不仅顺利度过跨院系的转折,还在数学和计算机中间发现了很多相通的地方,进一步体会到了在网络空间中自由探索的乐趣。

博士期间,张超选择的领域是软件安全漏洞分析,“研究电脑上找各种软件,分析它们怎样被黑客攻击,设计防护方案保护软件和系统。”如果用普通人熟悉的物理世界打比方,张超说,软件就像一栋房子,黑客就像ShHIbvjH1+TKr+wewr+NAw==小偷。房子的门、窗、锁可能有漏洞,小偷就利用这些漏洞进到房子里。在黑客的逻辑中,开发人员在开发软件时没有考虑到的一些情况,就是软件的漏洞。他们可以利用这些地方打开渠道,进入软件、控制软件。

对于用户而言,漏洞的存在有严峻的安全风险。漏洞层出不穷,一个小小的安全漏洞却足以搅动整个软件或互联网产业发生地震。“目前,漏洞从被初始发现到被预警和治理仍存在较大空档期,该空档期为黑客攻击提供了便利条件。系统软件漏洞挖掘是保障网络安全的重要一环。”张超说。如同陆海空天物理空间一样,网络空间也存在激烈的安全对抗。攻击者出于政治经济等目的,利用各种漏洞对目标进行入侵,获取个人隐私、技术成果、敏感信息等,破坏计算机、手机或者生产设备,甚至导致网络瘫痪。

“我做的第一个研究是软件防护,就是在软件开发出来后,先于黑客找到漏洞,打好补丁。”围绕怎样挖出软件漏洞、防范于未然的研究方向,张超持续深耕。十几年网络安全之路,他遇到了邹维、韦韬、Dawn Song等多位良师益友,也更加坚定了研究探索的决心。随着技术不断迭代,从人工为主到自动化再到智能化,他尝试用不同的技术路线更好地解决问题,但对于网络安全防御的初衷,一直没有改变。

如同医学讲“治未病”,互联网安全防御的关键也是找到未知漏洞,提前打好“补丁”。张超说,总结起来,这些年他们的漏洞挖掘研究基本分为三个阶段:一是做人工审核,通过人工进行源代码审计、逆向工程,基于经验规则来挖掘漏洞,工具只是辅助;二是自动查找,设计并研发自动分析工具,通过静态分析、符号执行和模型检验等手段,依据定制规则扫描漏洞;第三就是当下AI时代的智能漏洞挖掘,“这是我回国后从2017年开始探索的方向,通过知识与数据驱动、遗传进化算法等手段,智能引导漏洞挖掘方向,能够更好地应对层出不穷的新型漏洞以及大型复杂软件系统的应用场景。”

“白帽黑客”出征,在模拟中认识现实

在北京大学读博期间,张超接触到了“白帽黑客”。“白帽黑客”,是指检测网络安全漏洞,从而提升网络安全的技术人员。比起游走在灰色空间,代表着攻击的黑客,张超更倾向于当一名“白帽黑客”,充当防御和保护者的角色。

他加入了清华大学“蓝莲花”战队,并现场参加了2015~2017年DEFCON黑客攻防夺旗大赛CTF。“蓝莲花”战队是中国最早成立的学生“白帽黑客”团队,由清华大学段海新和诸葛建伟老师组建,战队名称“蓝莲花”取意许巍《蓝莲花》中的歌词“没有什么能够阻挡,你对自由的向往”。在创始者看来,这句话最能代表突破技术边界的极客精神。

2013年,“蓝莲花”战队进入DEFCON黑客大会CTF全球总决赛,成为大陆首支成功闯入DEFCON黑客大会CTF全球总决赛的队伍,一战成名。CTF是一种信息安全领域的技术挑战赛,通过网络安全手段来获取目标系统中隐藏的“f lag”,是网络安全理论与实践高度结合的一种比赛方式,需要战队拥有外围打点能力、钓鱼远控能力、域渗透能力、流量分析能力、漏洞挖掘能力、代码审计能力等多种能力。CTF比赛战队一般是以高校、科研单位、企业、信息安全从业者或社会团体组成。

2016年,张超随“蓝莲花”参加黑客攻防夺旗大赛DEFCON CTF,获得第二名。这也是我国参加该比赛以来的最佳成绩。“参加DEFCON CTF比赛的时候,我还在美国加州大学伯克利分校从事博士后研究,师从‘计算机安全教母’宋晓东(Dawn Song)教授。”张超回忆到。如今,张超担任“蓝莲花”战队教练,带着更多的学子在虚拟中理解现实。

也是这一年,张超又带队参加了另外一场特别的比赛——由美国国防部DARPA(国防高等研究计划署)举办的“计算机超级挑战赛”CGC(Cyber Grand Challenge),这是全球第一次利用机器人进行网络攻防的比赛。

针对软件和系统的攻防一直是网络战场的重要问题。顶级黑客和安全研究人员围绕攻击和防御技术展开了长期的博弈。当时高级的攻击和防御技术都极大地依赖于研究人员的个人能力,制约了网络空间整体安全性的提升。为了解决这一问题,美国国防部耗资5500万美元发起了CGC网络超级挑战赛,鼓励参赛队伍搭建自动化决策系统,实现全自动地分析软件漏洞、攻击利用漏洞及防御漏洞。最终,张超带领的CodeJitsu战队获得初赛防御第一名、决赛攻击第二名。张超强调“攻与防是密不可分的,研究攻击是为了更好地防御。”

“博士后研究是一段很有意思的经历。我逐渐开始独立开展研究工作,在美国学术界开阔了眼界,接触到了最前沿的研究团队和课题,也体验到了不一样的科研体制和做科研的方法,理解了网络安全对于用户、社会、国家真正重要的意义。”三年博士后研究,让张超充分意识到技术与实践必须高度融合,两者密不可分,这也让他将自己的研究目标确立为“顶天立地”,即在探索最前沿技术的同时,也积极探索技术的落地,探索让技术走出实验室并落地于实地场景的方案。

博士后研究经历以及CTF竞赛的经历也让他看到了中美的差距,中国的网络安全实践人才培养起步晚,自动攻防技术研究基本空白,前沿技术的落地应用寥寥无几。正视这些差距,他放弃美国的发展机会,克服家庭的困难,毅然回国加入清华大学开展教学科研工作。在清华大学优异的科研平台和网络研究院的大力支持下,他带领团队开展自动化和智能化的网络安全技术研究,赋能网络安全战队实战能力,追赶自动攻防的步伐,实现智能攻防的变道超车。他研究的漏洞挖掘方案发现数百个CVE安全漏洞、防御方案获得微软BlueHat竞赛特别提名奖、漏洞利用方案获得腾讯安全探索论坛突破奖等。

2018年,张超的名字出现在《麻省理工科技评论》组织评选的第二届中国区“35岁以下科技创新35人”榜单上,凭借其构建的创新型自动化防御体系获得“远见者”称号。获奖理由为“获奖人开发的技术不仅可更为主动实现对软件自身漏洞加以修复,同时还能自动验证程序的完整性,最重要的是通过学习攻击者,开发出更有针对性的防护措施,有效抵御当前流行的控制流劫持攻击。”而这,正是张超一直为之努力的。

将网络安全防御带向智能化

目前,在安全领域,一方面,AI技术正被逐渐地应用在异常检测、身份管理、安全运维等领域中,助力网络安全创新;另一方面,信息泄露、人脸识别系统被攻击等网络安全问题也接踵而至,AI也让网络安全问题成为隐忧。

张超的研究聚焦于软件和系统漏洞,这是网络空间当前面临的最主要的安全威胁之一。他提出的纵深防御体系,首先通过为程序植入完整性保护等安全检查机制实现“强身固体”,然后通过主动漏洞挖掘实现“防患于未然”,进而通过自动化漏洞评估实现“拒敌于国门之外”。他侧重向攻击者学习,以攻击者的思维主动发现未知的漏洞,对漏洞进行评估,实现自动化网络安全防御。“这种方案相比于传统的防御,具有更高的主动性,可以更为积极地防御未知威胁。”

在研究提高该防御体系的自动化水平时,张超积极探索新的思路。在融合传统的程序分析与测试技术之外,他积极探索新兴的机器学习与人工智能技术。通过创新性地应用人工智能技术,张超致力于研究实现机器自主探索发现潜在的安全问题、评估安全问题风险并构建快速的安全响应方案,进一步降低对安全分析人员的依赖,提升安全防御的自动化水平。

▼ 张超(左四)与学生在毕业典礼上

从2017年开始,张超团队就开始了AI赋能漏洞攻防的研究,是国内外最早开展此研究的团队之一。从CNN、RNN、GNN、强化学习、BERT到GPT,张超团队紧跟AI前沿技术,思考这些技术如何解决网络安全问题,做出了大量探索研究,并研发了国内外首个机器语言大模型MLM。不同于市面上主流的ChatGPT等通用大模型主要面向自然语言,MLM面向网络空间软件最终执行态——机器语言。MLM不依赖软件源代码或调试信息,解决了二进制代码信息缺失和语义理解难的根本性难题,填补二进制软件分析、检测、开发市场的空白。MLM实现了软件安全分析领域卡脖子软件的国产化替代和智能化超越,打破有关国家对于国内的技术封锁,可以在极端情况下保障我国关键基础设施、关键安全战略力量正常使用。

2023年8月,在CGC挑战赛十年后,美国国防部DARPA(国防高等研究计划署)再次发起了AIxCC挑战赛,鼓励研究团队利用AI技术来完成CGC同样的漏洞攻防任务。目前,在智能攻防方面,张超团队取得了一定的先发优势。

在快速发展的当下专注热爱,保持自我

科研、教学、成果转化……张超总是很忙。他几乎无缝衔接地出差,背着黑色双肩包四处奔忙,连陪伴孩子的时间都少之又少。但是,如果细看他的日程,会发现在繁忙的工作间隙,他都见缝插针地主动与年轻同行、青少年网络爱好者、高校学生进行交流,有时是科普,有时是座谈,有时只是挤出一点空余短暂地交流分享,这让他更忙了,他却乐此不疲。他希望以此激发年轻人投身研究的热情。

此外,他还担任中国青年科技工作者协会理事,有更多机会与各领域青年科研工作者进行交流。“这样的交流很重要,彼此启发,互相学习。在其他领域的需求中探索网络智能安全防御的应用场景和研究方向。”

张超感慨今非昔比,当年自己读书时,网络安全在国内还是相对冷门的学科,专业老师很少,学习资料也基本没有。而在当下这个信息爆炸的时代,学生们一方面在真正进入专业学习前就有机会全方位了解网络安全的相关知识。但另一方面,也可能眼花缭乱,反倒忽略了真正有价值的东西。

如何真正在极大丰富的信息中选择自己需要的,坚定自己的路,而后钻研下去,在张超看来,这是今天的学生、年轻专业研究者都必须明确的。“我和年轻老师交流,也经常建议他们专注。个人的精力是有限的,经常换方向、换问题,追着热点走,看上去更容易出成果,但可能哪一块也研究不深。多年深耕,积累成果,虽然在当下有诸多客观困难,但长远来看,这仍然是做科研比较值得推荐的方式。”

在年轻的时候保持专注和定力,可能意味着青年科技工作者要长时间忍受这个学科尚未受到重视,对于年轻人的发展,是很现实的问题。但张超总结自己走过的路,依然认为“最重要是坚持自己的热爱”。他说自己一直是兴趣驱动的人,不论读书、科研,还是工作,都没有功利心,“没有强迫自己要达到一个什么样的目标。”2013年,他博士研究生毕业时,国内甚至连像样的网络安全应用场景都不多,他看了很多行业,都不招聘这方面的岗位;而在为数不多有这一专业的高校中,招生也不太容易。“大家都还没有充分意识到这方面的重要。”但张超坚信网络安全对于未来意义非凡,埋头于此,孜孜不倦。

2015年,吴建平院士(中关村实验室主任、清华大学网络研究院院长)牵头论证下,国家增设“网络空间安全”一级学科。2016年,清华大学成为我国首批网络空间安全一级学科博士学位授权点。也是这一年底,张超从美国博士后出站回国,参与了这一学科的初建。“业界能力也从这时开始爆发。”2016年4月19日,习近平总书记在网络安全和信息化工作座谈会上发表重要讲话,谈及对我国网信事业的诸多关切,提出了“我们要掌握我国互联网发展主动权,保障互联网安全、国家安全”的具体要求。

此后,随着社会经济和网络技术迅猛发展,国内不断认识到网络安全研究的重要性,在政策规划、科研经费支持、学科布局和建设等方面不断给予重视,越来越多的科研工作者和学生持续加入,网络安全领域的科技创新进入快速发展的新时代。

随着人脸识别、自动驾驶等基于AI技术的应用逐渐落地,人们日常生活已经与AI技术如影随形。人工智能安全不仅成为业内高度关注的议题,也是国家网络安全能力体系建设不可或缺的关键一环。而张超依然怀着最初的热爱的心置身其中,不张扬,不狂热,坚持夯实基础,稳扎稳打,在此基础上探索前沿,开创网络安全防护新境界。“随着互联网应用的高速发展,网络攻击手段日趋复杂和隐蔽,网络攻防对抗已成为当今网络空间安全中最根本的议题,智能攻防已是大势所趋。如何利用新技术赋能网络安全,是长期要面对的重要课题。”

责任编辑 陈晰