李明丽
百晓
人类具有很强的识别能力,从婴幼儿时期,我们就开始识别不同的声音、不同的事物、不同的场景等。这样的能力也可以在其他生物中被发现:猫可以知道回家的路,狗能够识别主人的脚印,蜜蜂会发现它要采蜜的花……而学习人类(或其他生物系统)在所处环境中发现、区别和找出特征从而标识出观察结果的本领就是模式识别。
以模式识别为代表的人工智能技术是21世纪最伟大的科技进展之一。在过去的几十年里,模式识别技术在文字识别、语音识别、遥感、医学诊断等方向的应用研究发展迅速。特别是近些年来,随着信息化技术和人工智能的不断普及,模式识别技术在生活中越来越多地被应用。同时,其广阔的发展前景,也吸引着越来越多的人投身其中,北京航空航天大学计算机学院教授百晓就是该领域的一位探索者。
2002年,他前往英国约克大学系统学习了模块识别的相关知识。之后,他回到国内,立足北京航空航天大学计算机学院这个研究平台,对模块识别技术的基础理论及应用持续进行了深入的研究,并取得了一系列创新成果。他与其导师提出了“基于图结构的图像高层结构信息的提取与表示”理论模型和框架;针对高光谱遥感数据,提出了解决遥感小目标分析的关键理论和技术;实现了探月巡视器“视觉里程”计算和“双目测距”功能。未来,立足于已经取得的科研成就,百晓及其团队将继续开拓创新、积极进取,致力于在模式识别领域开辟出更广阔的天地。
1958年,北京航空航天大学建立了计算机专业,经过20年的发展,又于1978年成立计算机科学与工程系(现已发展成为计算机学院),至今已走过60年的发展历程。百晓本科毕业于这所积淀深厚的学府。
百晓回忆道:“我们当时对计算机的理解还比较浅,大家普遍关注的一个问题是,你要做软件,还是做硬件。”直到他大学毕业后,前往英国攻读博士,他才真正了解到,原来计算机这门学科还可以分化出这么多专业。
在英国约克大学,百晓学了4年的模式识别,博士毕业后,他前往英国巴斯大学多媒体研究中心任研究科学家,又从事了3年的相关研究,积累了深厚的学术功底和丰富的科研经验。2009年,他学成归国,入驻北京航空航天大学。谈及落脚北京航空航天大学的原因,他表示:一是北京航空航天大学是他的母校,他对它有着非常深厚的感情;二是北京航空航天大学计算机学院经历60多年的艰苦奋斗,取得了一个又一个辉煌的业绩,为国家培养了一批又一批计算机专业人才,始终走在我国计算机高等教育与科学研究的前列。
“模式识别实际上是人工智能技术非常重要的一个基础学科”,回国后,百晓重点在基于图结构的数字媒体分析基础理论和关键技术方面展开了研究。在此之前,百晓和他的博士生导师Edwin Hancock教授合作,已经在图结构模式识别和结构化模式识别有过深入的研究,立足于这些研究经验,他在该项目中提出了一系列基于图结构的媒体数据表达和处理方法,完成了数字图像和视频等相关媒体数据中的高层结构信息建模,解决了媒体数据分析中的诸多关键问题。
具体来说,在“基于图结构的数字媒体分析基础理论和关键技术研究”项目中,百晓牵头从三个方面进行了理论创新:
一是基于图结构的图像高层结构信息的提取与表示。项目团队在图像和视频的分析过程中,提出了可以提取图像目标高层结构信息的理论并利用图理论对结构信息进行表示,在更好地提取图像和视频中稳定不变的特征的同时解决了不同图像表现形式下的目标分析中特征提取的问题。他们提出的基于高层结构信息的多阶特征表达方法提高了人脸图像分析效率,所提出的多源特征筛选与组合方法大幅度提高了图像和视频的分析性能。
二是基于图结构的特征融合与匹配。为更好地解决媒体处理中图像匹配、特征表示以及特征融合等问题,项目团队提出了基于结构迁移的稀疏表示方法,通过优化特征表示,提升了媒体数据分析效率;提出了特征增强理论,根据图像或视频目标的特点选择不同特征的表达和组合,在提高各种特征利用效率的同时减少了冗余信息的负面影响;首次提出了图映射理论,并利用此理论更好地解决了立体视觉以及三维建模中的关键问题。
三是基于图结构的目标检索与识别。该项目实现了基于图谱哈希的媒体数据检索新机制,提高了图像和视频检索以及网络数据检索的性能;提出了基于增量半监督的图像分析方法,减少了对标注数据的依赖,实现了可应用于海量媒体数据分析的检索系统;提出了基于结构模型的运动检测方法,解决了复杂背景下的视频分析与检索中随机特征选取问题,提高了效率。
在中国电子信息技术年会第七届全国优秀科技工作者表彰会上
项目成果在图像目标识别、图像检索、图像分类以及视频追踪等方面的相关应用取得了很好的效果,还应用在了媒体数据检索、遥感图像目标分析以及海量网络数据的分析和处理中。2013年,百晓以第一完成人荣获了中国电子学会自然科学奖一等奖。
在百晓的研究工作中,有一项不得不提的工作,即他实现了探月巡视器“视觉里程”计算和“双目测距”功能,在“探月工程”二期中被应用,并在探月巡视器上发挥了重要作用。
2004年,我国正式开展月球探测工程,并命名为“嫦娥工程”,分为“绕”“落”“回”3个阶段。2007年10月24日,我国第一颗月球探测卫星“嫦娥一号”成功发射,实现了月球探测卫星绕月飞行,通过遥感探测,获取月球表面三维影像,探测月球表面有用元素含量和物质类型,探测月壤特性,并在月球探测卫星奔月飞行过程中探测地月空间环境。2010年,“嫦娥二号”成功发射,拉开了探月工程二期工程的序幕。
探月工程二期携带探月巡视器进行月面巡视,但巡视器如何对周围复杂月面环境进行导航和避障,是巡视器成功开展工作的先决条件和难点之一。传统的地面导航设备,如GPS、雷达以及车轮定位等系统,在月球无法发挥作用。“在地球上看起来很好解决的事情,在月球上就会变得很难,比如在地球上,用车轮计算里程,但是月球上的土太松软了,车轮里程定位就会不准确;地球上,汽车可以用GPS,但是我们不能在月球上用,那样成本太高了,而激光雷达功耗又太高。”百晓介绍说。
相比之下,视觉系统具有体积重量小、功耗小的特点,因此是解决探月巡视器定位和避障的良好选择。探月巡视器拍摄的图像分辨率不高且拍摄间隔大,同时月球场景光线不足且相似度高,因此提取图像特征困难,对图像的匹配和分析也造成了困难,若采用传统方法在精度和效率上都很难达到相关要求。对此,百晓采取了区域特征结构化提取与匹配的方法,除了采用传统的视觉特征提取,还增加了结构化约束与验证的步骤,解决了场景相似度高可能造成的匹配误差大的问题,保证了随后的视觉测距和视觉里程计算中的精度要求。可以说,提高该系统定位和避障精度的关键就在于准确和高效的图像匹配算法,因此他利用图像匹配方面的优势为探月巡视器提供了一套性能优异的避障系统和视觉里程系统。
该工作得到了使用单位——探月工程项目指挥中心的高度评价,指挥中心在视觉里程应用证明中指出:“北京航空航天大学百晓老师研发的成果及提供的算法被探月工程二期所采纳并发挥重要作用,巡视器成功避开危险障碍区域并计算了里程,圆满完成了相关任务,为‘嫦娥三号’探测器月面着陆成功提供重要的技术保障”;在双目避障项目的应用证明中指出:“该算法成功避开了障碍区域,精准完成了里程计算……着陆时开机工作正常,性能稳定。同时申请人的工作还会继续应用于火星探索计划”。
2015年,随着人工智能的热潮来临,模式识别也成为业内的“香饽饽”。这个时候,百晓更加注重解决实际问题,他将模式识别的相关技术应用到多项重要领域,逐渐成长为一名优秀的国防专家。他说:“北京航空航天大学本身就是一所具有国防特色的大学,它与国家的需求密切相关,专门为国家的重大国防工程解决问题。那么在智能化高速发展的今天,国防事业更需要一些‘新鲜血液’加入进去。”
针对高光谱遥感数据,百晓提出了解决遥感小目标分析的关键理论和技术。相关工作获得了多项重要科研项目支持,在航天和国防领域取得了应用好评。除此之外,他率领团队前往西藏高寒地区,克服种种困难将智能化手段和技术应用到相关工作里。近几年,他先后入选多个重要领域专家。
实际上,百晓选择献身国防还有一个更深层的原因,他的爷爷是一名老红军,从老一辈那里,他传承到了浓厚的爱国报国精神。他说道:“我爷爷那一辈人是经历过战争的一代人,知道国防事业对一个国家的重要性。我们更应该明白科技对国防的意义,所以我们科研工作者应以服务国家利益为最高宗旨。”愿得此身常报国,百晓希望可以尽自己所能为中国的国防事业增添力量。
百晓的本科生导师是中国科学院院士怀进鹏教授。前往英国留学之前,怀进鹏教授曾对他说,博士生学的专业可能不一样,但都需要做好一件事,那就是在科研中发现问题并解决问题。多年来,这句教导对百晓有着深刻的影响,同时在科教工作中,他越来越能体会其中的深意,“发现问题、解决问题的水平实际上代表着一个科研工作者的能力,这在科研领域是非常关键的”。
这些年来,百晓除了将自己的所学所知应用于国防需求上,他还将自己的海外工作经验与国内需求相结合,成功组织了国际上的一些重要会议,他本人还担任了模式识别领域国际著名期刊Pattern Recognition副主编、Signal Processing副主编、Pattern Recognition Letter、IEEE JSTAR期刊客座编委以及Displays领域主编。
“北京航空航天大学的校训是‘德才兼备、知行合一’。德才兼备要求我们既要具备高尚的道德品质,又要具备扎实的专业才能;知行合一要求我们理论与实践相结合,既要有知识,还要能够解决实际问题。论文只是科研能力的一个方面,更重要的是,能够把科研成果真正应用到需求当中。”百晓说道。
无论是对自己的学生,还是对团队中的成员,百晓常常强调北京航空航天大学的校训。在博士生和硕士生的培养上,他要求学生从理论研究做起,但是理论和实践一定要结合,不但要具备扎实的理论基础,还要具备很强的动手能力。除此之外,他还要求团队成员和学生一定要有服务国家的意识。
“大学很重要的一个职能就是服务社会,而北京航空航天大学又是一个具有国防特色的大学,所以服务意识很重要。”百晓团队目前已有20人左右,该团队在与军工企业合作时,往往不以科研经费为目的,对他们来说更重要的是能够将成果更好地应用起来。他还常常告诉学生:“你们不要太在意利益,成就感来自你所做的贡献,你能解决实际问题,就非常值得骄傲。”
目前,百晓承担着本科生、硕士生和博士生的课程。他将国外的经验与国内的经验相结合来开展教学工作。他鼓励学生敢于质疑自己,敢于挑战权威,在科研工作上,为学生尽可能提供最好的环境和设备;在生活中,也尽力给予帮助,让他们没有后顾之忧。每年,百晓还会邀请十几个国际团队来校交流,为学生创造机会,与高水平的国际专家直接对话。
值得一提的是,百晓还鼓励博士生独立承担科研项目并且亲自配合学生完成一个完整的项目过程。他说:“他们早晚都要独立承担项目研究,如果在博士期间,他有这个能力,那就尽早让他适应,这对他们是非常有帮助的,我作为老师,全力配合就行。”
为师为研,孜孜不倦。在模式识别这个日新月异的领域中,百晓致力于实现更多创新,也致力于培育更多英才。