张亚,许敏敏,张智,刘洋,贾振军
1.中国人民公安大学 研究生院,北京 100038
2.中国人民公安大学 侦查学院,北京 100038
信息化时代,网络空间个人信息安全逐渐成为当下热门议题,生物特征识别技术应运而生。不同于传统的知识类密钥技术保护个人隐私,生物特征识别是利用人体本身存在的特征进行身份认证以达到保障个人信息安全的目的[1]。其中指静脉识别是一种采用近红外光照射手指获取静脉图像,提取静脉特征来进行个人身份认证的技术[2],因具有以下两方面的独特优势:一是只能活体识别,二是位于身体内部,于众多生物特征识别中脱颖而出。2 种特性使得指静脉难于伪造和复制,不易受外部因素影响,作为生物特征安全等级高[3]。我国开展指静脉识别相关研究起步晚,但发展迅速,在感兴趣区域(region of interest,ROI)定位分割、图像增强处理、特征提取和特征匹配等方面成果显著。为研究我国指静脉识别技术相关进展及现状,本文从文献计量和可视化分析角度对CNKI 数据库文献进行深入分析。因为文献是科研的精华所在,具有重要的研究价值[4-5],通过对各时段文献进行计量分析,揭示了我国指静脉识别技术发展的演变历程和研究热点;通过对所有时段文献的可视化分析,揭示了我国指静脉识别技术的主要研究内容、主要研究力量以及未来的研究方向,为读者提供有价值的参考。
本文统计文献来源于CNKI,搜索关键字“指静脉”并添加关键字识别,两者均为模糊,时间不限,进行高级搜索,搜索结果为386 篇,该数字涉及期刊论文、硕士论文、博士论文、国家标准、行业标准、科技成果和会议论文等文献类型,经过筛选后,剩余368 篇。采用CNKI 自带可视化分析工具绘制其发表年度趋势如图1 所示。
图1 不同年份关于指静脉识别文献数量
由图1 统计结果显示,2018 年发表文献48 篇,位居首位;文献发表量每年总体呈上升趋势,其中2004 年—2009 年期间静脉识别相关文献发表量增长缓慢,2010 年—2012 年期间增长迅速,呈现爆发式增长,2013 年—2018 年期间呈现缓慢增长的发展趋势,2018 年至今呈下滑态势,但是文献发表基数大,从图1 可以推测未来发表量会持续增加。
受1.1 节中文献发表呈波动式递增趋势的启发,为研究我国指静脉识别的发展历程和最新进展,将发表年度趋势图分成4 个阶段进行时间跨度研究,从文献类型、主题、学科和机构分布状况对各阶段统计结果进行全面对比,通过时间跨度观察我国指静脉识别相关研究的发展历程和最新研究动态。此外,又从关键字共现、作者共引和机构共引3 方面综合分析我国指静脉识别研究的主要内容、主要分布力量以及未来的研究趋势,为读者提供参考。本文采用Excel 保存统计数据,运用图表功能制作相应的数据图进行统计分析,采用CiteSpace 软件绘制文献相应图谱进行可视化分析。
指静脉识别文献在各类型文献分布情况如图2所示。图2 中期刊性文献和学位性论文占比91%以上,是指静脉识别文献发表的主要发表形式。这2 类文献偏向研究型,专业性强,多为从事相关课题、企业研发等专业人员发表,国家标准、行业标准、会议论文亦是少数人员才会接触,报纸、科技成果等反映该技术公众普及性的文献占比不到1%,可见目前关于指静脉识别相关的理论、技术和落地产品等受众人群规模小,市场发展空间大,前景广阔。
图2 指静脉识别文章在各类型文献分布情况
由图1 和图2 可知,2004 年—2009 年共发表指静脉识别相关文献34 篇,文献类型较少,分为期刊论文、研究论文、科技成果3 类;2010 年—2012 年期间总计发表相关指静脉识别文献64 篇,文献类型较多,包括期刊论文、研究论文、行业标准、会议论文和科技成果等5 大类;2013 年—2018 年是指静脉识别发展最为迅速的黄金时期,相关文献累计高达204 篇,占据总文献2/3 以上,文献来源广泛,除上述种类外,还新增国家标准和报纸类型;2018 年至今发表文献总计66 篇,主要为期刊论文、研究论文和会议论文3 大类。文献类型的逐年增加,表明指静脉识别的研究越来越深入,由理论研究逐渐深入到应用产品开发。
主题分布情况反映一定时期的研究导向,统计结果显示,2004 年—2009 年期间,主题主要围绕指静脉图像及其相关处理技术、特征提取及特征匹配相关算法,而研究应用、人员身份认证和指静脉融合(多模态、复合识别等)相关研究刚刚起步。这一阶段,单一模板识别的算法理论研究是主要方向,其具体分布情况如图3 所示。
图3 2004 年—2009 年主要主题分布
2010 年—2012 年期间指静脉图像相关处理技术及算法研究依旧是当下的主要内容,身份认证、指静脉融合(双模态识别、决策级融合及加权融合等)正逐渐成为研究热点,相对于单一模板识别,指静脉融合可以提高识别的抗攻击能力,安全性更高。特别需要注意的是,指静脉图像相关处理技术及算法开始从理论研究层面向应用层面过渡,相关识别系统开发研究正发展迅速(研究与实现、系统设计和应用系统),其主题具体分布状况如图4 所示。
图4 2010 年—2012 年主要主题分布
2013 年—2018 年期间手指静脉识别相关图像、特征算法依旧是研究热点,相关系统设计也稳居高位,但是指静脉融合技术开始迅速崛起(多模态、多生物特征等),除此之外,深度学习、神经网络等首次出现,开启了算法研究新纪元。传统的机器学习泛化性低,耗时长,而深度学习和神经网络在处理大规模数据方面具有显著优势,并且可以解决深层结构优化问题[6-7]。与此同时,与指静脉识别相关的产品也从理论研究成功应用到了现实生活中,具体主题分布如图5 所示。
图5 2013 年—2018 年主要主题分布
2019 年—2020 年是研究当下热点最佳参考阶段。与前3 个阶段相比,手指静脉图像、特征提取等相关算法研究一直是研究热点,稳居前列,而深度学习、神经网络、指静脉融合相关研究发展迅速,明显有赶超趋势,未来发展前景广阔,具体分布情况如图6 所示。随着互联网技术的深入发展,大数据环境下,对保障信息安全的要求越来越高,在接下来的几年里,深度学习、神经网络、指静脉融合将会是长期的研究焦点。
图6 2019 年—2020 年主要主题分布
由图7 统计结果显示,2004 年—2009 年期间,指静脉识别主要涉及计算机软件与应用、自动化技术这2 大学科,总占比85%;而在计算机硬件技术、无线电电子学、生物医学工程、安全工程与灾害防治和工业经济等学科占比不相上下,分布均衡。
图7 2004 年—2009 年指静脉识别研究学科分布
由图8 统计结果显示,2010 年—2012 年期间,计算机软件及计算机应用学科自占比达84%,并开始涉及公安、电信技术、互联网技术、初等教育、无线电子学、建筑科学与工程和金融等方面,其中公安学科和自动化学科占比均等。总体来说,其学科涉及较上一阶段更广泛。
图8 2010 年—2012 年指静脉识别研究学科分布
由图9 统计结果显示,2013 年—2018 年期间,学科分布呈现井喷式增长,涉及学科十分广泛。
图9 2013 年—2018 年指静脉识别研究学科分布
计算机软件及应用仍然占比最高;自动化技术位居其次,却仅占5%;工业经济安全与科学防治占比2%;其余涉及学科分布占比均匀,新增社会学及统计学、信息经济和邮政经济、新政学及国家行政管理、轻工业手工业、汽车工业和机械工业等学科,可见指静脉识别技术的相关研究已经具有了一定的规模。
由图10 统计结果显示,2019 年—2020 年期间,两大主要学科分别占比63%、15%,明显可见自动化技术占比上升,此外生物医学工程占比也增加,还新增医学与卫生学、电力工业、贸易经济和企业经济等学科。
图10 2019 年—2020 年指静脉识别研究学科分布
纵观图7—图10,指静脉识别技术所涉及的学科占比十分不均衡,学科分布主要涉及计算机软件及计算机应用,而其他学科涉及较少;此外,涉及学科种类呈逐年增加的演变趋势,表明指静脉识别潜在市场还很广阔,值得大家去深入探索。
由图11 统计结果显示,2004 年—2009 年,指静脉识别研究的主力军主要集中在东北三大高校和西南两大高校:吉林大学、哈尔滨工程大学、长春理工大学和重庆理工大学、西华大学,具有明显的地域集中性;高校研究是主要力量,企业等研究相比较少。
图11 2004 年—2009 年指静脉识别研究机构分布
由图12 统计结果显示,2010 年—2012 年,哈尔滨工程大学指静脉识别研究发文量位居首位,研究成果远超吉林大学、重庆理工大学。此外,机构分布不再是东北和西南两足鼎立格局,华北地区山东大学、清华大学、北京交通大学、北京大学等高校,以及华东地区南京邮电大学、深圳大学、江苏大学、中国民航大学等高校,也开始从事指静脉识别研究。如果以南北来比较的话,北方机构分布相较于南方多一些。与此同时,企业参与研究的量也有明显增加。
图12 2010 年—2012 年指静脉识别研究机构分布
由图13 统计结果显示,2013 年—2018 年期间,杭州电子科技大学、中国民航大学、山东大学这些后起研究者逐渐成为了指静脉识别研究的主力军,研究实力不相上下。各大区域高校范围也进一步扩大,新增华南理工大学、湖南大学等,直到2018 年,尚无西北地区高校开展此类研究。
图13 2013 年—2018 年指静脉识别研究机构分布
由图14 结果显示,2018 年—2020 年,中国民航大学、辽宁工程大学、山东大学指静脉识别研究发文量位居前列,这一时期各高校机构文献发表贡献比均衡,西北地区陕西科技大学也首次开展了指静脉识别相关研究。
图14 2019 年—2020 年指静脉识别研究机构分布
纵观图11—14,可以发现指静脉识别相关研究机构发展趋势:早期东北和西南地区各大高校对指静脉识别研究颇多,之后扩展至华东和华南、华中地区,西北地区研究最晚,地域性差异明显。此外,任何时间段,高校在相关研究上的奉献都远远超于企业等研究机构,是主要研究力量。
CiteSpace 软件处理知网下载的文献时,需要去除会议、报纸等文献类型,如果不去掉就会影响后期的出图和分析,不够严谨;而期刊论文和硕博士论文是分析重点,两者各有侧重点,硕博士论文更倾向于基础研究,期刊论文更接近于当前热点。经过筛选后,对353 篇文献进行分析。
文献共引分词共筛选出399 个关键词,如图15 所示。主要可分为手指静脉识别、指静脉识别、手指静脉、特征提取、图像分割、多模态生物特征识别、生物特征识别和单像素点额加权平均这10 类,如图16 所示。
图15 关键词共现分析
图16 关键词聚类分析
对关键词进行突变筛选时,由图17 统计结果可知,存在5 个关键词激增,分别为模式识别(始于2007 年)、生物特征识别(始于2012 年)、指静脉识别(始于2018 年)、深度学习(始于2018 年)和卷积神经网络(始于2018 年),由模式识别向指静脉识别转变,相关术语更加具体专业,而深度学习、卷积神经网络是近年来才开始的,是当下研究热点所在,也是长期的研究焦点。
图17 关键词突变分析
文献作者共有309 个,统计结果显示,杨金峰(引用频次11)、王俊科(引用频次11)、余成波(引用频次7)、马慧(引用频次6)、尹义龙(引用频次6)、沈雷(引用频次5)、孟宪静(引用频次5)位居前列;杨金锋(中心性10)、王俊科(中心性8)、余成波(中心性8)、尹义龙(中心性7)、管凤旭(中心性7)、袭肖明(中心性7)、沈雷(中心性6)、孟宪静(中心性6)位居前列,值得特别注意的是,位居前列的研究学者,团队内合作强度关系密切,文献影响力高,如图18 所示。沈雷文章是2017 年以来引用频次最高的,参考价值高,其主要研究方向为大规模数据下(融合、泛化人群)识别速度和识别率问题[8-10];管凤旭、袭肖明引用频次不高,但中心性位居前列,中心性是衡量测度节点在网络中重要性的一个指标,近年来引用频次最高的文献研究方向为融合识别问题[11-13],管凤旭相关文献是罕见的“睡美人”,自2012 年左右提出来后,一直处于0 被引状态,直到2018 年引用频次突增,研究方向也为融合识别[14-15]。可见指静脉融合技术提出早,但受当时条件限制,停滞不前,近年来深度学习、神经网络的出现为指静脉融合的发展提供了契机。
图18 作者合作强度分布
文献机构共引分析共产生157 个节点74 条连线,密度只有0.006,分布图谱非常分散,只有少部分机构有合作关系,如图19 所示。
图19 机构共引图谱
由表1 数据结果显示,哈尔滨工程大学自动化学院、中国民航大学天津市智能信号与图像处理重点实验室、杭州电子科技大学通信工程学院、山东大学计算机科学与技术学院、辽宁工程技术大学电子与信息工程学院文献引用频次位于前列。近年来,杭州电子科技大学通信工程学院引用频次高,参考价值高,沈雷即是该院学生。
表1 引用频次统计
综合上述分析可以看出,我国指静脉识别技术的发展具有地域性,分布不均衡;主要研究力量聚集在高校,各高校间合作强度不大;近年来提出的深度学习和卷积神经网络是当下的研究热点,并促进了指静脉融合技术的发展;指静脉融合技术研究起步早,但近年来才成为研究焦点,深度学习和卷积神经网络功不可没。目前,我国指静脉识别技术涉及学科较窄、潜在市场巨大,相关文献发表将会持续增长。通过本文研究大胆预测,指静脉大数据发展(深度学习、神经网络、多模态融合)以及相关科技产品开发将会是指静脉识别未来的主要研究方向。