张 亚,贾振军
(1.中国人民公安大学研究生院,北京 100038;2.中国人民公安大学侦查与刑事科学技术学院,北京 100038)
大数据时代,各种互联网智能设备的不断发展和普及[1],如何保护个人隐私不外泄逐渐成为当下的热门议题,与之相关的生物特征识别技术蓬勃兴起。生物特征识别技术是一种基于人脸、指纹、血管模式或击键、步态等特征的身份认证方法[2],相较于传统的密钥技术具有更高的安全性能,而其中的指静脉识别由于具有采集设备便携、无接触、抗攻击能力强、活体等其他生物特征所不具有的优势[3],成为相关学者的研究焦点,发展迅速。目前,指静脉识别作为第二代活体生物特征识别技术[4],最先在全球开始产业化应用,发展前景广阔,许多国家都致力于指静脉识别的相关研究,成果显著,文献颇丰。而文献是科研信息的载体,具有重要的参考价值,采用统计学的方法对文献信息进行统计分析,以数据来描述或揭示文献的数量特征和变化规律,可以帮助作者准确把握该领域的最新信息[5-7]。本文采用文献计量和可视化分析的方法对指静脉识别的研究现状、总体趋势、高产研究力量分布、主要研究内容、研究热点及方向进行探究,为相关学者提供参考,辅助科学研究。
采用web of science 核心合集数据库,选择关键词finger vein recognition,时间不限,搜索相关文献,文献最早可追溯至1999年,将搜索到的452篇文献的标题、作者、关键词、期刊、机构、出版年份等信息保存为纯文本格式,并导入到Excel 中进行储存,以便后期分析,其中英文文献447篇,中文3篇,西班牙语1篇,土耳其语1篇。
采用Excel 制表功能对文献年度发表量、发表形式、涉及学科相关数据绘制图表进行分析,采用陈超美教授开发的CiteSpace 软件对导入的txt 数据进行主要研究力量分析、主要研究内容、研究热点和方向的分析,把握指静脉识别领域发展新趋势和新动态。
图1统计结果显示,年度文献发表量呈现波浪式增长,其中,2016-2019年连年稳定增长,总占比50%,文献贡献比非常高,大胆预测,近年来文献发表量将会继续持续上升。
图1 文献发表走势图
表1统计结果显示,以学报论文形式发表的文献总计230篇,而以期刊论文形式发表的文献总计223篇,其余7篇为待出版论文和审查阶段论文,可见目前论文是文献的主要发表形式,选择学报比期刊的可能性略高。
表1 文献发表形式
图2统计结果显示,纳入文献涉及学科25种,其中电子电气工程、计算机科学人工智能、计算机科学理论方法、计算机科学信息系统、光学位居前列,占比非常高,可见目前涉及学科发展还不均衡,涉及范围还较窄,具有很大的发展空间。
图2 涉及学科类别
文献共涉及240个机构,总体呈“大分散、小集群”分布,如图3所示,分布密度为0.0052,可见机构间合作关系不密切,缺乏交流。其中引用次数排名最高的是中国山东大学,引用计数为52,第二个是中国民航大学,引用计数为36,第三个是韩国的东国大学,引用计数为20。其后的依次是引用计数为12的韩国全北国立大学,引用计数为11的中国天津大学科技学院、北京大学,引用计数为10的黑龙江大学、杭州师范大学,引用计数为9的哈尔滨工业大学。马来西亚大学、中国科学院大学、韩国木浦国立大学、挪威基约维克高等学院引用次数均为8,并列第10。位于前列的机构里,中国高校占比近62%,韩国占比近23%,总体来说亚洲地区的贡献比非常高。图4突变分析图谱显示,近年来,中国山东大学的研究备受瞩目,引用频次高。
图3 机构分布图谱
图4 机构引用频次突变分析
文献涉及作者385 个,中国的杨金锋、尹义龙、杨公平、杨璐、石一华学者,韩国东国大学的Kang Ryoung Park 学者,韩国北立大学的Dongsun Park 博士,奥地利萨尔兹堡大学的安德烈亚斯、乌尔教授,中国的袭肖明、杨居成学者分别位居前10。位于前列的作者均为团队协作,团队间合作关系密切,但团队外缺乏经验交流,如图5所示。
图5 主要作者分布
文献共涉及44个国家,分布密度为0.037,国家间合作关系较为密切。表2统计结果显示,中国的引用频次远超其他国家,稳居首位。印度、韩国、马来西亚、美国、奥地利、挪威、意大利、瑞士、阿尔及利亚引用频次相继位居其后。表3数据统计显示,在中介性层面,中国、美国、马来西亚、英国、意大利、瑞士、韩国、印度、挪威、阿尔及利亚中介性数值依次位居前列。与表2相比,可以发现排名发生了巨大的变化,还新增英国,可见引用频次高不代表该国家在指静脉识别发展过程中的中介性强。表4统计结果显示,在创新性层面,英国、中国、瑞士、马来西亚、美国、印度、意大利、韩国、挪威、突尼斯位居前列。
表2 国家引用频次
表3 中介性统计表
表4 Sigma值统计表
0.10 印度 5 0.09 意大利 2 0.06 韩国 5 0.05 挪威 5 0.05 突尼斯 1
图6关键词共现分析聚类结果显示,指静脉识别的主要研究内容为局部二值模式、指静脉融合、指静脉验证、指静脉图像、图像增强、线性判别分析、卷积神经网络、静脉识别、指静脉、手指几何识别,其中融合和卷积神经网络这两个主要研究内容的平均年份分别为2016和2017年。
图6 关键词聚类分析
图7关键词时区分析结果显示,关键字引用次数排名最高的指静脉识别自2004年开始出现一直引用到现在,引用次数排名第三的多模态生物特征首次提出在2006年,而关键字提取引用次数第二,在2008年首次提出。引用次数排名第四的局部二值模式首次出现在2011年,引用次数排名第五的图像增强首次提出在2008年,排名第六的融合首次提出在2010年,排名第七的验证首次提出在2004年,排名第八的系统首次提出在2014年,排名第九的分类首次提出在2009年,排名第10的卷积神经网络首次提出在2016年。
图7 关键词时区图
图8统计结果显示,近年来文献共引分析的主要内容为静脉纹理、结合各向异性扩散、使用深度神经网络、基于卷积神经网络的手指静脉识别、准确的手指静脉、二叉树模型、指关节、基于熵的欧氏距离、探索手背静脉模式、图像模糊增强;作者共引分析的主要研究内容为静脉、生物特征、多生物特征、局部编码、区间类型2模糊集、指关节、掌纹。
图8 2015-2020年文献共被引分析(左)、作者共被引分析的主要研究(右)
图9统计结果揭示了近年来主要研究内容的时间发展,可见局部编码、静脉识别算法、canny 边缘检测、指关节、二元模型决策级融合、卷积神经网络、全视角3D 手指静脉验证技术一直是当前研究的主要内容,而特定质量的手静脉识别系统自提出后大于2019年没有了热度,不再是研究重点内容。
图9 2015-2020年关键词聚类时间线图
综合上述分析,可见当下的研究热点为二元模型生物特征的手指静脉融合、深度学习与神经网络相结合、3D 手指静脉识别技术、图像增强技术。
当下,互联网技术发展迅速,保护信息安全刻不容缓[8],大胆预测,多模型生物特征的手指静脉融合技术、多视角下的手指静脉识别技术将是未来的研究重点。
文章采用文献计量和可视化相结合的方法,通过对1999-2020年全球指静脉识别相关文献的年度发表量、文献发表形式、涉及学科、重点机构、主要作者、主要国家、关键词聚类的分析,预测了未来的发表趋势,高产研究分布、主要的研究内容及发展脉络,通过对2015-2020年文献共引分析、作者共引分析、关键词聚类时间线的挖掘,多角度分析了当下的研究热点,预测了研究方向。此外,文章也存在一定的局限,2020年文献发表的时间尚短,对统计结果有一定程度的影响。