基于知识图谱的我国人脸识别研究可视化分析

2021-04-10 03:47孙大勇耿英保
关键词:人脸发文人脸识别

张 扬, 孙大勇, 耿英保, 金 力

(安徽中医药大学 医药信息工程学院,安徽 合肥 230012)

0 引言

人脸识别是生物特征识别的一种,它利用计算机分析图像人脸信息,识别其对应的人物身份[1].由于该技术能够通过生物体本身的特征来区分个体,提高了生物体识别的精确度,因此得到广泛关注.如何有效准确地进行人脸识别,成为当今学术界研究的热点之一.

本文研究的资料均来源于中国知网1990~2019年发表的人脸识别文献,使用文献计量学的方法,同时利用CiteSpace(可视化分析软件),生成国内人脸识别研究知识图谱,揭示近三十年来人们在人脸识别研究领域的研究状况、当前的热点及研究前沿,为读者在这方面的进一步研究提供参考和帮助.

1 资料的来源和研究方法

1.1 资料来源

选择全球最大的中文数据库CNKI(中国学术文献网络出版总库)为数据来源采集数据,以保证研究数据的全面性和准确性,研究的期刊时间跨度设置为1990~2019年,检索方式选择专业检索,将“人脸识别”设为主题字段进行精确检索,选取SCI、EI、CSSCI、CSCD及北大核心作为期刊来源.共检索到有关期刊3 754篇,经人工筛选出和研究有关的期刊有效文献3 633篇.

1.2 研究方法

CiteSpace是一款可视化文献分析软件,利用CiteSpace可以寻找某一学科领域的研究进展和当前的研究前沿及其对应的知识基础[2].

本文首先从CNKI检索所需文献,按照Refworks格式进行保存,并对文献计量指标进行统计分析,然后借助CiteSpace绘制所需知识图谱,分析人脸识别研究现状、研究热点及前沿研究等.

2 国内人脸识别可视化分析

2.1 文献发表数量年度分布

发文数量是衡量一个研究领域发展态势的重要指标[3].整理检索到的3 633篇文献,绘制出发文数量年度分布图(图1),其中横坐标表示年份,纵坐标表示年度发文量.

由图1可知:国内有关人脸识别的学术文献最早出现于1992年,1992~1996年为人脸识别技术研究的起步阶段,此阶段核心期刊发文总体较少,但已成持续增长的均势.1997~2012年,人脸识别技术逐渐受到广泛关注,迎来发展热潮,发文量出现急增.从2013年以来核心期刊发文量较前期相对减少,但仍保持较高数量,这表明该领域的理论研究已进入一个相对稳定的时期,同时有资料表明,2014年以来我国和人脸识别技术有关的专利申请数量大幅增多,在2011年我国的申请量尚不足200件,但在2016年这一数字则变为近1 200件,并在2017年保持了增长的趋势[4],这表明该领域的研究已逐渐由基础研究转向应用阶段.

图1 发文数量年度分布图

2.2 基金分析

通过对检索的文献中基金资助数据分析,人脸识别研究得到了各类国家级和省部级基金项目资助,其中获得国家级基金资助的计有2 093篇,占所统计文献的57.6%,这说明在当前人工智能、物联网等前沿技术迅速发展的带动下,人脸识别研究领域也受到了社会的重视.具体的基金资助情况如表1所列.

表1 1990-2019年人脸识别研究文献基金分布表

2.3 作者分析

期刊核心作者的确定可以依据普赖斯定律,即期刊最高产作者的发文量来确定核心作者范围[5].将核心作者发文量用Mp表示,计算公式如下:

式中,Npmax代表发文量排名最高作者的发文数量,此处Npmax=56.

根据以上公式,核心作者的发文量界定为6篇或6篇以上,发文量前10的核心作者如表2所列.

表2 发文量前10的核心作者

利用CiteSpace可视化软件,将时间跨度设置为1990-2019年,时间片TimeSlicing设为1年,运行软件后得到作者共现网络图谱(图2).

图2 作者共现网络图

图2中每个圆点代表一位作者,圆点所占区域大小和作者发文数量成正比,各节点之间的连接线代表作者之间的合作关系.由图2可知,对于有关人脸识别领域的研究,从1990-2019年期间形成了若干以所示节点为中心的研究队伍,如南京理工大学的杨静宇、程永清、金忠,四川大学的周激流、张晔、刘靖,江南大学的王士同、李光早、袁少峰等学者队伍,这些队伍不断新旧交替融合,为有关人脸识别领域的研究奠定了基础,促进了该领域研究的持续发展.

2.4 机构分析

为了更好地对1990-2019年间各机构所发表的有关人脸识别研究文献进行统计研究,借助CiteSpace软件绘制了各研究机构合作网络知识图谱(图3),同样,图中圆点所占区域越大,表示该机构的发文量也越多,图中的连线表明各机构之间的相互合作关系.各机构发文统计情况如表3所列.

表3 机构发文表

由表3和图3可知,国内各大高等院校构成了人脸识别领域内的研究主体,其中以南京理工大学计算机科学与技术学院、江南大学物联网工程学院、重庆大学光电技术及系统教育部重点实验室以及扬州大学信息工程学院等院校为主要研究机构,在人脸识别研究领域发表了大量高水平的学术性文章,为该领域的研究发展作出了重大贡献.同时通过图3及发文分析,我们发现国内各个研究机构之间的横向合作比较松散,建议根据研究方向共同组建研发实体,便于从更深层次进行大范围的科研合作,以提升科研水平.

2.5 研究热点与前沿分析

2.5.1 研究热点

作为文献主旨的体现,关键词必不可少.CiteSpace中的关键词共现是基于文献内容,从文章中提取出关键词,并对文章中高频关键词进行分类,往往能够探寻到该领域的研究热点[6].图4是利用CiteSpace软件绘制的高频关键词共现图谱,通过该图可以探寻人脸识别研究领域当前的热点方向.

在图4中,每一个圆形节点代表一个关键词,节点越大表示关键词出现的频次越高,节点之间的连线表示关键词之间的共现系数,连线越多,表明关键词之间相互联系越紧密[7].选取1990~2019年间出现频次在60次以上的关键词,列出如下人脸识别研究热点高频关键词频次统计表(表4).

在对图4进行关键词分析的基础上,结合表4,发现目前国内人脸识别研究的核心工作主要偏重于基础理论研究,即对人脸识别相关算法的研究,其研究热点主要围绕以下两方面展开.

(1)人脸特征数据的采集与前期处理研究

如何对人脸检测定位,提取特征以建立用于特征识别的特征库,在提高人脸识别精准度方面起到关键作用,人脸数据的获取及相关数据集的构建,成为人脸识别研究的热点之一.在这方面,袁芳林等[8]利用结构光相移测量技术快速获取人脸三维面貌数据,同时结合二维人脸图像中的人脸特征识别手段,使计算机自动提取人脸图像的主要特征点,这种方法提取速度快、准确度高,对不同人脸模型都有较好的通用性.王大为等[9]针对三维人脸数据中可能存在的一些和人脸识别无关的信息及姿态变化、孔洞等干扰因素,通过切割、数据规整、平滑和姿态矫正等数据预处理方法加以处理,从而弱化噪声和冗余信息的影响,提高定位精度以节省搜索时间.在人脸在被物体遮挡的情况下,如何快速、准确地检测特征脸的位置,杨帆等[10]提出一种遮挡人脸特征点定位算法,此方法首先检测人面部所提取特征点遮掩状态,然后根据所选特征点被遮掩的概率,自动调整其纹理特征所占比重,以减少面部遮挡后对特征的影响,提高特征脸定位的准确性.人脸的检测定位、特征提取是人脸识别研究的两个关键问题,对高效的人脸识别有至关重要的作用,学者们从不同角度提出了各具特色的算法,随着计算机性能的提高、网络及人工智能的发展,相关研究将会进一步发展.

表4 高频关键词频次统计表

(2)人脸识别方法研究

在高效提取人脸生物特征的基础上,如何对人脸进行识别比对,成为学者们关注的另一热点.其中何元烈等[11]针对视频中动态人脸识别效果差的问题,提出基于深度学习的动态人脸识别方法.用预先训练好的模型提取视频中每一帧人脸图像特征,并对其同时跟踪和识别,利用增强学习进一步提高识别效果,使用循环神经网络对一段视频进行识别.实验结果表明:此种方法识别准确性接近最好成绩且鲁棒性有了较大提升.

对于低分辨率人脸图像缺少有效信息而导致识别率较低的问题,欧阳宁等[12]提出一种结合哈尔小波与递归神经网络的低分辨率人脸识别方法,实验表明:即使在极低的分辨率条件下,其识别能力仍优于目前领先的超分辨率重建算法.胡静等[13]则针对存在光照、遮挡、噪声污染等情况下的人脸识别问题,提出一种基于低秩矩阵恢复的群稀疏表示人脸识别方法.将人脸图像由空域转换至对数域,并通过低秩矩阵恢复算法恢复每个子类训练样本和增强恢复数据的鉴别力等方法,以提高人脸识别率.在大规模人脸图像数据库建立的基础上,人脸的匹配识别技术也取得了很大进步,但在识别速度和精确度方面仍有待于进一步提升.

2.5.2 研究前沿

运用CiteSpace软件的突变检测(Burst Detection)算法,探测关键词词频的时间分布,将词频变化率高的关键词探测出来,从中可以辨识和追踪学科领域的研究动态和发展趋势[14].基于此目标,利用CiteSpace软件对采集的人脸识别研究文献中的高频关键词进行突变性探测,列出突变性较高的前10位关键词(表5),突变强度越高说明该研究主题越活跃,也是未来发展趋势和研究热点.

同时,为了更好地展现国内人脸识别文献中高频关键词在时间上的分布,按照时区分析法构建了高频关键词时区图谱(图5).

表5 关键词突变强度表

图5 人脸识别高频关键词时区图谱

通过对表4、表5和图5的综合分析,可以发现从20世纪90年代以来,关于人脸识别的技术更替经历了一代又一代变化,特别是2013年后,人工智能(关键词:三维人脸识别、卷积神经网络、深度学习等)等新技术的兴起,成为提升人脸识别准确度的关键.从表5和图5可以有效预测今后人脸识别领域的研究热点与前沿,主要将围绕以下几方面开展.

(1)基于深度学习的人脸识别技术研究

在人脸识别中,大训练数据集对于有效提升非受限环境下的人脸识别很重要.然而,经典方法难以处理大规模数据集的训练场景,因此需要重点研究基于深度学习的人脸识别技术,在此基础上建立多样化的人脸模型,才能实现快速与精准的人脸识别,而卷积神经网络正是深度学习方法在人脸识别上的典型应用.

(2)图像预处理研究

表5中的小波变换、稀疏表示、局部二值模式等,都是针对人脸图像进行采集与预处理的关键词,主要是为了降低实验数据的维度,提高图像的质量,提升实验数据处理的效率.随着人脸识别的应用领域越来越多,数据的来源也会越来越多,数据的预处理就显得尤为重要[15].建立系统的预处理模式,总体提升人脸识别的效率也将成为今后研究热点之一.

(3)复杂背景下人脸识别技术研究

由于人脸特征易受光照、姿势、表情等因素影响,并且会受复杂背景、眼镜、胡须等因素严重干扰,这些都增加了人脸识别的难度.对此,国内学者们从各个角度进行了探讨以提升人脸识别的效率,如对复杂背景下的人脸图像,采取包括基于肤色模型和OpenCV的综合方法进行人脸检测定位,并对图像重新保存处理以克服光照因素的干扰.为消除复杂背景对人脸识别不利因素的影响,采用二维主成分分析算法,对同一个人多幅不同表情的人脸图像进行采集和特征提取并归类;还要采用3D识别技术将人脸立体化,全面反映人脸的面部特征以解决复杂背景下的人脸识别问题,这些都在一定程度上提高了人脸的识别率,可以预测,随着人脸识别技术在社会上的广泛应用,提高各种复杂背景下人脸识别精准度也是目前的研究趋势之一.

3 结束语

本文利用可视化软件CiteSpace,对从中国知网CNKI获取的1990~2019年国内有关人脸识别文献,从研究机构、作者、关键词等计量指标进行了文献计量统计及知识图谱分析,得到了以下结论:国内人脸识别研究近年来不但升温,且正由理论研究迈向实用阶段,研究机构以高等院校为主,人脸识别研究的热点领域主要包括人脸特征数据的采集处理及人脸识别算法的研究;随着人工智能的来临,人脸识别研究的前沿热点集中在基于深度学习的人脸识别技术、人脸图像预处理技术以及复杂背景下人脸识别技术研究3个方面.本文由于只选取了该领域内的核心期刊作为数据来源,因此存在一定的局限性,期望本文能为读者全面了解当前国内人脸识别领域的研究热点和发展趋势提供一定的帮助.

猜你喜欢
人脸发文人脸识别
人脸识别 等
有特点的人脸
一起学画人脸
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
揭开人脸识别的神秘面纱
人脸识别技术的基本原理与应用
三国漫——人脸解锁
人脸识别在高校安全防范中的应用
长得象人脸的十种动物