闫月影 郭海丽
摘 要 针对教学管理工作中身份识别的需求,探讨人脸识别系统在教学管理工作中的应用。本课题针对非受控人脸识别问题中各类干扰因素的影响,设计出一种特殊的卷积神经网络(CNN)进行人脸识别工作。该CNN模型具有多个隐藏层,可以同时提取人脸的局部特征和全局特征,从而极大地提高非受控状态下人脸识别的准确率。
关键词 人脸识别系统;教学管理;卷积神经网络;教学管理;深度学习
中图分类号:G642 文献标识码:B
文章编号:1671-489X(2018)22-0013-03
Abstract Aiming at the need of personal identification in teaching management, this paper discusses the application of face recognition system in teaching management. As for the various kinds of inter-ference factors in the uncontrolled face recognition, a special convo-lutional neural network (CNN) for face recognition is designed in this paper. This CNN model has a number of hidden layers, which can extract the local features and global features of the face at the same time, thus greatly improving the accuracy of face recognition in uncontrolled state.
Key words face recognition system; teaching management; convolu-tional neural network; education management; deep learning
1 选题背景及研究意义
生物特征识别技术是一种通过计算机系统,依据人体所固有的生理特征或行为特征来进行身份识别的技术。传统的生物特征识别技术主要有指纹识别、虹膜识别、DNA识别、静脉识别、步态识别等。由于这些生物特征识别技术存在各自的缺陷,限制了其应用。人脸识别技术由于其不易被个体察觉的特点,在和众多生物特征识别技术的角逐中最终胜出,被广泛地应用于安防监控、刷脸门禁考勤、远程身份认证、智能相册分类等诸多领域。
人脸识别在人类日常社会交往活动中起着至关重要的作用,它是人们在与别人交往过程中识别他人身份最直观的方式。因此,如果能够设计出一种系统,通过计算机根据采集到的人脸进行身份认证,那将是空前的突破。人脸识别技术是指根据输入人脸识别系统中的动态视频或静态图像进行分析和处理,提取出能够用于身份识别的人脸特征向量,最后通过与系统中预先存储好的人脸信息进行比对和匹配,实现人脸身份认证。
由于人脸识别具有友好性和非打扰性,使其成为近些年来的研究热点[1]。目前在大数据集、受控条件下(正面人脸、室内光照受控)的人脸识别研究已经取得很好的效果,最近IEEE T-PAMI专刊中介绍真实世界人脸识别的内容表明了这一点[2]。但是在非受控状态下采集到的人脸图像,往往包含各类复杂的大范围遮挡和大姿态变化等,因此,如何在非受控状态下提高人脸识别的准确率至关重要。
目前的非受控状态下的人脸识别主要是根据监视器、手机或摄像机等设备捕捉到的人脸图像进行的身份验证。由于在这种情况下,当事人并不知道自己的人脸信息正在被采集,人脸可以在任意角度或表情被拍摄到。目前的人脸识别系统鲁棒性较差,根本无法消除非受控状态下各种复杂干扰因素对人脸识别的影响。因此,要解决非受控状态下各种复杂干扰因素对人脸识别的影响,就需要设计出一种特殊结构的卷积神经网络,这种神经网络可以同时提取人脸的局部和全局特征,极大地提高人脸识别系统的鲁棒性。
随着高校教务管理工作信息化的发展,管理工作中对人员身份的准确识别变得至关重要。在学籍管理、考试管理等过程中,经常出現顶替别人的身份入学、替考等现象。为了很好地解决这些问题,需要设计出一种切实可行的身份识别方法。利用本文设计出的针对非受控场景下的人脸识别系统,可以把它应用到教务管理中的学籍管理、课堂考勤、考试监控等工作中,以此来增强教务管理的严格性、安全性,很好地避免学籍冒充、考生替考、课堂缺勤等情况的发生。
2 非受控状态下的人脸识别
在人脸识别过程中,首先输入一张有待进行身份确认的人脸图像,之后通过特征提取逐步减少特征向量的维度,再通过将提取好的特征向量与样本特征库中的模板进行匹配,最后输出身份验证结果。其中一对一的比较是人脸认证工作,一对多的比较则为人脸识别工作。所谓一对多的比较,就是将输入系统中的人脸图像特征与样本数据库中已给出分类信息的人脸特征进行比对,最后找到匹配度最高的一个,判断出该人脸的身份。
人脸识别根据人脸图像采集过程中的外界环境是否稳定,可以分为两大类,即受控状态与非受控状态。顾名思义,受控状态下的识别是指人脸在被识别的过程中的一些外界因素(如光照、姿态、表情等)是固定不变的,也就是每一个被识别的对象都满足相同的识别条件;而非受控状态下的识别则包含光照变化、姿态变化、面部表情等的影响。
显然,在诸如安防监控、刷脸门禁考勤、远程身份认证、智能相册分类等应用场合中,都是在非受控状态下对人脸的身份进行验证识别,这种技术的应用范围更加广泛。因此,本文主要研究非受控状态下的人脸识别系统的应用。
3 深度学习与卷积神经网络
深度学习 多伦多大学的G.E.Hinton等于2006年提出深度学习的概念,指基于输入的样本数据,通过多次训练得到一个包含多个隐藏层的深度网络结构的机器学习过程[3]。人工神经网络中神经元的权值随机进行初始化,这容易导致网络收敛到局部最小值。Hinton为了解决这一问题,提出使用无监督预训练方法优化网络权值的初值的方法,至此,深度学习步入机器学习的舞台。
顾名思义,深度学习是针对浅层学习而衍生出的又一新的概念。相对于浅层学习,深度模型中的非线性操作的层级数[4]更多。浅层学习里用到的人工神经网络虽然也被称作多层感知机,但其本质上仍然是只有一层隐藏层的浅层模型,无法同时提取人脸的全局特征和局部特征,从而限制了其在人脸识别技术中的应用范围。而深度学习恰巧能弥补浅层学习的这些缺点,通过学习一种深层非线性网络结构,实现复杂函数逼近、逐层传递信号,通过神经网络的自学习能力逐层提取特征,解决非受控场景下各种复杂干扰因素,提高人脸识别准确率。
全局和局部特征 人脸的全局特征用于粗略匹配,而局部特征则用于精细匹配。全局特征描述人脸的整体信息主要包括肤色、轮廓和面部器官的分布等。局部特征描述人脸的细节特征,比如面部奇异特征,包括伤疤、黑痣等。全局和局部特征进行集成,可以作为人脸识别的分类器。
本文为解决非受控状态下人脸识别中的各类复杂干扰因素的影响,设计出一种特殊结构的卷积神经网络。这种卷积神经网络可以同时提取局部和全局特征,解决非受控状态下的各种干扰,提高人脸识别系统的鲁棒性。
卷积神经网络 卷积神经网络与普通神经网络的区别在于它包含输入层、输出层和多个隐藏层,每一层由若干二维平面构成,而每个二维平面由众多独立的神经元组成。
图1是一个简单的卷积神经网络模型,首先将所有样本图片通过输入层中的三个滤波器进行卷积,接着将获得的三个特征映射图在C1层中进行像素求和、加权、加偏置,并将处理后的像素通过Sigmoid函数得到三个S2层的特征映射图。C1到S2是一个下采样的过程,方法主要有两种:最大值池化法或均值池化法。后面步骤与此雷同,同样是滤波、卷积,然后再下采样。最后将这些像素光棚化,排列成一条直线向量后输出。
如果要训练卷积神经网络,首先需要把样本图像转换成向量的形式,再輸入卷积神经网络中。若输入的图像像素为1000×1000,则输入神经网络中向量长度为106。如果神经网络中隐藏层之间为全连接的神经元,并且神经元的数目为106,则输入隐藏中的参数数量为1012。这样就会产生参数冗余现象,加大神经网络的训练难度。导致参数过多的原因就是神经元与像素点是全连接的,因此,设计出隐藏层神经元与图像局部连接的网络即可。
局部感知野恰巧能够解决这一问题,因其每个神经元只与局部信息相连接,只感受10×10的像素大小的图像,参数会减少到108。如此一来,能极大地简化训练过程。只要在更高层次将这些局部信息综合在一起,就能获得整张人脸图像的全局特征。
但是用局部感知野得到的参数还是太多,而权值共享能够非常精彩地解决这一问题。顾名思义,所谓的权值共享就是指同一层的神经元共享一些相同的参数。根据上述例子,每个神经元所连接的像素点为10×10,也即每个神经元有100个连接参数。如果相同的连接参数都被所有的图像共享,那么全部神经元的数量会锐减到100,能够很好地解决参数冗余现象。但这种方法存在一个极大的问题:这样提取到的特征会过少,导致神经网络的识别能力变差。不过也有相应的解决方法:增加滤波器的数量。
通过在卷积神经网络之中同时应用局部感知野以及参数共享,再增加多个滤波器,不但能够有效降低参数数量,还能逐层提取特征。在卷积进行过程中,各层得到的特征图的参数逐层减少,但数量逐步增加。最后,全部特征图在更高层组合成一个特征向量,输出卷积神经网络。顶层神经网络重新整合在底层神经网络提取到的局部特征后,就能得到全局特征。
文章中的卷积神经网络有诸多优点,包括网络结构简单、训练参数较少和鲁棒性强等。该卷积神经网络避免了传统算法中特征提取和特征重建的复杂度,在神经网络的训练过程中能同时进行模式分类和特征提取。
当然,本文中的卷积神经网络与其他人工神经网络最大的区别就是可以逐层提取特征,利用不同层次分别提取局部和全局特征,解决非受控状态下人脸识别中各种复杂干扰因素的影响,提高人脸识别系统的鲁棒性。
4 结语
通过对非受控状态下人脸识别中各类干扰因素的分析研究,本文设计出一种能够同时提取人脸的局部和全局特征的卷积神经网络。该卷积神经网络具有多个隐藏层,通过逐层自动学习特征的方式提取不同层次的特征,能够很好地消除非受控状态下人脸识别问题中各种复杂干扰的影响。在教务管理中完全可以将本文设计出的人脸识别系统投入应用,极大地提高教务管理中需要进行身份验证的各个环节中的准确性。
参考文献
[1]黄宏博,穆志纯.小训练样本的人脸识别研究[J].软件,2014(3):167-169.
[2]Hua G, Yang M H, Learned-Miller E, et al. Intro-duction to the special section on real-world face recognition[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,2011,33(10):1921-1924.
[3]Hinton G E, Salakhutdinov R R. Reducing the dimen-sionality of data with neural networks[J].Science,2006,313(5786):1527-1554.
[4]Duda R O, Hart P E, Stork D G. Pattern Recogni-tion[M].2nd ed. Wiley-Interscience,2000.