Gabor特征与深度信念网络结合的人脸识别方法*

2017-05-10 13:01张云伟支艳利
传感器与微系统 2017年5期
关键词:训练样本识别率小波

杨 瑞, 张云伟, 苟 爽, 支艳利

(昆明理工大学 信息工程与自动化学院,云南 昆明 650504)

Gabor特征与深度信念网络结合的人脸识别方法*

杨 瑞, 张云伟, 苟 爽, 支艳利

(昆明理工大学 信息工程与自动化学院,云南 昆明 650504)

提出了一种基于Gabor特征和深度信念网络(DBN)的人脸识别方法,通过提取Gabor人脸图像的不同尺度图进行卷积融合,将融合后的特征图作为DBN的输入数据,训练多层来获得更加抽象的特征表达,整个训练的过程中采用交差熵来微调DBN,模型的最顶层结合Softmax回归分类器对抽取后的特征进行分类。在AR人脸库测试的实验结果表明:将Gabor特征与DBN结合应用于人脸识别,其准确率可高达92.7%,与其他浅层学习模型相比,DBN学习了数据的高层特征的同时还降低了特征维数,提高了分类器的分类精度,最终有效改善了人脸识别率。

Gabor特征; 深度学习; 受限玻尔兹曼机; 深度信念网络; Softmax回归分类器

0 引 言

人脸识别是模式识别和计算机视觉领域的研究热点,作为一种重要生物识别技术,在信息安全领域有着很好的应用前景。

近年来,基于局部的人脸特征提取研究成果主要包括局部二值模式(local binary pattern,LBP)[1]、Gabor小波[2]以及方向梯度直方图(histogram of oriented gradient,HOG)[3]方法等。Gabor小波对位置误差、光线等因素具有强的鲁棒性,可提供良好的方向选择性和尺度选择性,可以很好地描述图像的纹理信息,这些优点使其成为目前最使其主流的人脸特征提取方法。文献[4] 有效地结合了Gabor小波的特征抽取能力和支持向量机(SVM)的分类能力进行人脸识别;文献[5]采用Gabor小波与改进的BP神经网络,但BP神经网络容易陷入局部最优,使得人脸识别率并没有明显改善。这些学习方法都是浅层结构算法,其局限性在于有限样本和计算单元情况下对复杂函数的表示能力有限,针对复杂分类问题其泛化能力受到一定制约。

区别于传统的浅层学习,深度学习通过大数据来学习特征,逐层特征变换,能够刻画数据丰富的内在信息。文献[6]提出基于深度信念网络(deep belief network,DBN)的多通道人脸识别算法, 把局部人脸图像块与Gabor滤波器组卷积融合,通过受限玻兹曼机(RBM)进行数据拟合,提取图像本质特征,用降维后的特征向量训练DBN。文献[7]采用了目前最热的卷积神经网络(convolutional neural network,CNN)人脸识别方法,特征检测层训练数据进行学习, 特征映射层上神经元权值相等,使得网络可以并行学习,其布局更接近于实际的生物神经网络,权值共享降低了网络的复杂性,多维输入向量的图像可以直接输入网络,避免了特征提取和分类过程中数据重建的复杂度。

本文提出了一种基于Gabor特征和DBN的人脸识别方法,通过与浅层算法进行测试对比,实验结果表明了本文所提出算法的有效性。

1 基于Gabor的人脸特征提取

1.1 2D-Gabor小波变换

D.Gabor最早提出了Gabor小波变换, 其生物相关性以及计算特性,使Gabor小波被广泛应用于图像分析、模式识别等领域。2D-Gabor滤波器的表达式

(1)

式中 μ为Gabor核的方向;ν为Gabor的尺度;z(x,y)为图像坐标;σ为与小波频率带宽有关的常数;滤波器相应的中心频率为kμ,ν;kν=kmax/fν 为采样尺度;kmax为最大频率;f为频域中内核间隔因子;ν={0,1,2,…,n}为尺度标号;μ={0,1,2,…,m-1}为方向标号;滤波器的方向性由φμ=πμ/m体现出来。

1.2 Gabor人脸特征矢量的提取

对Gabor小波进行图像特征的提取,可以通过式(2)来进行描述,即图像与Gabor小波核的卷积,设输入图像对应的灰度值I(x,y),则输入图像I与Gabor小波核Ψμ,ν的卷积可以表示为

Ομ,ν(x,y)=I(x,y)*Ψμ,ν(x,y)

(2)

图1 人脸图像的Gabor特征

在实际应用时,可以根据检测对象的方向趋势,选择合适的方向参数进行滤波,本文选择4个方向尺度的人脸Gabor特征,取μ={0,2,4,6},φk=(0,π/4,π/2,3π/4), σ=1,Gabor滤波器的融合式

fi(x,y)=Οi(x,y)⊗I(x,y), i=0,1,2,3

(3)

式中 fi(x,y)为卷积后的特征图,将不同尺度下的卷积融合后特征图如图2所示。

图2 Gabor特征融合

2 DBN

2.1 DBN模型

DBN是一个概率生成模型,由一系列的限制RBM堆叠组成。RBM是由可视层和隐含层两层神经元构成的,每层含有若干个节点,层内节点无连接,不同层之间的节点依靠权值系数矩阵来连接,可见层和隐含层的单元都是二进制:ν∈{0,1}D和h∈{0,1}K,D和K分别为可见层和隐藏层的单元序号。ν和h的联合概率表示为

(4)

式中 Ζ为一个归一化常数,RBM为一种能量模型,Ε(ν,h)为一个能量方程表示为

(5)

式中 Wij为可视层节点νi与隐含层节点hj之间的连接权重值;ai,bj分别为隐藏层、可视层的偏置值。

在训练DBN用CD(contrastivedivergence)算法递归地训练每一层的RBM,构建完整的DBN。但是前一层的RBM的误差会逐渐往后层的RBM传递,且得不到修正, 本文采用交叉熵采样逼近最优结果来微调DBN。

2.2DBN的人脸图像分类

利用上述特征学习算法可以从像素层面自动学习到人脸数字图像的特征,但是DBN虽具有较强的无监督特征学习能力,但没有分类能力,采用Softmax回归对DBN学习到的特征进行分类并构建分类器。假设有标签样本集为(x′1,y′1),(x′2,y′2),…,(x′i,y′i),…,(x′m,y′m),1≤i≤m,Softmax回归的类标签属于y′i∈{0,1,…,k},这里k指分类类别数量,本文采用的DBN结构如图3所示,它由多个RBM相邻两层构成,首先逐层训练参数,初始化DBN。然后训练第一层RBM的权值系数矩阵W1及类别标签2 000,即多尺度表达一张人脸,通过最大似然估计训练出第一层RBM的隐藏层向量h1,将h1作为第二层的可视层输入数据,单独调整参数使得当前的RBM结构能量趋于平衡,递归地计算出每一层的隐藏层单元向量hi和权值系数矩阵Wi以及各类别标签,将DBN的输出层作为Softmax回归分类器的激活函数,最后一层输出层输出50个类别标签的概率。

图3 DBN结构

3 实验与结果分析

在AR人脸数据库包含120个人,每人14张不同姿态和表情,本实验选择50人,随机抽取每人8张图像作为训练样本,剩余作为测试样本,并进行裁剪到指定大小M×N,识别率取重复10次运行后所得的平均值。由图4所示实验结果可以看出:当图像像素过低或过高时,其他3种算法识别效果比较差,低分辨率图像可能本质信息缺失,但是本文算法不管是在低分辨率还是高分辨率上都取得了较好的效果。

图4 4种算法在AR人脸库识别率

为了得到训练样本个数对识别率的影响,在AR人脸库中选择50人,随机抽取每人7,8,9,10,11张图像作为训练样本,其余作为测试样本,裁剪图片为上述实验证实的最适合像素24×32,识别率取重复10次运行后所得的平均值。由图5可以看出,当训练样本不够充足时,各算法的识别率并不高,随着训练样本数的增加,多尺度特征以及特征融合使得识别率都有不同程度的提升,但是总体上本文算法识别率要高于其他几种算法,说明了DBN具有较强的学习能力,能够从高维的数据特征中抽取低维可区分的低维特征。

图5 AR人脸库上不同训练样本识别率

4 结 论

本文提出了一种基于Gabor特征和DBN的人脸识别方法,很好地利用了Gabor小波对位置误差、光线等因素较好的鲁棒性等优点,结合无监督学习算法DBN自动地学习融合后人脸图像特征,并使用Softmax回归分类器对学习的人脸特征进行分类。实验结果也充分表明了本文算法人脸识别准确率可以达到92.7 %,因此,理论与实验均表明DBN在人脸识别率上均高于浅层结构算法。但是深度学习算法也存在着缺点,对大规模的人脸样本训练时间相对较长。

[1]AhonenT,HadidA,PietikäinenM.Facerecognitionwithlocalbinarypatterns[J].LectureNotesinComputerScience,2004,3021:469-481.

[2]TrucVitomir.PrincipalGaborfiltersforfacerecognition[C]∥Proceedingsofthe3rdIEEEInternationalConferenceonBiome-trics:Theory,ApplicationsandSystems,IEEE,2009:113-118.

[3] 程广涛,陈 雪,郭照庄.基于HOG特征的行人视觉检测方法[J].传感器与微系统,2011,30(7):68-70.

[4] 刘江华,陈佳品,程君实.基于Gabor小波特征抽取和支持向量机的人脸识别[J].计算机工程与应用,2003,39(8):81-83.

[5] 朱忠江.基于Gabor特征和神经网络的人脸识别研究与实现[D].北京:北京建筑大学,2015.

[6] 柴瑞敏,曹振基.基于Gabor小波与深度信念网络的人脸识别方法[J].计算机应用,2014,34(9):2590-2594.

[7]ZhangY,ZhaoD,SunJ,etal.AdaptiveconvolutionalneuralnetworkandIt'sapplicationinfacerecognition[J].NeuralProces-singLetters,2016,43(2):389-399.

Face recognition algorithm based on Gabor feature and DBN*

YANG Rui, ZHANG Yun-wei, GOU Shuang, ZHI Yan-li

(School of Information Engineering and Automation,Kunming University of Science and Technology,Kunming 650504,China)

A method for face recognition based on the Gabor feature and deep belief network(DBN)is proposed.By extracting different scales image of Gabor face images for convolution fusion and fused feature image is used as input data of DBN.Many layers are trained in order to get more abstract representation.In whole training process,cross entropy method is adopted to fine-tune DBN.The Softmax regression classifier is used for classification which is implemented at the top layer.The experimental result in AR face database shows that when Gabor feature extract combining with DBN are applied to face recognition,its accuracy reaches 92.7 %.Comparing with other shallow-layer learning models,DBN not only studies the high-level features of the data,but also reduces dimension and improves the precision of the classifier,which finally improves face recognition rate.

Gabor feature; deep learning; restricted Boltzmann machine(RBM); deep belief network(DBN); softmax regression classifier

10.13873/J.1000—9787(2017)05—0068—03

2016—05—23

国家自然科学基金资助项目(51365019)

TP 391

A

1000—9787(2017)05—0068—03

杨 瑞(1990-),女,硕士研究生,研究方向为软件设计与开发。

张云伟(1972-),男,通讯作者,博士,教授,从事精密测控技术研究工作,E—mail:zhangyunwei72@qq.com。

猜你喜欢
训练样本识别率小波
构造Daubechies小波的一些注记
基于类图像处理与向量化的大数据脚本攻击智能检测
人工智能
基于MATLAB的小波降噪研究
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
提升高速公路MTC二次抓拍车牌识别率方案研究
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法