陆 玉,张 华
(1.阜阳职业技术学院人文社科系;2.阜阳职业技术学院实训中心,安徽阜阳236031)
基于改进的LBP面部识别智能算法
陆玉1,张华2
(1.阜阳职业技术学院人文社科系;2.阜阳职业技术学院实训中心,安徽阜阳236031)
摘要:在传统的LBP算法的基础上,提出了一种改进的自适应阈值算法用于人类面部识别.提取图像的每个子区域的LBP,根据子区域图像自身的情况设定阈值,利用该阈值提取纹理特征,同时融合信息熵对分解的特征层进行直方图加权,在FERET人脸数据库上进行的实验证明,本文提出的算法具有更高的鉴别能力和对噪声干扰的更强的鲁棒性,能够有效提高图像检索的准确率.
关键词:人脸识别;LBP;自适应
人脸识别技术是一个跨学科的计算机应用技术,其应用范围广泛,在门卫系统、身份识别等各种领域都具有巨大的应用前景.然而,对开发可批量应用的识别系统来说,仍有许多待解决问题,尤其是准确提取人脸纹理特征和研究高效、鲁棒的识别算法,原因主要有:(1)人脸表情丰富;(2)人脸成像的背景复杂;(3)人脸图像受光照、成像角度影响等[1].为此本文提出一种基于自适应阈值的LBP算法(ATLBP),其主要思想是通过实验计算出自适应于图像各个子区域的LBP阈值,降低算法复杂度,提高算法对图像局部特征提取的精度.
传统的LBP算法简单高效,具有良好的稳定性和识别率,但它笼统地对图像进行纹理特征的提取,会导致丢失部分重要纹理[2-3].事实上图像中不同子区域包含着不同的纹理细节,算法应图像子区域细节的复杂程度赋予其不同的权重,这样图像纹理的变化才能在特征提取的实验中反映出来.因此为降低数据量,保留关键特征,在本文实验中需要对人脸区域进行定位,用眉毛两侧、眼角、鼻翼及嘴角进行定位,依据定位策略进行图像分块,对每个子区域分别求出直方图特征,将它们串联起来作为最终的纹理特征.预处理结果见图1.
图1 人脸预处理结果
在人脸识别技术流程中,一个基本而重要的流程就是特征提取,如何提取出正确而具鲁棒性的特征是人脸识别成败的关键[4].在实验中,采取将图像划分为若干子区域之后,提取每个子区域的LBP统计直方图的方法,此种方法能反应局部特征、具有统计性质且适应性较好,提取时涉及到自适应选取阈值和加权融合的改进.实验算法流程图如图2所示:
图2 ATLBP算法流程图
2.1选取自适应阈值
ATLBP纹理模式首先需保留传统LBP的优势,阈值根据图像具体情况自适应选取,区别对待不同纹理风格的图像子区域,可以进一步提高识别精度.在选取时计算中心点像素周围相邻像素区域的均值,阈值取值为该均值的n%,通过实验调整n的最终取值.
以半径R=1,P=8为例,即考虑某像素点(设其灰度值为g)周围23个相邻像素区域的像素点g,i=0,1,…,7的情况,赋予8位的二进制数中每一位的符号函数s(x)一个权值2p.则:
则有:阈值T=Ave*n%.其中Ave为中心点像素周围相邻像素区域的均值,而值最终需要通过后续实验情况调整得到.为取到合适的,利用ATLBP特征在实验中考察不同值的算法识别情况,具体做法为观察当n值取为0.01~0.10(步长为0.01)中各值时算法识别情况的变化.在后续实验中发现,当为0.05时,人脸样本群中的平均识别率波动幅度较稳定.故改进算法中自适应阈值最终选择为T=Ave*5%.
2.2特征层信息熵加权融合
信息熵最早由Shannon在1948年提出并应用于信息理论中,能体现出图像中信息量的大小[5].图像不同的特征层所表达的信息各不相同,其纹理细节的丰富程度跟信息熵成正比关系.用每个图像子区域的信息熵来量化反映图像特征纹理值,即为特征层信息熵权重.
在进行多层特征融合时,按照各个图像子区域的特征贡献度度计算信息熵,进而确定图像各子区域的权值,计算过程如下:
(1)设为第级像素点出现的概率,则有:
其中,f(x,y)为特征层j上像素(x,y)的灰度值,L为特征层数量;a为真时,T(a)=1,其他情况T(a)=0.
(3)某子区域所对应的信息熵越大,则赋予它越大的权值,若图像被分为m个子块,计算第j个子区域的权重Wj:
2.3提取直方图向量
根据2.2所述,计算预处理环节中面部6个图像子区域(眉毛、眼睛、鼻子、嘴巴)的局部权值,同时对预处理后的图像子区域进行LBP变换,得到6种特征,并建立6种特征的融合直方图.本文采取了并行融合方式,即将此6种特征进行并联组成三维直方图,分别把图像全局纹理和子区域纹理的级联直方图进行加权(权值分别为w1~w6)融合以适应下一步的分类识别,此种融合方式可以减少直方图之间的相互影响且减少时间消耗[6].
2.4分类识别
为准确识别人脸,实验中将提取到的人脸特征向量与数据库中的特征向量相比较并找出最相近的向量,并对其进一步考核,比较特征值设定的阈值范围和计算结果,若两者相符则认为此向量是所要找的人脸.本文采用多通道最近邻分类器[7],即将在3.3中获取的6个特征通道分别用最简单的最近邻分类器进行分类,对分类结果进行融合时采取优势最为明显的那一类作为最佳识别结果.
为了测试ATLBP对噪声的鲁棒性,将传统的LBP算子与改进的ATLBP算子进行了效率上的比对验证.实验分别在FERET和YALE数据库上进行,算法验证平台是:Intel Core2 Duo CPU 3GHz,仿真软件是Matlab 7.0,对比结果见表1.
表1 FERET数据库上的识别率比较实验
由表1可知,ATLBP具有自适应阈值的优势,比传统的LBP算法更富于鲁棒性.
表2 YALE数据库上的抗噪性比较实验(%)
由表2可知,当噪声等级增大时,ATLBP的平均识别结果呈现出比较缓慢的下降趋势,相比传统的LBP方法,本算法抗噪性较强.
在LBP算法的基础上,提出了一种改进的自适应阈值算法用于人类面部识别.提取每个图像子区域的LBP时,根据子区域图像自身的情况设定阈值,利用该阈值提取纹理特征,改善了传统LBP算法存在的缺陷,增强了其对噪声的鲁棒性.在人脸数据库上进行的实验证明,本文算法对光照和噪声更加鲁棒,能够有效提高图像检索的准确率.
参考文献:
[1]张翠平,苏光大.人脸识别技术综述[J].中国图像图形学报,2000,5(11):7-16.
[2]金忠,胡钟山,杨静宇.基于BP神经网络的人脸识别方法[J].计算机研究与发展,1999,36(3):274-277.
[3]刘中华,史恒亮,张兰萍,等.基于多尺度局部二值模式的人脸识别[J].计算机科学,2009,36(11):293-295.
[4]张洪明,赵德斌,高文,等.基于肤色模型、神经网络和人脸结构模型的平面旋转人脸检测[J].计算机学报,2002,25(11):1250-1256.
[5]Ojala T,Pietikainen M,Harwood D.A comparative study of texture measures with classification based on feature distributions [J].Pattern Recognition,1996,29(1):51-59.
[6]火元莲.基于多通道Log-Gabor小波与(2D)2PCALDA的人脸识别方法[J].计算机应用,2010,30(11):2970-2973.
[7]Perez C A,Cament L A,Castillo L E.Local matching gabor entro-py weighted face recognition[C].Proc.IEEE Int.Conf.Analysis and Modeling of Face and Gesture,2011:179-184.
(责任编辑:欧恺)
中图分类号:TP391.4
文献标识码:A
文章编号:1007-5348(2015)02-0011-04
[收稿日期]2014-11-03
[基金项目]阜阳职业技术学院2013年教科研项目(2013JKYXM11).
[作者简介]陆玉(1982-),女,安徽涡阳人,阜阳职业技术学院人文社科系讲师;研究方向:模式识别.
Face Recognition Algorithm Based on Improved Intelligence LBP
LU Yu1,ZHANG Hua2
(1.Department of Humanities and Social Science;2.The Training Center,Fuyang Vocational And Technical College,Fuyang 236031,Anhui,China)
Abstract:Based on the traditional LBP algorithm,an improved adaptive threshold algorithm for human face recognition is proposed.Extraction of each sub region image LBP,it set the threshold according to the sub region of the image itself,using texture feature extraction with the threshold value,at the same time integrated fusion information entropy histogram weighted on the decomposition of the feature layer,and demonstrated on FERET face database for experiments.The paper proposed that algorithm has higher ability to identify the images and stronger robustness for noise interference which can effectively improve the accuracy of image retrieval.
Key words:face recognition;LBP;adaptive