唐婉冰,关 瑜,王子豪,李 琛
(北方工业大学计算机学院,北京 100041)
随着当今科学技术的发展,信息安全和公共安全等社会问题日益突出,访问人的身份识别成为保障信息安全和公共安全的重要手段。使用人体所固有的特征来进行身份鉴定的生物特征识别,由于其自身独特的优势吸引了大量研究者的兴趣。可用做身份识别的生物特征主要包括:视网膜、指纹、人脸、人耳、掌纹、步态、虹膜、手形、签名、语音和击键等。目前已有的生物特征识别系统对环境的要求较高,然而在实际应用中,常常需要实现对被监控个体的远距离非打扰识别。研究发现人耳具有特征稳定,不受化妆、表情、年龄变化等因素影响的特征,并且人耳数据可以方便地从视频或照片信息中获取,易实现远距离、非打扰式的识别使其吸引了越来越多专家及学者的关注。
目前常用的特征提取方法有主成分分析(PCA)、局部二值模式(LBP)和局部线性嵌入(LLE)等,这些方法均取得了一定的识别效果。考虑到PCA 在提取全局特征方面的优势及LBP 在提取局部纹理细节方面的优势,本文研究一种结合LBP 和PCA 的人耳特征提取方法,经过实验证明,该方法能够从人耳图像中提取出较好的用于识别的特征。
基于PCA 的特征提取是一种常用的基于协方差矩阵对信息进行处理、压缩及提取的有效方法[1]。其将人耳作为一个整体处理,通过求解训练样本散布矩阵的特征值问题,利用线性变换提取主元,以一组数量小于样本空间维数的正交基为特征空间,识别时将测试的人耳图像投影到此空间,得到一组投影系数,用于表达人耳。PCA 方法通过降低特征维数,使得特征表达更为紧凑,并且可使用人耳图像的原始灰度数据直接用来识别,降低计算强度。
对图像使用PCA 降维获取特征的步骤如下[2]:
1)假设训练集有n 幅人耳图像,每个图像样本大小为M×N,则训练样本矩阵X 为:
其中,向量Xi为由第i 个图像的每一列向量堆叠成一列的MN 维向量,即把矩阵向量化。
计算训练图片的平均耳Ψ:
并计算每幅人耳图像的差值耳di:
2)计算图像数据的协方差矩阵C:
其中差值耳矩阵A 为:
3)对协方差矩阵进行奇异值(SVD)分解得到图像的特征值λi和特征向量Vi,并找出前n 个最大特征值对应的特征向量ui:
则特征脸空间W 为:
4)将每一幅人耳图像的差值耳矢量投影到“特征耳”空间Ωi,即:
LBP 是一种用来描述图像局部纹理特征的算子,其基本思路是通过比较圆形邻域内的像素点与其邻域内像素灰度值的大小,并用二进制模式表示的比较结果来表述局部纹理特征。LBP 理论在描述纹理特征方面有显著的效果。图像的局部纹理T 的分布可假设认为是灰度级为P(P >0)的图像中所有像素的灰度联合分布密度。局部纹理T[3]可表示为:
其中,hc表示图像局部邻域中心像素点的灰度值,hp(p=0,...,p-1)是在半径为R(R >0)的圆形对称区域内p 个相等空间像素灰度值。
图1 为3 种不同的LBP 算子。
基本的LBP 算法是定义3 ×3 窗口的中心像素为阈值,将剩余的8 个像素的灰度值依次与阈值比较,大于中心点像素的,则标记为1,否则标记为0。最后将中心像素点周围的8 位二进制数转化为十进制数,即为此窗口的LBP 值。若中心像素值为ip周围的8 个像素,像素值依次为i1~i8,则LBP 值[4]为:
其中,(xc,yc)代表3 ×3 邻域的中心元素,它的像素值为ic,ip则代表邻域内其他像素的值。s(x)是符号函数,当x≥0 时,s(x)=1,否则为0。
算法过程如图2 所示。
图1 不同P,R 值对应的LBP 算子
图2 基本LBP 算子示意图
根据LBP 算子可实现不同人耳图像的LBP 编码图像[5],如图3 所示。
图3 人耳图像及其LBP 编码图像
基于LBP 和PCA 的人耳识别过程如图4[6]所示。
图4 基于LBP 和PCA 的人耳识别流程图
1)对人耳图像提取LBP 特征,得到LBP 特征矩阵,即图3 所示的LBP 编码图像。
2)将所有经过LBP 处理过的人耳图像按列提取,将这些特征从大到小排列,提取出前120 个特征值和对应的特征向量作为最终PCA 提取的特征矩阵。
3)将LBP 处理过的按列提取的图像矩阵分别与最终PCA 提取的特征矩阵相乘,得到最终用于识别的特征。
在识别阶段,将测试集图像做LBP 特征提取处理,并使用训练集中PCA 提取的特征矩阵降维,最后采用欧氏距离来计算测试集与训练集的相似度。
最小距离分类器是监督分类的方法之一,其基本思想是利用试验训练集生成一个可表示该类别的中心向量Uk(k=1,2,...,n;n 是类别数)。对于每个待分类的元素组X,计算其与Uk的距离,根据计算的距离,把X 归入与之距离最近的类。这里X=[x1,x2,...,xm,f],Uk=[uk1,uk2,...,ukm,f],其中f 表示类别,f 属于[f1,f2,,,fn]。
本文中最小距离分类器使用的是较为常见的欧氏距离(Euclidian Distance)。欧氏距离,也称为泛数,是一个通常采用的距离定义,可表示为在k 维空间中2 个点之间的真实距离。也常被用于度量向量间的距离:
采用欧氏距离的最小分类器由于不用计算属性的方差和协方差,所以分类速度较快,分类时间较短。
本文采用北京科技大学USTB 人耳图像库(3)作为实验对象,包含有79 个人的395 张人耳侧面图像,图像采集显示分辨率为768 ×576,正侧面光照恒定。并分别通过LBP、PCA、LBP+PCA 3 种方法对其进行比较验证。本实验的目的在于测试不同算法条件下对人耳识别率的影响并改进出最优的识别方法以便提高识别率。
图5 3 种算法在79 人训练集上的CMC 曲线(一对一)
图5 为一对一识别曲线,本次实验的人耳库为USTB79 人耳库,在识别过程中使用每个人的第5 张人耳图像作为训练集,第2 张作为测试集。
图6 3 种算法在79 人训练集上的CMC 曲线(一对多)
图6 为一对多的识别曲线,本次实验的人耳库为USTB79 人耳库,在识别过程中使用每个人的第5 张人耳图像作为训练集,第1 张及第2 张作为测试集。
由图5、图6 可得出各种算法识别结果的差别。无论是一对多还是一对一的识别过程中,基于局部二值模式的LBP 算法识别率最低,最高只能达到89%。而本文研究的PCA 与LBP 相结合的方法,得到的识别率最高可达到97%左右。在实际运用中基本以第一次识别为准,即rank1 的结果。通过对rank1 的比较可以看出,在一对多的识别中,运用单独LBP 或者单独PCA 的算法所得到的识别率均受到影响,比如LBP 的首次识别率下降至69%。而本文研究的新算法首次识别率相对稳定,在实际运用中会得到更好的效果。
本文研究了一种结合LBP 和PCA 的人耳识别方法,实验结果表明,相对于原始的LBP 和原始的PCA识别方法,结合LBP 和PCA 的人耳识别方法能有效降低计算复杂度,同时可以提高识别率,尤其是对于训练集个数较少的图像库,本文研究的方法与PCA和LBP 方法相比表现出明显的优势。
[1]穆志纯,袁立,曾慧.生物特征识别技术-人耳自动识别[M].北京:科学出版社,2012.
[2]李昆仑,王命延.基于PCA 和LBP 的人脸性别分类方法[J].电脑知识与技术(学术交流),2009,5(10):8023-8025.
[3]韦妍.基于改进LBP 的人脸表情识别方法[J].现代计算机,2011(14):24-27.
[4]齐永锋,张家树,火元莲.一种基于肤色与改进的LBP 的人脸检测方法[J].光电子·激光,2009(6):816-821.
[5]王志秦,董翠英,周浩淼.一种基于LBP 的人耳特征提取方法[J].唐山学院学报,2009,22(3):60-62.
[6]熊承义,李丹婷,笪邦友.基于LBP 和PCA 特征提取的人脸识别[J].中南民族大学学报(自然科学版),2011,30(2):75-79.
[7]张海军,穆志纯,危克.人耳识别技术研究进展综述[J].计算机工程与应用,2004,40(33):5-7.
[8]张海军,穆志纯,张克君,等.基于主元分析的人耳图像识别方法[J].北京工商大学学报(自然科学版),2005,23(6):28-30.
[9]袁立,穆志纯,曾慧.基于人脸和人耳的多模态特生物特征识别[J].北京科技大学学报,2007,29(S2):190-193.
[10]袁立,穆志纯,徐正光,等.基于人耳生物特征的身份识别[J].模式识别与人工智能,2005,18(3):310-315.
[11]王玮,黄非非,李见为,等.使用多尺度LBP 特征描述与识别人脸[J].光学精密工程,2008,16(4):696-705.
[12]王宪,张彦,慕鑫,等.基于改进的LBP 人脸识别算法[J].光电工程,2012,39(7):109-114.
[13]李一波,曹景亮,张海军.一种基于张量PCA 的人耳识别的改进方法[J].计算机工程与应用,2011,47(25):171-174.
[14]赵怀勋,徐锋,陈家勇.基于多尺度LBP 的人脸识别[J].计算机应用与软件,2012,29(1):257-259.
[15]封筠,穆志纯,毛晚堆.基于局部二值模式与滤波器融合的人耳识别[J].计算机工程与应用,2010,46(35):192-195.
[16]刘嘉敏,刘强,朱晟君.基于改进二维主成分分析及神经网络的人耳识别方法[J].计算机应用,2009,29(12):3357-3360.
[17]刘嘉敏,朱晟君.复杂背景下的人耳检测方法[J].光电工程,2009,36(3):140-145.
[18]黄金钰,张会林,闫日亮.LBP 直方图与PCA 的欧式距离的人脸识别[J].计算机系统应用,2012,21(6):202-204.