张 愉,童敏明,尚 丽
1.苏州市职业大学 电子信息工程学院,江苏 苏州 215104
2.中国矿业大学 信电学院,江苏 徐州 221008
特征维数和分类器参数统一优化选择的掌纹识别
张 愉1,童敏明2,尚 丽1
1.苏州市职业大学 电子信息工程学院,江苏 苏州 215104
2.中国矿业大学 信电学院,江苏 徐州 221008
掌纹具有易采集、识别区域大、可靠性和精度高等优点,在自动门卫系统、身份识别系统、公共场所监控系统等领域具有广泛的应用前景,因此掌纹识别成为生物识别领域中的研究热点[1]。
针对掌纹识别问题,学者们进行了大量研究,取得了不错的进展,涌现了许多掌纹识别模型,但仍然有许多难题没有得到解决。掌纹识别包括掌纹特征提取和分类器设计等两个关键问题[2]。当前特征提取方法主要有:统计特征、变换域特征、子空间特征等[3]。结构信息特征对相近或相似的掌纹鉴别力不够强[4];变换域特征忽略了掌纹图像丰富的纹理信息,易受光照影响[5];子空间特征提取方法包括Fisher判别(FDA)、主分分分析(PCA)等[6-7],其中PCA具有描述性强、易实现和可分性好等特点,成为最为经典和广泛实用的掌纹特征提取方法。由于特征维数不同,掌纹识别率则不同,掌纹特征维数具体为多少才能既有利于掌纹识别性能,又能提高掌纹识别速度,是PCA在提取特征过程中需要解决的难题[8]。当前掌纹分类器采用距离法、K近邻法、神经网络和机器学习算法[9-10]。支持向量机(SVM)在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,因此,本研究采用SVM用于掌纹分类器构建。基于SVM的掌纹分类器性能与参数选取密切相关,当前主要采用遗传算法、蛙跳算法、模拟退火算法、粒子群算法对SVM参数进行优化[11]。由于掌纹特征维数不同,最佳识别性能的SVM参数肯定不同,因此掌纹特征维数与SVM参数相互关联,互相影响,共同作用于掌纹识别结果,然而当前两者却常分开、单独优化,完全割裂了两者间的内在联系,出现掌纹特征选择与分类器不匹配问题,难以建立整体性能最优的掌纹识别模型。
针对掌纹识别过程特征维数和分类器参数单独、分开优化选择存在的不足,提了一种特征维数和分类器参数统一优化的掌纹识别模型(Features-Classifier),并通过仿真实验验证该模型的有效性。
2.1 PCA降维
主成分分析(PCA),也叫K-L变换,其目的是在数据空间中找到一组向量以尽可能地解释数据的方差,通过一个特殊的向量矩阵,将数据从原来的高维空间投影到一个低维的向量空间中,降维后保存了数据的主要信息,从而降低向量维数的目的[12]。
设训练集共有N幅掌纹的特征图像,每一幅特征图像的大小为w×h。PCA降维处理步骤为:
(1)将每幅特征图像的像素按列从左到右依次取出,最后转换成一个个 r维的列向量:x1,x2,…,xi,…,xN,r=w×h,xi代表第i个掌纹的特征图像展开以后得到的列向量形式的训练样本。
(2)计算所有训练样本的平均值向量:
(3)每个训练样本都减去上述均值:
(4)计算协方差矩阵:
(5)计算协方差矩阵C的特征向量和特征值,取出最大的k个(k远远小于掌纹ROI图像对应列向量的维数 r)特征值对应的特征向量:u1,u2,…,ui,…,uk,1≤i≤k,及对应的特征值:λ1,λ2,…,λi,…,λk。
(6)对特征向量ui进行归一化处理,得到正交归一化的特征向量wi。
式中,‖·‖表示在特征空间中的欧氏距离,W=[w1,w2,…,wk]即为代表这些掌纹ROI图像的特征子空间的基。
当输入待识别掌纹特征xs时,进行降维的步骤为:
(1)将待识别掌纹减去平均值向量。
(2)将Φs投影到训练得到的特征子空间,则待测掌纹特征降维输出为Ys。
对PCA降维过程进行分析可知,特征空间基向量的维数大小k值选取是PCA变换中的一个关键环节,其值的优劣影响掌纹识别结果。
2.2 SVM分类原理
假设样本集为 {xi,yi},i=1,2,…,n,xi∈ Rd,d 是训练样本的维数,n是训练样本规模,yi∈{-1,+1}为类别标志,那么SVM使得对线性可分的样本集满足:
引入Lagrange乘子将上述最优分类平面问题转化为对偶问题,相应的约束条件为:
对αi求解下列函数的最大值:
式中,αi为Lagrange乘子。
若αi为最优解,那么有:
对于在线性不可分的情况下,为了减少泛化误差,引入非负的松弛变量ξi来对式(7)的条件进行放宽,约束条件变为:
引入错误惩罚分量,目标函数为:
求解上述问题后得到的最优分类函数为:
式中,C为惩罚参数。
不同的核函数会生成不同形式的SVM[13],由于径向基核函数(RBF)只需确定一个参数(即核函数宽度参数σ),有利于参数优化,因此,本研究选择RBF核函数构造SVM。
根据SVM分类原理可知,参数C和σ的取值影响基于SVM的掌纹图像分类结果,要获得最优掌纹识别效果,首先要获得最优C、σ值。
3.1 特征维数和分类器参数统一选择数学模型
在掌纹识别过程中,由于PCA特征空间基向量的维数大小选择和SVM参数选择的目的都是提高掌纹识别率,尽可能使得掌纹识别率最大化。为了挖掘掌纹特征子集和分类器参数之间的联系,本研究对PCA特征空间基向量的维数大小和SVM参数进行统一优化选择,其数学模型为:
式中,k表示PCA特征空间基向量的维数大小;C、σ表示SVM参数;rate表示掌纹识别率。
3.2 粒子群优化算法
粒子群优化算法(PSO)通过粒子追随自己历史最优解Pbest和整个粒子群的历史最优解gbest找到最优解,PSO算法具有收敛速度快,没有许多参数的调节,受问题维数变化影响小等优点,容易实现。在每一次迭代中,粒子速度和位置的更新公式为:
式中,vid(i)和vid(i+1)分别为当前和更新后的粒子速度;xid(i)和xid(i+1)分别为当前和更新后的粒子位置;w为惯性权重;c1、c2表示加速因子;rand()表示随机函数。
3.3 特征和分类器参数的统一选择设计
3.3.1 粒子编码方式
粒子个体位置包括三部分,第一部分为PCA特征维数大小;第二部分为SVM的惩罚参数C;第三部分为SVM核函数宽度参数σ,具体如图1所示。
图1 粒子群的编码方式
3.3.2 适应度函数设计
掌纹特征提取和分类器参数选择目标是提高掌纹识别率,而适应度函数用于评价粒子优劣,并指引粒子的飞行方向,那么第i个粒子的适应度函数定义为:
式中,rate 表示第 i个粒子对应的参数 ki,Ci,σi的掌纹识别率。
3.3.3 多类掌纹分类器设计
SVM是针对2分类问题,然而掌纹图像包括多种类型,因此掌纹识别是一种多分类问题,必须通过组合策略构建多类掌纹分类器,本研究采用有向无环图(DAG)将两分类的SVM组合在一起,构造多类掌纹分类器。假设共4类掌纹图像,那么多类掌纹分类器构建如图2所示。
图2 多类掌纹分类器的构建示意图
3.3.4 Features-Classifier的掌纹识别步骤
(1)采集掌纹图像,并对其进行预处理,如直方图均衡和能量归一化处理等消除掌纹图像中的噪声信息。
(2)设置SVM参数C、σ、PCA特征空间基向量的维数大小k的取值范围。
(3)初始化粒子群。采用随机方式产生m个粒子,组成初始粒子群,每一个粒子由k、C、σ组成。
(4)将粒子进行反编码,PCA根据k值选择掌纹特征向量,根据C、σ训练SVM,并根据式(17)计算粒子的适应度值。
(5)更新当前粒子的最优位置Pbest和粒子群的最优位置gbest。
(6)根据式(15)和(16)对粒子的速度和位置进行更新,并调整惯性权重。
(7)如果连续5代最优粒子适应度值间差的绝对值没有超过0.001,太大变化,则停止优化,表示获得最优的 k、C、σ ;否则转至步骤(4),继续优化。
(8)对于未知掌纹图像,PCA根据最优k值提取特征,并用C、σ测试SVM,得到最优掌纹识别结果。
4.1 数据集
为了验证Features-Classifier掌纹识别模型的有效性,采用香港理工大学的Po1yU掌纹数据库作为仿真对象。Po1yU的掌纹图像在不同的光照条件下、采用不同设备采集的,共包括100个人的600幅掌纹图像,每人6幅,其中前3幅图像是第一次采集的,另外3幅图像是第二次采集的,两次采集的平均时间间隔为两个月,图像的大小为384像素×284像素,256灰度级,如图3所示[14]。一个人的6幅掌纹图像如图3所示。仿真的计算机配置为:CPU为Intel Core i5 3350p+3.1 GHz、RAM 2 GB,在Windows XP下的Matlab 2012进行编程实现算法。
图3 Po1yU图像库的掌纹图像
4.2 掌纹图像的预处理
选择每人的前4幅图像共400幅图像作为训练集,其余200幅图像作为测试集。首先利用文献[15]中的方法对掌纹图像进行预处理。经过预见处理后,每个掌纹块具有相同大小,基本上消除了掌纹的偏移和旋转,得到一个128像素×128像素的区域作为掌纹感兴趣区域(ROI)具体如图4所示。
图4 截取的掌纹ROI
然后对掌纹ROI每隔8行进行行抽样,每隔8列进行列抽样,抽样后掌纹图像大小为16像素×16像素,转换成一维向量为1×256维,用PCA进行特征提取。
4.3 SVM参数和特征维数对掌纹识别率的影响
为了分析SVM参数、PCA特征空间基向量的维数对掌纹识别率的影响,采用手动的方式调整SVM参数并记录结果:固定核参数C=100,σ=1.25,PCA特征空间基向量的维数、掌纹类别数与掌纹识别率的关系如图5所示。从图5可知,不同类别的掌纹图像,对应的最佳识别性能的PCA特征空间基向量维数不同,例如:当分类的掌纹图像类别数是20,PCA特征空间基向量的维数大小k=60,而类别数为80,PCA特征空间基向量的维数k=120,需分类的掌纹类别数少,需要的区分特征就少;需要分类的掌纹类别数越高,特征向量维数越多,而且识别时间也随着维数的增加而增加。
图5 不同特征维数的掌纹识别率(C=100,σ=l.25)
固定PCA特征空间基向量的维数k=100,掌纹类别数为100,SVM参数(C,σ)与掌纹识别率的关系如图6所示。从图6可知,参数C和σ发生变化时,掌纹识别率发生相应变化,这说明对特征维数和SVM参数的优化是必要的。
图6 不同的SVM参数所对应的掌纹识率(掌纹类别数为100,特征维数为100)
4.4 对比模型及评价标准
为了使Features-Classifier掌纹识别模型的结果具有可比性,采用PSO优化PCA的特征维数,固定SVM参数(C=50和σ=1.25)的掌纹识别模型(PCA-SVM);采用固定PCA的特征维数k=100,采用PSO算法优化SVM参数的掌纹识别模型(PSO-SVM);采用PSO优化PCA的特征维数,PSO优化SVM参数,与单独、分开进行的掌纹识别模型(PCA-PSO-SVM)进行对比实验。方法评价标准为掌纹识别率和平均识别时间。
4.5 结果分析
4.5.1 掌纹识别率比较
根据相应的特征维数和SVM参数,对于不同类的掌纹图像,PCA-SVM、PSO-SVM、PCA-PSO-SVM、Features-Classifier对测试集的掌纹识别结果见表1。从表1可知,相对于PCA-SVM,PSO-SVM,PCA-PSO-SVM,Features-Classifier的平均识别率分别提高了大约8.52%,8.52%和2.23%,对比结果表明,单独、分开选择特征维数或者分类器参数,割裂了两者的内在联系,很难保证特征维数或者分类器同时达到最优,Features-Classifier方法在统一的目标函数下,通过PSO算法对特征维数和SVM参数进行同时选择,可以使两者同时达到最优,挖掘掌纹特征子集和分类器参数的内在联系,更加准确地描述了掌纹类别信息,提高了掌纹识别率。
表1 不同方法的掌纹识别率比较
表2 不同方法的掌纹识别速度比较
4.5.2 识别速度比较
在Matlab 2012平台下,识别一幅掌纹所需CPU时间见表2。从表2可知,Features-Classifier方法的平均识别最短为0.176 s,较对比模型的识别速度要快,这表明采用Features-Classifier方法对特征维数和分类器参数进行统一选择,获得的最优PCA特征空间基向量维数大大减少,同时获得了最优的SVM参数C和σ,减少了SVM支持向量数,缩短了掌纹识别的时间,可以较好地满足掌纹识别的实时性要求。
针对掌纹识别过程特征维数和分类器参数优化问题,综合考虑PCA特征维数大小与SVM参数之间的内在联系,提出一种特征维数和分类器参数统一选择的掌纹识别模型。仿真结果表明,相对于单独、分开优化选择的掌纹识别模型,Features-Classifier模型不仅提高了掌纹识别率,同时提高了掌纹识别速度,较好地解决了掌纹识别过程特征维数和分类器参数的不匹配难题。
致谢感谢香港理工大学的Po1yU提供的掌纹数据库,使本研究得以顺利完成。
[1]吴介,裘正定.掌纹识别中的特征提取算法综述[J].北京电子科技学院学报,2005,13(2):86-92.
[2]袁国武,魏骁勇,徐丹.基于掌纹的身份鉴别[J].计算机辅助设计与图形学学报,2005,17(12):2590-2595.
[3]Zhang D,Guo Zhenhua,Lu Guangming,et al.An online system ofmulti-spectralpalmprintverification[J].IEEE Transactions on Instrumentation and Measurement,2010,59(2):480-490.
[4]周新虹,彭玉华,薛玉利,等.应用小波变换和支持向量机的掌纹识别[J].计算机工程与应用,2007,43(22):38-41.
[5]徐凤,何玉琳,章海军.一种基于傅里叶变换的双级匹配掌纹识别系统[J].光学仪器,2007,29(3):64-68.
[6]潘新,阮秋琦.基于二维局部保留映射的小样本掌纹识别[J].计算机工程与应用,2008,44(30):30-33.
[7]苑玮琦,黄静,桑海峰.小波分解与PCA方法的掌纹特征提取方法[J].计算机应用研究,2008,25(12):3671-3674.
[8]陶俊伟,姜威,田冲.一种改进的基于PCA和FLD的掌纹识别[J].计算机应用与软件,2008,25(1):204-206.
[9]王艳春,李静辉,夏颖.基于小波神经网络的掌纹识别[J].齐齐哈尔大学学报,2010,26(3):5-8.
[10]王恒,王蜂,粱荷岩.基于Contourlet变换与SVM的掌纹识别[J].计算机工程,2012,38(6):196-198.
[11]张建华,冀荣华,袁雪,等.基于径向基支持向量机的棉花虫害识别[J].农业机械学报,2011,42(8):178-183.
[12]郭金玉,苑玮琦.基于核主元分析和Fisher线性判别的掌纹识别[J].光电子·激光,2008,19(12):1698-1702.
[13]李明昊,李燕华,潘新,等.基于Gabor小波和支持向量机的掌纹识别算法的研究[J].内蒙古农业大学学报,2011,32(3):270-275.
[14]香港理工大学生物特征研究中心.Po1yU掌纹数据库[EB/OL].(1998-04-11).http://www.comp.polyu.edu.hk/~biometrics/.
[15]Lin C L,Chuang T C,Fan K C.Palmprint verification using hierarchical decomposition[J].Pattern Recognition,2005,38(4):2639-2652.
ZHANG Yu1,TONG Minming2,SHANG Li1
1.School of Electronic&Information Engineering,Suzhou Vocational University,Suzhou,Jiangsu 215104,China
2.School of Information&Electric Engineering,China University of Mining,Xuzhou,Jiangsu 221008,China
In order to enhance the palmprint recognition performance,it proposes a novel palmprint recognition model based on simultaneously selecting features and classifier parameters according to relation between the dimensions of the Principal Component Analysis(PCA)and parameters of Support Vector Machines(SVM).The palmprint image is preprocessed,and then the dimensions of PCA and parameters of SVM are taken as a particle,the optimal palmprint features and parameters of SVM are obtained simultaneously by information exchange and cooperation of particle swarms,the optimal palmprint recognition model is established based on the selected dimensions and parameters,the performance of model is tested by Po1yU palmprint data.The results show that the proposed model can obtain recognition rates of the palmprint 94%,the prediction results are significantly better than reference models which features and classifier parameters are selected separately.
palmprint recognition;support vector machine;principal component analysis;simultaneously selection;particle swarm optimization algorithm
为了进一步提高掌纹识别系统性能,充分利用主成分分析特征维数和支持向量机参数之间的联系,提出了一种特征维数和分类器参数统一选择的掌纹识别模型(Features-Classifier)。对掌纹图像进行预处理,将主成分分析图像特征维数和支持向量机参数作为一个粒子,在统一的目标函数下通过粒子之间的信息交流和相互协作,找到最优掌纹特征和分类器参数,根据最优掌纹特征和分类器参数建立掌纹图像识别模型,并采用Po1yU掌纹数据库对模型性能进行仿真实验。结果表明,Features-Classifier的掌纹平均识别率达到94%以上,识别结果明显优于独立、分开选择特征维数和分类器参数的掌纹识别模型。
掌纹识别;支持向量机;主成分分析;统一选择;粒子群优化算法
A
TP391
10.3778/j.issn.1002-8331.1307-0374
ZHANG Yu,TONG Minming,SHANG Li.Palmprint recognition based on simultaneously selecting features and classifier parameters.Computer Engineering and Applications,2014,50(23):167-171.
国家自然科学基金(No.60970058);江苏省自然科学基金(No.BK2009131);江苏省“青蓝工程”资助项目;2010苏州市职业大学创新团队基金资助项目(No.3100125)。
张愉(1979—),女,讲师,主要研究领域为人工神经网络、图像处理、模式识别和智能传感器研究;童敏明(1956—),男,博士,教授,博士生导师,主要研究领域为瓦斯及安全监测技术、传感器及检测技术;尚丽(1972—),女,博士,副教授,主要研究领域为人工神经网络、模式识别、数字图像处理研究。
2013-07-29
2013-09-26
1002-8331(2014)23-0167-05
CNKI网络优先出版:2013-12-19,http://www.cnki.net/kcms/doi/10.3778/j.issn.1002-8331.1307-0374.html