张 震,张英杰
(郑州大学电气工程学院,河南郑州450001)
基于支持向量机与Hamming距离的虹膜识别方法
张 震,张英杰
(郑州大学电气工程学院,河南郑州450001)
针对传统的虹膜识别方法侧重于特征提取这一现象,提出了一种侧重于模式匹配的识别算法,即基于支持向量机(Support Vector Machine,SVM)和Hamming距离的虹膜识别方法.该算法首先对采集到的虹膜图像进行预处理,准确定位出虹膜,并对其进行归一化处理;然后使用Log-Gabor滤波器提取虹膜纹理特征,在得到虹膜特征编码后,用SVM和Hamming距离方法进行模式匹配.在CASIA虹膜库上的实验结果表明:与经典的识别方法相比,该方法识别率达到了99.63%,错误接受率(FAR)和错误拒绝率(FRR)分别降到了0.02%和0.35%.
虹膜识别;支持向量机;Hamming距离;Log-Gabor滤波器
目前,虹膜识别方法主要可以分为3类:一是Daugman的相位编码方法,它主要利用2D Gabor滤波器的局部性和方向性对虹膜纹理进行分解和编码,该算法识别率较高,是目前虹膜识别商用系统的基础,但该算法的识别速度较慢,且易受外界环境影响,实际应用中对设备的要求较高[1];二是基于纹理分析方法,Wildes利用Gauss-Laplace在不同分辨率下分解虹膜图像,并将对应的图像进行相关比较,该算法较复杂、计算量较大、且实用性较差[2];三是Boles提出的基于小波变换过零点检测方法,该方法能有效地克服图像平移、旋转、缩放等问题,识别性能高,但该算法只能在小样本集中取得有限的结果,且对灰度值变化比较敏感[3].
因此,笔者提出了一种利用Log-Gabor滤波器和SVM的虹膜识别方法:首先利用Log-Gabor滤波器对虹膜图像进行特征编码,而后通过Hamm ing距离进行模式识别,对于未能正确识别或者识别错误的图像再次通过SVM进行二次识别,以提高系统的识别率.
一个完整的虹膜识别系统主要包括:虹膜图像的采集、预处理、特征提取、模式匹配4个过程[4],其系统框图如图1所示.
图1 虹膜识别系统框图Fig.1 Block diagram of iris recognition system
1.1 虹膜图像的采集
如何在不侵犯人体的情况下获取高质量的虹膜图像是虹膜识别系统的关键技术之一.由于虹膜面积小(一般直径在1 cm左右),易受光照影响及易被遮挡等因素的干扰,对虹膜图像的采集需要通过专用的设备来完成.鉴于虹膜图像采集的复杂性,笔者采用中科院自动化研究所提供的CASIA虹膜图像数据库作为实验样本.图2为虹膜库中所选取的部分虹膜图像.
图2 原始虹膜图像Fig.2 The original iris image
1.2 虹膜图像预处理
虹膜图像预处理一般主要包括虹膜定位、图像归一化和图像增强3个步骤.
1.2.1 虹膜定位
虹膜定位是指通过各种技术方法求出虹膜的内外边界参数,进而分割出虹膜区域.笔者采用了结合人眼特征和几何方法的虹膜定位方法:首先根据瞳孔内部的灰度特点,在瞳孔内确定一点;然后利用边缘检测模板,依据该点,分别在虹膜内外边界上找到各自不共线的3个边界点,这样就能得到两个直角三角形;根据几何原理,虹膜内外边界圆的直径就是这两个直角三角形的斜边,从而可以得到虹膜内外边界参数,并准确定位出虹膜[5].实验结果证明:该算法不仅简单,而且定位速度快、鲁棒性好、定位精度高.同时,该方法在一定程度上还能对图像质量较差的虹膜图像进行准确定位,是一种行之有效的虹膜定位算法.
图3 定位后的虹膜图像Fig.3 Iris image after location
1.2.2 图像归一化
图像归一化的目的是为了将环形的虹膜区域通过极坐标变换的方法映射到一个具有指定大小的矩形区域中,从而消除平移、缩放和旋转等对虹膜大小的影响[6].公式(1)为进行极坐标变换的映射公式.图4为图像归一化原理的示意图,其中归一化处理后的直角坐标系的横轴表示角度θ,纵轴表示半径r.
图4 图像归一化原理示意图Fig.4 Sketch map of image normalization
具体的映射公式为:
其中:r∈[0,1],θ∈[0,2π].
图5为通过极坐标变换后得到的归一化图像.
图5 归一化后的图像Fig.5 The image after normalization
1.2.3 图像增强
显然,归一化后的图像纹理依旧不清晰且对比度比较低,这将严重影响随后的特征提取和匹配过程,为此需要对图像进行增强处理.常用的图像增强技术主要有平滑滤波、图像锐化和直方图均衡化等.鉴于本文主要是为了突出虹膜纹理信息,因此,采用直方图均衡化显然能够更好地提高图像对比度.增强后的图像如图6所示.
图6 增强后的虹膜图像Fig.6 Iris image after enhancement
2.1 Log-Gabor滤波器
Log-Gabor滤波器最早是由Field提出的,它在线性频率尺度下的频率函数表达式为[7]
式中:f0代表滤波器的中心频率;β/f0为常数,用来保证滤波器的形状不变.
Log-Gabor滤波器除具备普通Gabor滤波器的优点外,还具备以下几个特点:一是Log-Gabor滤波器没有直流分量,致使它的带宽可以不受限制;二是Log-Gabor滤波器可以覆盖更大的频率范围;三是该传递函数在高频端有一个延长的尾巴,这在一定程度上弥补了普通Gabor滤波器过度表达低频分量而对高频分量表达不足的缺点.同时,由于人的视觉系统具有对数性质的非线性,显然,采用Log-Gabor滤波器可以更加真实反映虹膜纹理图像的频率响应[8].
2.2 特征提取算法
对虹膜的特征编码是通过将归一化的虹膜图像与一维的Log-Gabor小波卷积来实现的:将二维的归一化图像分解成一系列的一维信号,然后将这些一维信号分别与1D Log-Gabor小波进行卷积.由于归一化的虹膜图像的行向量具有最大的非相关性,因此,将二维的归一化虹膜图像的每一行看作一个一维信号.显然,每行的一维信号对应虹膜区域中的一个圆环.
通常,将已检测出的噪声区域的灰度值设为周围像素的平均值,这样可以避免噪声对滤波器输出的影响.按照Daugman的方法将滤波器的输出相位量化为四级,对每个相位值滤波器产生一个2 bit的数据,相位的量化输出记为一个灰度编码,当一个象限转换到另一个象限时,只有一个比特位改变.具体方法可描述为:每一个复数结果代表一个特征值,其实部和虚部分别用特征值的两个特征码表示,如果Re[x]≥0,则相应的特征码置1,否则置0;同理,如果Im[x]≥0,则相应的特征码也置为1,否则也置为0.相位编码示意图如图7所示.
图7 相位编码示意图Fig.7 Sketch map of phase en coding
图8为采用Log-Gabor滤波器提取虹膜的纹理特征的示意图.
图8 特征编码示意图Fig.8 Sketch map of feature code
3.1 支持向量机(SVM)
SVM是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力[9].由于实际应用的虹膜识别系统一般都是小样本系统,故很适合采用SVM来进行分类与识别.根据所处理数据的不同,可分别采用线性SVM和非线性SVM的方法来进行分类与识别.采用线性SVM可以将问题转换为一个二次优化问题,而采用非线性SVM的方法一般主要用来实现复杂数据的计算与匹配.由于虹膜纹理特征编码所组成数据较复杂,故采用非线性SVM的方法更合适.
数据通常以点积的形式出现在线性支持向量机的训练算法中.现在用非线性映射把输人空间映射到某一特征空间,记为:R→H.假设存在一种核函数K,满足:
则可以在不需要知道具体映射的情况下在特征空间中进行许多计算.
现在用核函数K代替线性SVM中的点积形式,对偶规划之后可变为
式中:{(x1,y1),(x2,y2),…,(xi,yj)}为训练样本;y∈{-1,1};αi表示Lagrange乘子.
非线性SVM最优超平面的决策函数为
式中:sgn表示符号函数;b为分类阈值.
SVM识别原理如图9所示.其中,x1,x2,…, xn为待识别的样本;K(xj,x)(j=1,2,…,s)为基于s个支持向量的核函数[10].
图9 SVM识别原理Fig.9 SVM recognition principle
3.2 Hamming距离
Hamm ing距离(HD)是最常用的匹配算法,它主要是利用特征编码相应位置上编码不同的数量同编码位数的比例作为两个特征模板之间的匹配程度,距离越小,匹配程度越高[11].
式中:⊕为异或操作符.此时,如果人为设置的阈值T0>HD,则可以判定这两个虹膜属于同一个人;如果阈值T0<HD,则可以判定虹膜不属于同一个人.
3.3 基于SVM和Hamming距离的模式匹配
虹膜特征匹配的具体算法如下:
(1)输人虹膜图像的特征编码;
(2)通过反复实验,确定最优的核函数及相应的核参数,同时对特征编码进行规范化处理,以便使其限定在所选核函数要求的范围之内;
(3)构造核矩阵H(N,N),求解拉格朗日系数、支持向量以及最优类超平面系数b;
(4)通过步骤(3)计算出的参数,建立虹膜纹理特征的最优决策类超平面,完成训练;
由于2.4 m跨声速风洞半模试验段侧壁为实壁[27], 计算过程中将其简化为平板; 同时考虑到涡流发生器尺寸不应过大, 否则会增加对气流的阻塞, 影响主气流的均匀性, 将上、 下壁面设置为对称条件.
(5)根据式(6)计算出待识别虹膜的相应决策输出值,得出虹膜是否来自同一人,并输出初步的识别结果;
(6)对于步骤(5)中未能正确识别或者拒绝识别的图像再次通过SVM的方法进行二次识别,并输出最终的识别结果.
4.1 实验数据及环境选择
本文算法的测试样本来自中科院自动化所提供的虹膜数据库(版本1.0),该库是目前测试虹膜识别算法最佳的大样本共享库.它一共由80个人的108只不同眼睛虹膜图像组成,每个眼睛7幅图像,共756幅.前3张与后4张的采集时间间隔一个月,图像格式均为8 bit、256灰度级的灰度图像,分辨率为320*280[12].
测试环境:Intel Core i5处理器(主频为2.60 GHz),内存为4G华硕笔记本电脑,并使用MATLAB 7.0来实现本文的算法.
4.2 算法衡量指标
一般情况下,衡量算法的性能指标主要有:识别率、错误拒绝率(FRR)、错误接受率(FAR)、注册时间和匹配时间等[13].笔者主要采用识别率、识别时间、FRR和FAR来进行评价.
4.3 核函数的选择
输人数据之间的相似性一般由核函数来反映,因此必须针对所要解决的具体问题来构造相应的核函数.多项式核函数、径向基函数(RBF)和sigmoid函数是目前研究最多也最常用的核函数.一般情况下,对于小样本的模式识别问题,3种核函数都能达到较为精确的识别效果.但当样本数目较大时,由于RBF和sigmoid函数的收敛机会明显大于多项式核函数,此时RBF和sigmoid函数能达到更好的识别效果.对于向量维数较高的模式识别问题,一般采用RBF函数或者多项式函数进行识别[14].选择RBF、sigmoid函数和多项式函数分别作为核函数,计算识别率的详细情况如表1所示.
表1 不同核函数时的识别率Tab.1 The recognition rate of different kernel functions
显然,采用RBF作为SVM的核函数时能够取得最佳的识别效果,这是因为相对于多项式函数与sigmoid函数,RBF函数待确定的参数更少,这也是其优势所在.
4.4 实验结果与分析
在采用Log-Gabor滤波器提取纹理特征的基础上,分别采用SVM、Hamming距离以及二者结合的方法在中科院虹膜数据库(版本1.0)上进行实验,实验结果如表2所示.
表2 不同识别方法时的识别率Tab.2 The recognition rate of different methods
由表2可知,本文方法比前两种方法识别效果更好,这是由于传统的虹膜识别方法侧重于特征提取,特征的提取过程一般又比较复杂.相比之下,本文方法更加侧重于特征提取后的识别过程,特征提取方法较为简单,这也是采用单一识别方法时识别率较低的原因所在.此外,表3还将本文算法与传统方法做了比较.
表3 与传统算法的比较Tab.3 Compared with the traditional algorithm
显然,本文算法跟Daugman算法相比,虽然识别率略有下降,但识别时间更短、速度更快;跟Boles算法相比,错误拒绝率和错误接受率更低,且识别率更高.所以从综合性能上来看,本文算法比另外两种算法更加实用.
传统的虹膜识别算法一般都侧重于虹膜纹理的特征提取过程,笔者提出了一种侧重于模式匹配过程的虹膜识别算法,即用SVM和Hamming距离的方法对提取的虹膜纹理特征进行识别与分类,并在数据库上进行实验.最后的实验结果表明本文算法能有效地减少虹膜识别系统的识别时间,同时该算法的识别率也达到了99.63%,综合性能相对更好.
[1] DAUGMAN J.How iris recognition works[J].IEEE Transactions on Circuits and Systems for Video Technology,2004,14(1):21-30.
[2] W ILDES R P.Iris recognition:An emerging biometric technology[J].Proceedings of the IEEE,1997,85 (9):1351-1362.
[3] BOLES W,BOASHASH B.A human identification technique using images of the iris and wavelet transform[J].IEEE Transactions on Signal Processing, 1998,46(4):1185-1188.
[4] 陈芋文,向林泓,张星林.基于Log-Gabor滤波的虹膜识别系统[J].计算机与现代化,2012,202(7): 100-103.
[5] 朱琼瑶.结合人眼特征与几何方法的虹膜定位方法[J].计算机工程与应用,2013,49(8):182-184,244.
[6] 戚玲.小波变换与数学形态学相结合的虹膜识别算法研究[D].济南:山东大学控制科学与工程学院,2012.
[7] 许威,权芳芳,姜媛媛,等.改进的算法在虹膜识别中的应用研究[J].计算机技术与发展,2013,23 (3):34-37.
[8] 赵冠男.基于Log-Gabor变换与DLPP算法的虹膜识别的研究[D].长春:吉林大学计算机科学与技术学院,2012.
[9] 陈振国,王树,田立勤.基于核Fisher鉴别分析与支持向量机的虹膜识别方法[J].山东大学学报:工学版,2011,41(5):53-56,68.
[10]段益群,刘国彦.基于EMD和SVM的虹膜识别方法[J].计算机工程与应用,2010,46(30):188-190,194.
[11]岳学东,刘洋.基于Kaiser滤波及噪声抑制优化的虹膜识别[J].郑州大学学报:工学版,2010,37(3): 122-126.
[12]王明.基于MATLAB的虹膜识别系统研究[D].武汉:武汉理工大学信息工程学院,2007.
[13]胡靓.虹膜识别的算法研究及系统实现[D].哈尔滨:哈尔滨工业大学机电工程与自动化学院,2010.
[14]李盼池,许少华.支持向量机在模式识别中的核函数特性分析[J].计算机工程与设计,2005,26(2): 302-304.
Iris Recognition Method Based on Support Vector Machine and Hamming Distance
ZHANG Zhen,ZHANG Ying-jie
(School of Electrical Engineering,Zhengzhou University,Zhengzhou 450001,China)
In order to solve the problem of traditional iris recognitions focusing on feature extraction,a new method focusing on pattern matching was proposed,which was named iris recognition method using support vector machine(SVM)and Hamm ing distance.Firstly,normalization was used to process the iris position which was located in the eye images.And then Log-Gabor filter was used to extract the features.After obtaining iris feature codes,SVM and Hamming distance were used to classify the iris features.Experiment results on the CASIA iris database showed that recognition rate of thismethod reached 99.63%,false acceptance rate and false rejection rate were reduced to 0.02%and 0.35%compared to the classical recognition methods.
iris recognition;support vectormachine;hamming distance;Log-Gabor filter
TP391
A
10.3969/j.issn.1671-6833.2015.03.006
1671-6833(2015)03-0025-05
2015-02-01;
2015-03-27
国家自然科学基金资助项目(61473266);河南省教育厅科学技术研究重点项目(13A510684).
张震(1966-),男,河南郑州人,郑州大学教授,博士,主要从事信号处理、图像处理与模式识别研究,E-mail:zhangzhen66@126.com.