崔景霞
(长春工业大学软件职业技术学院,吉林长春 130022)
生物特征识别技术是一门利用人类独特稳定以及可靠的生理特征来识别个体的科学。近年来,多种利用人体各类生理特征如指纹、掌纹、人脸以及视网膜的身份识别方法被广泛研究并应用于安全控制系统。
虹膜是瞳孔与巩膜之间的环形可视部分,具有终生不变性和差异性。人眼中的虹膜由随瞳孔直径变化而拉伸的复杂纤维状组织构成。据推算,两个人虹膜相同的概率是1/1 078,因此,虹膜身份认证技术的效果非常可靠和稳定。并且,由于虹膜是眼睛的外在组成部分,因此,基于虹膜的身份鉴别系统对使用者来说可以是非接触的。唯一性、稳定性和非侵犯性使得虹膜识别技术具有广泛的应用前景[1]。
根据虹膜识别过程的特点和需求,一个完整的虹膜识别系统如图1所示。
图1 虹膜识别系统结构示意图
虹膜识别系统通常包含5个部分:
1)图像获取;
2)图像预处理;
3)图像特征提取;
4)建立虹膜模式库;
5)匹配识别。
虹膜图像特征提取是虹膜识别技术中十分关键的一个步骤。迄今为止,有关虹膜特征提取的多种方法被提出与研究。如:Daugman[2]利用多尺度小波矩提取虹膜的段纹理结构特征生成2 048位特征向量。Boles与Boashash[3]采用一维小波对沿虹膜中心同心圆的一条采样曲线进行过零点检测提取纹理特征。Gaussian-Hermite矩也被用于虹膜特征[4]提取。近年来,一些新方法如二维小波变换[5]、Gabor滤波器[6]、Log-Gabor滤波器[7]、Haar小波[8]和高斯拉普拉斯滤波器[9]等也被应用于虹膜特征提取中来。
文中利用空间滤波检测虹膜中的点、线等纹理特征,进而截取纹理能量聚集的子区域。最终对截取的子区域加以投影,从而提取特征向量。具体步骤将在文中第4部分描述。
文中所采用虹膜图像取自 The Perfect Iris Images Database虹膜数据库,如图2所示。
该数据库中包含了64位项目参与者的左右眼各3幅,共384幅虹膜图像样本。每幅样本图像为768×576像素大小彩色图片(见2(a)),该数据库中的图像样本虹膜显现完整,无睫毛、眼睑等遮挡覆盖,堪称完美。
图2 数据库虹膜样本示意图
将原数据库中的样本图像转换成为灰度图像后,为增强图像效果,对灰度化后的图像进行直方图均衡化处理,其效果如图3所示。
图3 数据库虹膜图像样本预处理效果对比图
由图3(c)可见,经预处理直方图均衡化后的虹膜图像样本,对平均亮度以及对比度的提高非常明显。增强了视觉效果,更有助于之后阶段虹膜图像的特征提取与识别。
在一些识别技术中,图像预处理阶段通常采用Canny算子[10]等边缘检测算法定位并截取整个虹膜纹理区域。文中由于在提取特征过程中采取子区域特征提取方式,因而毋须截取整片虹膜区域,简化了预处理步骤。
由图2(a)可见,人类虹膜总体上呈现一种由里到外的放射状结构,包含许多相互交错的类似斑点、细丝、冠状、条纹、隐窝等形状的细微特征。这些特征信息对每个人来说都是唯一的,其唯一性主要是由胚胎发育环境的差异所决定的。这些细微特征信息被称为虹膜的纹理信息。
为将虹膜的这些纹理信息凸显提取出来,文中提出了利用线性空间滤波的方法。线性滤波的概念源于频域中信号处理所使用的傅里叶变换,而在文中空间滤波直接对图像中的像素执行滤波运算。该类滤波关注的线性运算包括将邻域中每个像素与相应的系数相乘,然后将结果进行累加,从而得到点(x,y)处的响应。若邻域的大小为m ×n,则总共需要mn个系数。这些系数排列为一个矩阵,被称为滤波器或掩模。
线性空间滤波的机理如图4所示[11]。
图4 线性空间滤波原理示意图
其过程为在图像 f中逐点移动滤波掩模w的中心。在每个点(x,y)处,滤波器在该点处的响应是滤波掩模所限定的相应邻域像素与滤波器系数的乘积结果的累加。对于一个大小为m×n的掩模,m,n均应遵循为奇数的原则。有意义掩模的最小尺寸为3×3,因其有一唯一的中心点,其滤波过程确定直观。
由图4可见,对图像任一点(x,y)进行m×n掩模处理得到的响应R,实践中通常用下式表达:
对图4中的3×3掩模,图像中任意一点(x,y)的响应用下式表达:
文中所采用的两类滤波掩模如图5所示。
图5 文中选用的两类滤波掩模
读取原彩色图像后,灰度化原图像并归一化为双精度数据类型矩阵。而后将此矩阵图像分别与上述两类滤波掩模进行滤波处理。将滤波后所得图像做二值化处理并人为设置阈值为0.98。
为凸显不同方向纹理细节特征。将上述两类掩模滤波处理后所得两幅效果图做异或运算,如图6所示。
图6(a)为异或运算后效果图,为清晰显示,对所得图像求补结果见图6(b)。可以明显看出,经空间掩模滤波之后的图像可将原虹膜图像中的纹理信息特征有效呈现,并量化处理以供识别。
由图6(b)可以看出,经滤波处理后的虹膜图像90%以上的纹理信息均聚集在以瞳孔为中心,以2/3眼球横向半径为半径的圆周范围内。同时,可以得出在此纹理能量聚集区域范围内,实际操作中完全可以截取一部分子区域信息用于特征向量生成而毋须截取全部纹理。文中方法采用截取以瞳孔为中心上下左右4个区域的纹理信息生成特征向量。每个区域设置为32×32像素大小的方形区域,并且每个区域近瞳孔一边均与瞳孔外圆周相切且方形区域中心位于以瞳孔圆心为原点的坐标轴上。上述子区域截取方式如图7所示。
分别对上述子区域做瞳孔中心方向的投影[12]。则每个子区域可生成32位一维向量,将所生成的4个32位一维向量首尾相接串联成一个128位一维向量,而后将该一维向量除以32并作为用于最终识别的虹膜特征向量。
目前,以神经系统为中心的神经网络理论的研究正取得迅速的发展,它以自组织、自学习、自适应的特点,已经广泛地被应用于众多领域。
BP网络是一种单向传播的多层前向网络,其结构如图8所示。
图8 典型的BP网络拓扑结构
由图可见,BP网络是一种具有三层或三层以上的神经网络,包括输入层、中间层和输出层。上下层之间实现全连接,而每层神经元之间无连接。当一对学习样本提供给网络后,神经元的激活值从输入层经各中间层向输出层传播,在输出层的各神经元获得网络的输入响应。接下来,按照减少目标输出与实际误差的方向,从输出层经过各中间层逐层修正各连接权值。最后回到输入层。这种算法称为“误差逆传播算法”,即BP算法。随着这种误差逆传播修正不断进行,网络对输入模式响应的正确率也在不断上升。
文中采用一对一的BP神经网络识别方法,即每一类(人)建立一个BP网络,每个网络的输出层只有一个输出节点用来输出识别结果。
如前所述,文中所采用虹膜图像取自The Perfect Iris Images Database虹膜数据库。该数据库中包含了64位项目参与者的左右眼各3幅,共384幅虹膜图像样本。识别阶段选取了其中20位项目参与者的左右眼虹膜图像加以识别。由于对每位参与者而言,其左右眼虹膜纹理亦不相同,实验中将每位项目参与者的左眼虹膜图像与右眼虹膜图像分割开来分别建立神经网络加以识别。
实验结果用正确识别率(CVR)评定,正确识别率定义如下:
式中:FAR——错误接受率;
FRR——错误拒绝率。
其定义如下:
实验中,设置网络输出阈值为0.02,实验结果及对比分别见表1和表2。
表1 实验数据结果
表2 实验结果对比
首先对虹膜图像进行了灰度化以及直方图均衡化等预处理操作。其后将预处理化后的图像归一化为双精度数据类型矩阵,并将此矩阵图像分别与两类滤波掩模进行滤波处理。为凸显不同方向纹理细节特征。将所得两幅效果图做异或运算后对其求补。截取以瞳孔为中心,上下左右4个区域的纹理信息生成特征向量后,建立一对一的BP神经网络对其进行识别分类。实验结果表明了文中方法的可靠性和有效性。同时,在实验中得出如下结论:
1)经两类滤波掩模后,虹膜图像中不同方向的纹理细节特征被展现并凸显出来。
2)在虹膜纹理能量聚集区域范围内截取以瞳孔为中心上下左右4个区域的纹理信息以用于生成特征向量。避免了定位并截取全部纹理区域的复杂操作,简化了特征提取步骤,并保证了提取特征的有效性。
3)提取特征的4个子区域由手工定位截取,不可避免地造成不同样本间的区域截取的差异性,进而对识别结果形成轻微影响。如何形成对子区域截取操作的自动化以及提高区域定位精确度成为该方法今后研究的发展方向[16]。
4)文中采用投影方法提取截取区域的纹理特征向量,如何寻求其它更加有效并更突显虹膜纹理独特性及排它性的向量生成方法,且对所生成向量降维后加以识别,成为文中方法改进的另一发展方向[17]。
5)采用一对一的网络结构利于更新数据库[18],即当增加一个类或减少一类时,不必重新训练每个网络。
[1] 田捷,杨鑫.生物特征识别技术理论与应用[M].北京:电子工业出版社,2005:6-7.
[2] J Daugman.High confidence visual recognition of persons by a test of statistical independence[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,1993,15:1148-1161.
[3] W Boles,B Boashansh.A human identification technique using images of the iris and wavelet transform[J].IEEE T rans.Signal Processing,1998,46(4):1185-1188.
[4] Li Ma,Tieniu Tan,Yunhong Wang,et al.Local intensity variation analysis for iris recognition[J]. Pattern Recognition,2004,37:1287-1298.
[5] 张宇.基于小波变换的虹膜识别算法研究[D]:[硕士学位论文].成都:电子科技大学,2006.
[6] J G Daumgan.Biometrical personal identification system based on iris analysis[P].US:patent 52911560,1994.
[7] D Field.Relations between the statistics of natural images and the response properties of cortical cells [J].Journal of the Optical Society of America,1987.
[8] S Lim,K Lee,O Byeon,et al.Efficient iris recognition through improvement of feature vector and classifier[J].ET RI Journal,2001,23(2):25-29.
[9] P Burt,E Adelson.The laplacian pyramid as a compact image code[J].IEEE Transactions on Communications,1983,31(4):532-540.
[10] 林卉,赵长胜.基于Canny算子的边缘检测及评价[J].黑龙江工程学院学报,2003,17(2):3-6,16.
[11] Gonzales RC.数字图像处理[M].2版.阮秋琦,译.北京:电子工业出版社,2003:91-95.
[12] 吕英华,崔景霞.基于FWT-Projection-BPNN的表情识别[J].东北师大学报:自然科学版,2009(2): 84-91.
[13] 飞思科技产品研发中心.神经网络理论与MATLAB 7实现[M].北京:电子工业出版社,2005:99-108.
[14] 王蕴红,朱勇,谭铁牛.基于虹膜识别的身份确定[J].自动化学报,2002,28(1):1-10.
[15] 范科峰,曾庆宁.基于二维小波变换的虹膜识别算法研究[J].中国有线电视,2002(24):28-31.
[16] 何飞.面向实用环境的虹膜识别方法研究[D]:[硕士学位论文].长春:吉林大学,2010.
[17] 王玥.基于M ATLAB的虹膜识别系统研究[D]: [硕士学位论文].武汉:武汉理工大学,2007.
[18] 韩民.基于多分辨率分析的虹膜识别算法研究[D]:[硕士学位论文].济南:山东大学,2010.