柯呈通 廖桂华
摘 要: 文章从虹膜识别的实际应用着手,重点分析特征编码的存储和海明距阈值的选定,以提高匹配精度,缩短匹配时间。身份验证模型中,所有实验虹膜图像均来源于CASIA-Iris-Syn图像库,已注册用户的虹膜特征信息将保存在xls文件中;同时计算已注册的虹膜图像与其所属个体中所有图像的海明距离平均值,并以这些平均值最大值再一次与0.3一起求得的平均值作为阈值来匹配新虹膜图像。实验证明,这种方法能有效地提高匹配速度,降低错误接受率。
关键词: 虹膜识别; CASIA图像库; 身份验证; 生物识别
中图分类号:TP391 文献标志码:A 文章编号:1006-8228(2016)10-15-04
Authentication model based on iris recognition technology
Ke Chengtong, Liao Guihua
(School of Science and Technology, Zhejiang International Studies University, Hangzhou, Zhejiang 310012, China)
Abstract: Starting with the practical application of the iris recognition, this paper focused on analysis of feature code storage and Hamming distance threshold selected to improve the matching accuracy, and shorten the matching time. In this authentication model, all of the testing iris images were from CASIA-Iris-Syn; the registered user's iris feature information was saved in the XLS file; the average of Hamming distance between the registered image and all the other images which belong to the same person, was calculated firstly, and then the max of them would be used to take average with 0.3 together, this new average would be the threshold to match a new iris image. The experimental results show that this method can effectively improve the matching speed and reduce the false acceptance rate.
Key words: iris recognition; CASIA image database; authentication; biological recognition
0 引言
虹膜识别[1-3]主要应用于身份验证,适用于众多场合,特别是重要信息(如银行账户)的保密及安防、登机或海关安检,电子支付,还可以用于辅助犯罪可疑人员的跟踪等场合。
虹膜识别技术在现实生活中已经有了实际的应用[4],如从1996年开始的历届奥运会组委会都应用虹膜技术进行运动员的身份登记工作,并对射击项目的枪支进行安全管理;在阿富汗,超过200万难民登记了自己的虹膜信息,使人道主义物资的分配过程大为简化;在阿联酋,该国政府启用了一个大型的虹膜数据库登记被逐出境的外国人来防止其非法入境。
虹膜识别的研究分为两个不同的方向,一个是虹膜图像的获取,侧重于硬件的设计实现,虹膜图像的获取装置需保证提供高质量的虹膜图像;另一个是识别算法,以尽可能的提高识别率。本文着重分析识别算法,并设计出一个原型系统。
虹膜识别除虹膜图像获取外,分为4个模块,虹膜内外边界定位和切割、归一化、特征提取及编码和特征匹配。虹膜内外边界定位时先采用canny算子检测边沿,再使用huogh变换来检测内外边界圆,同时标记上下眼睑和睫毛噪声区域,并将虹膜区域切割出来;然后对虹膜区域进行归一化处理,特征提取及编码,最后对提取的特征编码与系统存储的特征信息进行匹配,若匹配成功,则提示“匹配成功!”,否则,提示“匹配不成功!”。本文仅从虹膜特征数据的存储、特征匹配及模型的实现角度进行详细阐述。
1 虹膜特征数据的存储
当使用用户的虹膜信息进行身份验证时,将当前用户提供的虹膜信息与系统中保存的虹膜信息进行比对,比对成功则表明验证通过。只有验证通过的用户才能继续后续的操作,否则,拒绝该用户的操作请求。
虹膜特征信息的存储是一项重要的问题。可以根据实际应用需要决定存储虹膜信息的量。用于如银行账户、登机安检、海关安检等身份验证时,系统中存有大量的虹膜信息;用于个人保险柜等场合进行身份验证时,一般存储单个人的虹膜信息。考虑到一般性,本原型系统保存4条虹膜信息。
1.1 虹膜特征信息存储方案
大部分应用在进行账号密码验证时,账号密码通常存放在数据库中,这已经是很成熟的技术。经过多次实验并分析,考虑到本原型系统存储的是代表虹膜图像特征的“0”、“1”序列,并考虑到原型系统的运行速度和存储数据的方便直观性,同时兼顾matlab的操作方便型,选用了将虹膜特征信息存储在xls数据表的方案。
1.2 虹膜特征信息存储格式
虹膜特征信息的存储格式,决定哪些数据需要保存在xls数据表中。
数据表中存储的数据与以下几个因素有关。
⑴ 匹配算法使用的参数
在匹配算法中使用了虹膜特征模板和对应的噪声掩模两个参数,因此需要将这两个参数存放在数据表中。
⑵ 特征编码信息与图像来源的映射关系
为了能够直观的对应最终的匹配对象,需在数据表存储虹膜特征编码信息与图像来源的映射关系,因此,还需存储与该特征编码信息所对应的图像路径信息。
⑶ 与特征编码信息相对应的图像来源所属的个体信息
考虑到一个生物个体可能对应多张虹膜图像,一张虹膜图像对应一个特征编码,则需要标定与特征编码信息相对应的图像属于哪个生物个体。因此,还需存储与该特征编码信息所属个体,即CASIA图像库[5]中的图片编号信息。
以上需要存储的数据体现在数据表上为以下字段:
template-用于标记每个眼睛图像的特征模板;
mask-噪声掩模;
personid-人眼特征信息的来源编号,若personid相同,则表明虹膜信息来自同一个个体;
picpath-表示图像地址;
由于在excel中二进制数据首尾的0会被省略,因此这里把template和mask所在列的数据格式设置为文本格式,picpath同样也设置为文本格式, personid所在列的数据格式设为数值。
另外,为了与数据库表中存储的每条数据含义相对应,为每条数据都设置了一个id,命名为irisid,设置为数值类型。
综合以上分析,数据表中存储了irisid,template,mask,personid和picpath,共5个字段,如图1所示。
1.3 虹膜特征信息的存取
⑴ 存数据
鉴于excel中的template和mask数据列的格式为文本格式,在存储数据时,必须将其作为字符串存储,而特征编码后得出的template和mask是二维数组,因此首先需要将其转换为字符串,然后将数据存放到excel文件中。
⑵ 读取数据
从excel文件中取出的template和mask数据属于字符串类型数据,需要先转换成数组,然后再用于比较。
2 阈值的选择与特征匹配
⑴ 阈值选择
选用CASIA-Iris-Syn图像库中人员编号为000,001,002和003中的40张图像,类内海明距计算结果40个,类间的海明距计算结果60个,将计算得到的类内海明距和类间海明距进行分析发现:类内海明距大都小于0.3,少部分大于0.3;而类间海明距大都大于0.3,少部分小于0.3;类内海明距与类间海明距有交叉。
若选用0.3作为特征匹配的阈值,可以将类间的图像很好的进行分类,从而降低错误接受率。但是实验过程中,发现:以0.3作为阈值时,错误接受率和错误拒绝率都比较高,在信息安全要求较高的场合可能导致比较严重甚至很严重的后果。因此需降低此阈值,以降低错误接受的概率。
另一方面,需将错误拒绝率降低到合理的范围,类内海明距是一个重要的考核因素,类内海明距越大,错误拒绝率越低。但根据前面的实验结果可知,若增大海明距阈值则必将抬高错误接受率,因而海明距阈值不能设置太高,以类内海明距平均值为界保证尽可能小的错误拒绝率。
综合考虑以上因素,以各类内海明距平均值的最大值与类间划分的海明距0.3的平均值作为匹配的阈值。实验结果表明,以此阈值进行匹配时可以很好的降低错误接受率。
⑵ 特征匹配
将选择图像的特征编码后,与图1所示的xls文件中的特征编码逐条进行比对,若计算得到的海明距在给定阈值的范围内,则认为是可能匹配成功的,记下此次匹配的海明距和对应图像的位置,继续获取下一条可能匹配成功特征编码进行海明码的计算,取最小的海明距所对应的图像作为新的可能匹配成功的图像,循环进行直到结束,得到海明距最小的匹配图像;否则取出下一条特征编码进行匹配;若与xls文件中的最后一条特征记录也匹配不成功,则认为是匹配不成功。
算法描述如下:
编码读入虹膜图像的特征信息;
lineno=1;
min_rd=设定的阈值;
while(lineno<=excel文件的总行数)
取出第lineno行的特征信息;
计算读入虹膜图像的特征信息与特征模板之间的海明距rd;
if(rd< min_rd)
min_rd=rd;
line=lineno
end
lineno=lineno+1;
end
if(min_rd<=设定的阈值)
找到最佳匹配图像,即excel文件中第lineno行登记的虹膜图像,输出匹配的图像信息,并提示“匹配成功!”;
else
没有找到,提示“匹配不成功!”
end
⑶ 其他处理
根据上述的分析,取各个体类内海明距平均值的最大值与0.3求平均,作为海明距阈值,因此,需要对注册图像所属个体中的图像分别计算与注册图像之间的海明距,可以在初次登记图像特征的时候,随机的获取该个体的8-10张图片,并将各自的特征码记录在xls表中,并计算海明距和平均海明,以求得阈值。
3 身份验证模型展示
模板图像库中存放已注册登记的个体虹膜图像,该模型系统中存放了4张已注册登记的虹膜图像,分别是:S6000S00.jpg,S6001S00.jpg,S6002S00.jpg和S6003S00.jpg。待匹配的图像均来源于CASIA-Iris-Syn图像库。
模型实现最终反映在UI交互界面上,如图3所示。
4 实验结果分析
为000-003这四组人眼图像中的所有图像获取特征编码,计算与所注册图像特征编码之间的海明距,共组类内海明距,组类间海明距。先登记注册S6000S00,S6001S00,S6002S00,S6003S00这四张图像,将其信息记录在irisdata.xls文件中,然后根据前面设定的阈值将四组图像所属个体的所有图像都进行匹配测试,测试结果为:10张图像被错误拒绝,0张图像被错误接受,错误拒绝率较高,但是错误接受率效果好。在安全性要求比较严格的场合有较大的优势。
5 结束语
本文设计实现了一个使用虹膜特征作为身份验证信息的模型系统,分析了虹膜特征数据的xls文件存储格式,虹膜特征匹配的阈值选择依据,并最终进行实现。实验结果表明:该模型系统中设计的阈值选择方法可以收获很好的错误接受率效果,但是错误拒绝率效果欠佳,需调整阈值的选择或研究更好的算法以提高错误拒绝率效果。
参考文献(References):
[1] 郑慧.基于虹膜的身份识别系统[D].北京邮电大学硕士学位
论文,2010.2.
[2] 何玉峰.虹膜识别预处理算法的研究及实现[D].成都电子科
技大学硕士学位论文,2013.6.
[3] 周啸.虹膜识别关键技术研究及实现[D].南京航空航天大学
硕士学位论文,2010.12.
[4] 百度百科.虹膜识别技术[EB/OL].http://baike.baidu.com/
link?url=-309pS6dkF90ru4-T0wjktpWWpz2zTD3cuG7h
MLiB1Czd8dr1594qw6yuDFEdzwwTOHi84M4ZjXXVap6DNZbNa#5.
[5] iris database.http://biometrics.idealtest.org/findTotalDbBy
Mode.do?mode=Iris.