公安虹膜识别规模化应用建库研究

2018-10-15 08:07李胜广周千里
关键词:虹膜瞳孔像素点

李 瑾, 李胜广,3, 周千里

(1.公安部第一研究所, 北京 100048; 2.北京市公安局, 北京 100740;3.警务物联网应用技术公安部重点实验室, 北京 100048)

0 引言

当前,公安机关在反恐维稳、群体性事件处置、涉访处置、刑事犯罪嫌疑人辨识、旅客盘查等业务进行过程中,被检查人身份信息的快速识别与核实一直是公安机关的重点工作。公安机关依靠居民身份证、指纹、人脸可解决大部分人员身份核查问题。但依然有部分人员为逃避检查不带身份证,或者人脸难以区分身份等问题,DNA核查需要更严格的应用条件,公安机关急需一种人员快速、精准识别的方法,基于此需求,虹膜成为继指纹、人脸后第三种可见的生物特征,成为识别应用研究的热点。

人的眼睛外观由巩膜、虹膜和瞳孔3部分构成,见图1。虹膜是位于巩膜和瞳孔之间的环形区域,约占眼睛总面积的65%,包括凹点、放射纹、色素点和其他斑点等丰富的纹理信息。并且自8个月年龄开始,虹膜信息趋于稳定,终身不再变化。

图1 虹膜区域示意图

1 虹膜识别规模化应用

虹膜识别技术最早在1987年由眼科专家FLOM和SAFIR提出并申请了相关核心专利,2005年FLOM和SAFIR的专利到期后,国内外虹膜识别技术迅速发展起来。目前国内虹膜识别设备主要在近红外光(波长约为850 nm)下采集虹膜图像,应用距离多在60 cm以内,景深可达5~15 cm,对用户配合度要求较低;也有应用距离在60~150 cm范围的虹膜识别设备,但对用户配合度要求较高,成本也较高;应用距离在150 cm以上的虹膜识别设备尚处于实验室研究阶段。可以说目前的采集识别技术和设备都已经非常成熟,为公安虹膜识别规模化应用奠定了坚实的技术基础和设备基础。

但目前虹膜识别仅仅在部分警种进行着局部应用,难以实现如同指纹、人脸一样的规模化应用,主要原因有:

(1)目前没有虹膜识别的统一服务平台;

(2)目前没有全国统一的虹膜原始图像库;

(3)大规模应用还缺少相关的建库、安全等标准。

虹膜规模化应用架构图见图2,包括分布到各应用的前端采集设备、虹膜识别统一服务平台、虹膜数据库和各种具体落地应用。

图2 虹膜规模化应用架构图

虹膜规模化应用的步骤:首先,建设虹膜识别统一服务云平台,并支持多种识别算法引擎,为全警种提供服务。其次,建立全国统一的虹膜原始图像数据库,依据图像质量标准各地采集到图像经检查合格后入库。最后,在重点场所建立试点,加快面向公共安全应用的产品定制和应用推广,结合公安部门的应用需求,及时开展规模化应用,为反恐和社会治安发挥重要作用。

2 统一服务平台

虹膜统一服务平台定位为运行在公安信息网内的高性能身份鉴别平台,以虹膜识别技术为核心,以公安内部网络和Internet网络为信息交换平台,中心数据仓库和分布式数据库相结合,实现身份认证。架构如图3所示,分成服务器端、Client端和浏览器端3部分功能模块。

服务器端完成的工作:前端上传的虹膜图像入库;虹膜特征点提取并生成模板数据;提供各数据库之间、数据库与便携式虹膜识别设备之间的数据传输、交换协议;虹膜设备、用户的身份授权等。

Client端完成虹膜检测、分割、归一化和虹膜特征提取等处理工作。虹膜检测是指检测当前输入图像中是否含有虹膜,以及虹膜在图像中的位置和大小。虹膜图像分割是指定位虹膜的内外边界并检测可能的遮挡物,排除瞳孔、巩膜、眼皮、睫毛、光斑等非虹膜纹理图像区域对虹膜特征提取的影响。虹膜图像归一化则是指将不同的虹膜图像从直角坐标系映射到极坐标系下固定大小的矩形中,消除虹膜大小和形变对识别性能的影响。从归一化后的虹膜图像中抽取鲁棒的个性化信息,并且用计算机能够存储和读取的格式进行编码形成虹膜模板。

浏览器端主要用于人机界面,完成数据展示、维护管理、超级用户管理等功能。

3 虹膜建库

虹膜建库是公安虹膜识别规模化应用的坚实基础,目标是为各级公安机关提供虹膜身份核验的统一出入口。前端采集到各类人员的虹膜数据按照标准图像格式存储入库,并附加虹膜算法厂商标识和虹膜特征模板,这样既兼顾不同识别设备的互用性,也兼顾到虹膜识别应用的效率。统一服务为后续各类规模化应用提供统一出口。虹膜建库包括以下几个环节。

图3 虹膜统一服务平台系统架构图

(1)重点人员虹膜数据库:建立全国的中心虹膜数据库,在中心库中按照各地市单位可以建立二级库。并按照个人的身份信息对虹膜数据进行有效的分类管理。分类包括个人基本信息以及个人历史纪录等各种信息。同时,考虑到虹膜识别与人脸识别的互补性与紧密关联性。在虹膜识别库建库时预留下人脸建库的接口与空间。数据库建成后,在全国范围内形成有效的犯罪嫌疑人检索、查询系统,有效杜绝嫌疑人假冒身份的现象。

(2)数据库采集范围:各地公安局、分局、派出所、监狱等公安特殊区域的犯罪嫌疑人。

(3)虹膜采集:采用固定式/便携式虹膜识别设备固定场所或者现场采集。并通过虹膜图像质量评估模块,对不同采集设备捕获的静态虹膜图像质量进行把关,保证入库图像的质量。

(4)传输方式:通过公安信息网/互联网络/便携式存储媒介,按照安全模式,传输、传送图像特征到中心数据库。

4 图像质量

虹膜图像质量评价技术和系统在整个虹膜识别应用系统中是入库虹膜图像质量的重要把控点,但虹膜图像质量的最终提高和应用系统性能的提高不仅仅与质量评价相关,还与虹膜图像的采集过程及数据库的建设密切相关。建库用虹膜图像质量评价算法与传统的虹膜图像质量算法不同。通常,虹膜采集设备中的质量评价算法面向一个虹膜图像序列,并且与自身的识别算法密切相关。而建库用虹膜图像质量评价算法旨在保障入库虹膜图像的质量,面向不同的虹膜采集设备获得的静态虹膜图像,并且数据量巨大。

虹膜图像质量与虹膜识别性能密切相关,NIST组织的IQCE测试表明,应用图像质量在前15%的虹膜图像进行识别比图像质量在后15%的虹膜图像,识别性能能够高出10倍。因而,在建立虹膜图像数据库时,保证入库图像的质量,对于后续的识别应用具有非常关键的作用。见图4。

影响虹膜识别性能的质量因素有多种,包括虹膜图像分辨率、瞳孔面积、眼睑遮挡、散焦模糊、运动模糊、光照、光斑等。如何检测这些质量因素,并根据各分量因素建立统一的质量分数是本课题需要重点攻关的一项研究内容。

依据《GAT1429—2017安防虹膜识别应用图像技术要求》中规定的全部虹膜图像量化指标及其限制计算所得。其中,全部虹膜图像量化指标共10个,包括图像格式、灰度等级、灰度等级利用率、虹膜半径、虹膜采样分辨率、瞳孔伸缩率、虹膜与巩膜对比度、虹膜与瞳膜对比度、有效区域占比和边界裕量。

这10个量化指标具体描述如图5所示。

图5 虹膜图像量化指标

①图像格式:虹膜图像格式应为RAW、BMP、JPEG、JPEG2000和PNG中的任意一种。

②灰度等级:虹膜图像应为灰度图像,0表示纯黑。每个像素点位深度应不小于8位,即图像中每个像素点灰度量化级应不小于256级。

③灰度等级利用率:使用图像灰度直方图的信息熵来衡量灰度等级利用率,单位为比特。虹膜图像的灰度等级利用率应不小于6比特,图像灰度直方图分布越均匀,图像富含的信息量越高,灰度等级利用率越高。按公式(1)计算灰度等级利用率:

(1)

公式(1)中:gu为灰度等级利用率;pi为图像中灰度为i的像素点个数除以图像总的像素点个数。

④虹膜半径:虹膜半径应不小于80个像素。

⑤虹膜采样分辨率:虹膜采样分辨率应不小于16 pixel/mm。

⑥瞳孔伸缩率:瞳孔伸缩率应大于20%且小于70%。瞳孔半径和虹膜半径标注见图6。按公式(2)计算瞳孔伸缩率:

(2)

其中:Rpi为瞳孔伸缩率;rp为瞳孔半径;ri为虹膜半径。

图6 瞳孔伸缩率和虹膜有效占比

⑦虹膜有效区域占比:虹膜外边界的拟合圆到图像上边界、下边界、左边界和右边界的距离应分别大于0.2ri、0.2ri、0.6ri和0.6ri。

⑧虹膜与巩膜对比度:虹膜与巩膜对比度应不小于5。

图7中所标识的区域为:区域A是以虹膜中心为圆心、内圆半径等于1.1ri、外圆半径等于1.2ri的环形区域。区域B是以虹膜中心为圆心、内圆半径等于(ri+rp)/2、外圆半径等于0.9ri的环形区域。所标识的区域为:区域C是以瞳孔中心为圆心、半径等于0.8rp的圆形区域。区域D是以瞳孔中心为圆心、内圆半径等于1.1rp、外圆半径等于(ri+rp)/2的环形区域。

图7 虹膜与巩膜对比度

按公式(3)计算虹膜与巩膜对比度:

(3)

式中:ctis为虹膜与巩膜对比度;vs为区域A内未被眼皮、睫毛和光斑等非虹膜物体遮挡的像素点灰度中值;via为区域B内未被眼皮、睫毛和光斑等非虹膜物体遮挡的像素点灰度中值;vp为区域C内未被眼皮、睫毛和光斑等非虹膜物体遮挡的像素点灰度中值。

⑨虹膜与瞳孔对比度:应不小于30。按照下面公式计算虹膜与瞳孔对比度:

(4)

式中:ctip为虹膜与瞳孔对比度;vp为区域C 内未被眼皮、睫毛和光斑等非虹膜物体遮挡的像素点灰度中值。vib为区域D内未被眼皮、睫毛和光斑等非虹膜物体遮挡的像素点灰度中值。

⑩虹膜有效区域占比:应大于50%。按公式(5)计算虹膜有效区域占比:

(5)

公式(5)中:Au为有效虹膜区域占比;Niris为虹膜环形区域的像素点个数,虹膜环形区域由虹膜内边界拟合圆和外边界拟合圆确定。Nvalid为虹膜环形区域中,未被眼皮、睫毛和光斑遮挡的有效虹膜像素个数。

5 数据安全

安全可信的身份识别认证需求急速增长,但对生物特征图像和特征模板本身安全性的重视还远远不够。包括虹膜特征在内的生物特征具有终身不变的特性,这就预示着其一旦丢失,就意味着永久地失去,没有办法重新修改或者发布模板来弥补损失。这些安全性威胁的存在,正在严重制约着基于生物特征识别身份认证技术的进一步发展。

目前虹膜应用过程中,安全隐患主要表现为虹膜原始图像的泄露和虹膜特征模板的图像复原,具体如下。

(1)虹膜原始图像的泄露:公安领域虹膜应用过程中的采集、传输、入库、比对等各个环节,虹膜原始图像是个人隐私数据的集中体现,存在隐私泄露的风险。当发生大面积泄露时,则会造成严重的社会影响,印度虹膜身份证项目中就出现过大量公民虹膜数据泄露事件。

(2)虹膜特征模板的图像复原:虹膜特征模板通过某些算法,恢复成可供其他应用的虹膜图像,虽然这个复原后的图像与原始图像不完全相同,但同样可以用于虹膜识别或者其他虹膜算法。

对于提到的虹膜应用安全隐患,必须研究强有力基于密码学的原始图像和特征模板保护方案对虹膜数据进行安全性保护,以满足用户在身份采集、存储和认证过程中对隐私保护的安全性需求。虹膜特征的终身不变性和系统虹膜图像和特征数据库中的海量数据都对该技术的研究提出了极大挑战,尤其是在认证技术诸如正确匹配率、错误拒绝率、认证速度等安全性目标的苛刻要求下,更是对该技术是否能实现进一步发展的严峻考验。

对于生物特征安全,国内外研究机构主要分为数据加密和数据混淆两大技术流派:基于数据加密的方法是将密钥和图像/特征信息相绑定,生成密文进行传输,起到隐私数据保护的目的,但涉及到对称密钥分发的问题。数据混淆主要表现为基于模板形变技术、随机数会话多因子混淆技术、数字水印、生物特征数据镶嵌等。两种方法皆对虹膜采集、传输、比对的效率造成一定的损失。

6 应用测试

通过已经建好的虹膜数据库,对虹膜识别率、拒识率(FRR)、误识别率(FAR)和正确拒识率进行测试。从虹膜统一服务平台选取测试图像18 941幅,分成两个目录:A目录10 506,B目录8 435(B目录作为比对目录,图像质量比A目录差)。首先将BMP图像处理成8位RAW图像,然后将RAW图像生成模板,存储到文件中。全部模板生成后,将A、B两目录的模板两两比对,得到比对相似度原始记录文件,共产生比对记录8千多万条,通过对比对结果进行统计,得出ROC原始结果统计文件,通过对原始记录数量进行百分数处理,得到ROC百分比文件,进一步可以将ROC百分比文件中的数据绘制成图显示。百分比统计结果如图8所示,其中横轴为相似度阈值,从0~100,纵轴为各统计数据的百分比。由图8可知,在误识别率为0.000 09%时,识别率为99.573 2%。其中绿色为识别率的百分数,紫色为误识别(FAR)的百分数,红色是拒识率(FRR)的百分数。

图8 虹膜ROC百分比

公安领域应用中,结合作者项目组的实践经验,虹膜采集应采用双眼虹膜采集设备,同时对被采集人员两只眼睛的虹膜图像进行采集。采集过程中应针对采集到的虹膜图像进行质量检测,确保入库的虹膜图像质量能够满足后续一比一确认和一比多辨认等应用场景的需要。对满足质量要求的虹膜图像,根据相关标准进行图像的裁剪和压缩,然后所有需要存储的图像再经过安全手段加密后通过公安网上传至数据库中进行存储。

虹膜图像质量应依次通过3种手段进行保障:

(1)采集设备质量自检;

(2)利用第三方统一的虹膜质量评测软件进行自动检测,并显示检测结果;

(3)现场采集人员根据虹膜采集指引进行最终的图像质量评判,经过现场采集人员确认的虹膜图像才能够入库存储。

虹膜信息采集时会面临以下技术问题。

(1)患有眼疾等特殊人群的虹膜采集:绝大部分人的虹膜图像质量能够符合特征提取要求,少部分人因患有严重眼疾等原因导致虹膜图像质量差,不符合特征提取要求,或者无法采集虹膜。

(2)技术标准的确定和测试方法:不同虹膜识别算法,对于外界环境、配合程度、图像格式和质量等多方面都有不同的要求,故必须通过算法评测标准进行约束,对不同算法、采集设备需通过第三方的检测,才能入围公安应用。

(3)虹膜数据的互用性:因为虹膜识别算法的不同,虹膜采集设备采集到的虹膜特征模板不能互用,虹膜数据库以原始图像+虹膜算法厂家标识+虹膜特征模板的方式,支撑不同采集设备的互用性。

7 结语

虹膜识别技术是生物特征识别领域的新兴技术,被广泛认为是21世纪最具有发展前途的生物识别技术。经过十余年的技术积累和小规模应用示范,虹膜识别技术已经处于大规模应用前的最后冲刺阶段。这更需要虹膜领域相关产、学、研、用机构更加努力,更加团结,发挥各自的优势,将整个虹膜产业做大做强,真正实现公安领域的落地应用。

猜你喜欢
虹膜瞳孔像素点
双眼虹膜劈裂症一例
图像二值化处理硬件加速引擎的设计
基于轮廓匹配和多项式拟合的虹膜分割算法
基于局部相似性的特征匹配筛选算法
瞳孔检查及常见瞳孔异常
一种基于虹膜识别技术的车辆启动系统
基于像素点筛选的舰船湍流尾迹检测算法
“刷眼”如何开启孩子回家之门
基于canvas的前端数据加密
瞳孔