基于神经网络的虹膜图像上眼睑的精确定位

2019-03-05 08:58宋天舒沈文忠晁静静
上海电力大学学报 2019年1期
关键词:虹膜眼睑瞳孔

宋天舒, 沈文忠, 晁静静

(上海电力学院 电子与信息工程学院, 上海 200090)

随着生物特征识别的广泛应用,虹膜识别因其优势受到了前所未有的关注。相关的测试报告指出,虹膜识别是最精确的生物特征识别手段,而且虹膜的纹理非常稳定[1-2]。同时,整个虹膜识别的过程是无侵犯的,这个特性在很多场景的应用中具有非常重要的意义[3]。精确、稳定、无侵犯这3个特性使得虹膜识别具有广阔的应用前景,因此研究人员提出了多种方法[4-8]将虹膜识别应用于现实生活。虹膜识别的第一步是实现虹膜图像的精确分割。这需要精确定位瞳孔边缘、虹膜边缘、眼睑、睫毛以及其他一些干扰因素。由于瞳孔和虹膜的形状接近圆形,很多方法都能较好地定位瞳孔外圆和虹膜外圆。但是对于眼睑的定位,尤其是上眼睑的定位,却非常困难,这是因为眼睑周围有着分布复杂的睫毛、光斑、阴影以及其他干扰,例如各种类型的双眼皮、化妆产生的眼线、涂抹的睫毛膏等。上眼睑普遍存在于虹膜图像中,而且经常遮挡着很大部分的虹膜区域。如果眼睑的定位不准确,将会在下一步的虹膜编码过程中产生大量的噪声。

传统方法都是基于像素间的梯度来实现的,而梯度很容易受到噪声的干扰,很难取得好的效果。即使没有干扰,不同的图像纹理也会有不同的梯度,即便是在单一的数据库里,图像的梯度也可能十分复杂,更不要说将这些方法应用于不同设备、不同人群、不同场景下采集到的多种数据库里。因此,单一的固定策略很难应对各种不同的场景和复杂的情形,需要一种自适应的策略来进行眼睑定位。文献[9-11]将Adaboost和Haar-like特征应用于眼睑的定位。但这些方法仍存在一些问题,例如模型需要利用Canny算子进行预处理,还需要进行去噪声的后处理,在困难场景下的表现不尽如人意;分类器的最终表现严重依赖于特征,设计好的特征非常困难,而Haar-like特征无法应对众多复杂的场景。

近年来,深度卷积神经网络(Deep Convolutional Networks,DCNs)在图像领域[12-16]得到了广泛应用。 DCNs非常善于提取特征,能够在复杂的模式识别任务(如目标分类、定位、检测)中取得重大的突破。2016年,DCNs首次应用于虹膜分割的研究中[17],其他基于DCNs进行虹膜识别的研究[18-23]出现在2017年,但上述研究中并没有针对眼睑的定位问题进行深入探讨。文献[22-23]研究了可见光下的图像,而虹膜识别需要近红外光,在近红外光下虹膜区域才会出现明显的纹理,尤其是针对可见光下虹膜颜色较深的亚洲人。文献[17-21]采用全卷积神经网络(Fully Convolutional Networks,FCNs)分割虹膜区域,FCNs[24]在2014年被提出,并应用于分割任务中。FCNs分割图像时需要像素级别的精确标注,但这些标注大多很难获得。由于FCNs自身的采样结构,导致定位的边缘不够精细。

在上眼睑区域,由于睫毛等因素的干扰,得到的效果并不理想,因此本文提出了一种新的方法进行眼睑的精确定位。首先利用DCNs给出眼睑的关键点,然后采用二次曲线进行拟合,得到眼睑的精确位置。这种方法仅需要标注几个关键点,相比于FCNs,可以大大减少工作量,且在很多复杂的场景下可以取得很好的效果。

1 深度卷积网络模型和眼睑精确定位方法

1.1 深度卷积网络模型

在计算机视觉中,有3个基本任务,从易到难依次为分类、定位、检测。研究人员提出了很多有名的目标检测框架[14],但这些框架只给出了包含目标的矩形框。

眼睑的定位问题更像是一个图像的语义分割问题,矩形框并不能满足需要。因此,一个最简单的思路就是直接借助于滑动窗口将定位任务转化为分类问题,并给出关键点,如图1所示。

图1 滑动窗口示意

由图1可见,利用滑动窗口,眼睑关键点的定位问题转化为分类问题。对每个窗口进行二分类,若窗口被分类为眼睑区域,则将此窗口的中心点定义为眼睑关键点候选点。通过不断进行实验测试,根据定位精度对比结果,最终选定适用于眼睑关键点分类的深度卷积网络模型(EyelidNet),如图2所示。

图2 EyelidNet网络模型

1.2 眼睑精确定位方法

利用EyelidNet分类滑动窗口获取候选点。对于图2所示的EyelidNet网络,每一个48×48的滑动窗口,经过网络推理后都会返回一个二分类的结果。若属于眼睑的类,则窗口中心点记为眼睑候选点。另外,不需要对水平和垂直方向上的每个像素进行滑动窗口检测。为了减少定位时间,滑动窗口垂直方向步长取4像素,水平方向步长取35像素,即可取得很好的效果。定位结果如图3所示。

图3(a)为实际检测过程中,EyelidNet网络直接给出的眼睑候选点,可以看出,网络直接给出的候选点过于冗余。本文对垂直方向上的若干候选点进行平均操作,得到了最终的眼睑关键点,如图3(b)所示。

图3 定位结果示例

对于图3(b)给出的关键点坐标,采用最小二乘法进行二次曲线拟合,得到图3(c)中所示的抛物线。这条抛物线即代表需要定位的眼睑。当然,直接在图3(a)的基础上进行拟合也能得到与图3(c)几乎相同的曲线,但去除冗余之后更便于人为地观察定位误差。因此本文进行了取平均的操作。

1.3 确定定位精度的度量标准

现有的虹膜识别文献中很少有对眼睑定位方法的单独论述,也没有建立统一的标准来度量眼睑定位的精准程度,往往是人工直接评估某一张图像定位是否准确。文献[8]是唯一给出具体的评估眼睑定位标准的文献。该算法在归一化的矩形中评估定位的误差,在虹膜识别中完成定位后需要将虹膜区域进行归一化,以适应瞳孔的扩张和图像尺寸的不同。本文采用一般的归一化方法,以瞳孔圆的圆心为圆心按顺时针方向将虹膜所在的环形区域展开成512×64的矩形,展开后的结果如图4所示。

从图4可以看出,眼睑定位的误差体现在错误接受区域和错误拒绝区域,其中黑色区域为正确定位的区域。将错误接受率记作Far,错误拒绝率记作Frr,错误定位率记作Flr,结合实际眼睑区域占比(记作Ter)来评估定位的准确性。如果将错误拒绝区域的面积记作Afr,错误接受区域的面积记作Afa,正确定位的区域面积记为Atl,展开后图像的总面积记作Atotal,则可以得到

图4 虹膜区域归一化后的定位误差示意

(1)

2 结果与讨论

本文所用的所有虹膜图像,均来自中国科学院开源的虹膜图像数据库(CASIA Iris Image Database)。训练和测试数据共7 000张,每张图像都标注了5个点。其中,训练数据共5 000张,全部来自Casia-Iris-V4-Thousands。测试数据共2 000张,其中1 000张来自Casia-Iris-V4-Thousands,500张来自Casia-Iris-V3-Lamp,另外500张来自Casia-Iris-V2-Device1。本文采用5%作为阈值,若某张图像错误率大于5%,则认为此图像定位不准确。在V4,V3,V2 3个库中错误定位的样本数分别为2个、7个、15个,准确率分别为99.8%,98.6%,97.0%。

下面分析影响定位误差的因素。本文推测定位的误差可能受到Ter和瞳孔半径与虹膜半径的比例Prr的影响,因此将Ter和Prr从小到大等分成9个区间,计算每个区间内的平均定位误差率Mflr,得到的结果如图5和图6所示。

图5 不同数据库图像的Ter对误差的影响

从图5和图6可以看出,随着Ter和Prr的增加,Mflr显著增加。因此,对于大瞳孔或眼睑遮挡严重的图像,定位误差容易增大。究其原因,一是由于进行了归一化操作,将虹膜所在的环形区域展开成矩形时,相对于远离瞳孔的区域,靠近瞳孔的区域拉伸得更为严重,提高了该区域的面积占比;二是在一般情况下,随着Ter的增加,横轴方向上眼睑的固有长度也会增加,对于相同的纵向定位误差,自然就会出现更大的总体定位误差,这一原理如图7所示。

从图7可以看出,如果考虑标注带来的人为误差,则这些图像可以被认为是正确的分类图像。

图6 不同数据库图像的Prr对误差的影响

采用不同的阈值可以得到不同的准确率。不同阈值Tthres下得到的准确率Aacc,以及与文献[8]所得出的准确率对比如图8所示。

从图8可以看出,本文算法的准确率远高于文献[8]的准确率。当阈值为5%时,文献[8]的准确率只有55.0%,而本文算法的准确率可以达到97.0%,98.6%,99.8%。由于文献[8]采用的是Canny算子,容易受到各种噪声干扰的影响,泛化能力差,因此效果不太理想。本文采用了特征提取能力更为强大的深度神经网络,特征的抗干扰能力和泛化能力都很强,即便是一些困难样本也能准确定位。部分定位效果如图9所示。

由图9可以看出,本文算法在多种干扰下均可以得到较好的定位结果。本文的神经网络都是在Casia-Iris-V4-Thousands中训练的,但也能够很好地泛化到Casia-Iris-V3-Lamp和Casia-Iris-V2-Device1中,充分证明了本方法具有高准确率和强泛化能力。

图7 Ter和Prr对Flr的影响示意

图8 本文结果和文献[8]结果的比较

图9 本文算法的部分定位效果

4 结 语

本文提出了一种基于深度卷积神经网络的上眼睑定位算法,利用滑动窗口和EyelidNet网络获取精确的眼睑关键点,并利用二次曲线进行拟合得到眼睑轮廓线。采用严格的标准对定位后的图像进行归一化处理,并进行误差分析。结果表明,本算法具有高准确率和强泛化能力,对于部分困难样本仍能精确定位,准确率达到97.0%以上。

猜你喜欢
虹膜眼睑瞳孔
双眼虹膜劈裂症一例
基于轮廓匹配和多项式拟合的虹膜分割算法
瞳孔检查及常见瞳孔异常
一种基于虹膜识别技术的车辆启动系统
瞳孔里的太阳
“刷眼”如何开启孩子回家之门
瞳孔
复杂眼睑裂伤分型及手术整形的临床分析
改进式提上眼睑肌缩短术治疗儿童青少年上睑下垂的临床观察
眼睑外翻矫正术的护理