宋平 黄玲 王云龙 刘菲 孙哲南
基于生物特征(虹膜、人脸、步态、指纹等)的身份识别是个体身份鉴别的重要手段.近年来,随着模式识别、机器学习、计算机视觉、人工智能、信息安全等领域的发展,生物特征识别技术不断突破创新,得到了国内外学术界,产业界乃至政府部门的高度关注,已经被推向一个研究高潮.相比传统身份识别方式(密码、身份证等),生物特征具有防伪性高、不易丢失或遗忘、信息丰富的特点.在常用生物特征(指纹、人脸、虹膜等)中,虹膜识别因为具有唯一性、稳定性、非接触性、高精度等优势,是现阶段最安全可靠的生物特征识别技术,现已成功应用于海关、机场、公安、金融等高安全需求的场合.但是,最近研究表明,现有的虹膜识别系统无法对采集端进行保护,在遇到人造假体样本(打印虹膜、美瞳、义眼等)攻击时,常见的数字证书加密、水印、数字签名等信息保护措施失效,导致系统产生误识别[1−3].为了准确辨别真实虹膜和人造假体虹膜,提升虹膜识别系统的安全性和鲁棒性,虹膜活体检测技术(Iris liveness detection)应运而生.该技术的基本原理是:与正常采集的虹膜图像相比,人造假体虹膜图像在生成时会丢失信息,同时也会附加额外的信息,通过检测这两部分信息可以判断虹膜图像的真实性[4].
根据检测信息方式的差异可以将虹膜活体检测方法分为两类:硬件法[5−14]和软件法[15−25].硬件法是指通过使用额外的硬件设备采集活体人眼特有的特征进行活体检测,比如视线特征[5−7]、虹膜立体结构特征[8]、虹膜震颤(Hippus)特征[9]等.Daugman[10]提出了利用角膜和晶状体前后面对光照产生的普尔钦(Purkinje)反射进行虹膜活体检测的理论,Lee 等[11]基于该理论实现了虹膜活体检测.该方法通过控制一对近红外光源产生并拍摄普尔钦反射,可以实现图片、美瞳、义眼等多种攻击类型的检测,不过需要精确控制光源和瞳孔之间的角度,对成像系统要求较高.Lee 等[12]通过测量不同近红外光照(750 nm 和850 nm)条件下巩膜和虹膜之间反射率比的变化进行活体检测.该方法检测速度快,但是需要分两次采集不同光照条件下的人眼图像,大大降低了数据采集效率.Czajka 等[13]通过控制30 s内点光源的亮度变化,根据瞳孔的动态变化(Pupil dynamics)和与瞳孔收缩模型的拟合情况区分真假虹膜样本.该方法精度较高,但数据采集时间较长且采集时人眼舒适度低.
近年来,光场成像技术以其多视角、多维度、多焦点成像的特点逐步应用于生物特征识别领域.Raghavendra 等[14]首次利用光场相机的固有特性进行虹膜活体检测.该方法首先利用Lytro Desktop软件对光场图像进行预处理并渲染得到十几张具有不同对焦深度的图像,然后依次对这些图像进行预处理,得到归一化虹膜图像序列,最后通过离散小波变换(Discrete wavelet transform,DWT)方法计算图像序列的对焦能量变化量来区分真假虹膜样本.该方法数据采集方便,但光场数据处理受软件限制,局限性大;由于采用阈值分类方法,该方法只能应对单一攻击类型,其应用面较窄,无法同时应对多种攻击类型.
软件法是指在虹膜图像采集完成后通过对采集到的图像提取有区分性的特征进行虹膜活体检测.Daugman[10]提出打印虹膜图像经过2D 傅里叶分析会产生与真实虹膜图像不同的频域特征.真假虹膜图像不仅频谱特征不同,纹理特征也存在差异.因此,通过利用LBP(Local binary pattern)[15]、BSIF(Binarized statistical image features)[16−17]、GLCM(Gray level cooccurrence matrix)[18]等局部特征描述子提取有区分性的局部特征,可以准确检测多种人造假体虹膜类型(打印虹膜、美瞳、义眼等).Hu 等[19]和Kohli等[20]通过融合多种局部特征取得了更好的活体检测结果.Gabally 等[21]基于“质量差异”的假设提出了基于图像质量评价(Image quality assessment)的活体检测方法.该方法通过专门设计多种针对虹膜图像的质量评价指标,来区分真实虹膜和打印虹膜,取得了较高的分类准确率.然后,Gabally 等[22]又使用25 种常规图像质量评价方法来提取虹膜图像的质量特征,既取得了较高的准确率又具有很好的泛化性能.随着深度学习浪潮的来临,基于深度学习的虹膜活体检测方法[23−25]也已经达到了与传统方法相当的准确率.
综上,我们可知:1)两类虹膜活体检测方法各有其优点与不足.硬件法能够采集更丰富的信息,分类效果更好,但是一般需要使用额外的成像设备,自主搭建采集系统,控制采集环境.因此硬件法操作复杂度高,采集效率低,无法便捷应用.软件法使用非接触方式采集图像,运行速度快,但是输入信息有限,图像处理,特征提取和活体检测算法易受图像质量影响.2)目前使用的虹膜数据库几乎都是近距离采集(≤60 cm),这样虽然能够得到高分辨率和高质量的虹膜图像,但是成像环境和应用场景的光照、距离、视角、离焦、景深、噪声等变量需要严格受控,无法进行复杂场景下的虹膜数据获取、活体检测、身份识别等任务的研究.
基于以上问题,本文提出了基于计算光场成像的远距离虹膜活体检测方法,通过软硬件结合的方式,从数据获取源头创新,利用计算光场成像技术充分挖掘高维光场信息,通过特征融合实现准确有效的远距离虹膜活体检测.我们使用光场相机作为虹膜图像的采集设备,操作简单,使用方便.利用计算光场成像技术,只需一次图像采集,使用一张光场图像即可使用硬件法和软件法分别提取有区分性的特征进行虹膜活体检测.因此,本方法既能够方便迅速地采集虹膜图像,又能够记录更高维度、更丰富的有效信息,取得更好的活体检测结果.虹膜活体检测是虹膜识别系统的关键预处理步骤,对于虹膜识别系统来说,识别距离越远,识别景深范围越大,用户体验越好.光场成像技术具有景深扩展的强大后处理能力,利用实验室自主研发的光场相机进行光场成像的景深比传统成像的景深扩大5∼10 倍,可以实现远距离大景深的虹膜活体检测,有助于促进生物特征识别的研究发展与应用产业化.
本文受Raghavendra 等[14]方法的启发,与其不同的是,在本文提出方法的数据采集环节中,采集距离更远,采集设备更先进,采集环境更复杂;在数据处理环节中,可以自由控制光场图像的预处理与渲染过程,根据需要得到任意步长间隔的重对焦图像序列;在对焦评价环节中,本文针对远距离半受控的采集环境,选择了对噪声更鲁棒的基于图像梯度的评价方法;在虹膜分类环节中,本文选择了比阈值分类方法适用范围更广、分类性能更强的分类器.文献[14]虽然利用光场相机的固有特性进行近距离虹膜活体检测并在单一攻击类型的数据库中取得了不错的结果,但无法同时应对多种攻击类型.而本方法通过软硬件结合的方式,使用光场相机采集光场虹膜图像;利用计算光场成像技术,以光场重对焦技术为切入点,通过软硬件特征融合的方式在远距离、半受控、大景深的图像采集条件下仍然可以同时应对多种攻击类型,进行高准确率的虹膜活体检测.本文首先利用重对焦技术提取眼睛区域的立体结构特征,然后利用重对焦序列中最清晰图像提取虹膜的纹理特征,在特征层融合后使用支持向量机(Support vector machine,SVM)分类器进行真假虹膜样本分类.为了验证本文方法的精度和有效性,我们采集建立了目前为止第一个近红外远距离光场虹膜活体检测数据库,包括打印虹膜(普通打印纸、高光相片纸)和屏显虹膜(iPad)两类共三种人造假体虹膜图像,共504 个有效样本(约5 万张重对焦光场图像).实验结果表明本文提出的方法可以准确有效地检测并阻止打印虹膜和屏显虹膜对虹膜识别系统的攻击.
本文提出基于计算光场成像的虹膜活体检测方法,如图1 所示.首先,对采集的原始光场图像进行解码、标定、预处理,获得四维光场数据L(u,v,x,y);利用光场重对焦技术得到一组焦栈(Focal stack)图像.然后,计算焦栈图像中眼睛区域的对焦能量值作为立体结构特征;选取焦栈中最清晰的虹膜图像进行定位,分割、归一化、提取LPQ(Local phase quantization)[26]特征作为纹理特征.最后,在特征层融合立体结构特征和纹理特征,使用SVM 分类器进行真实虹膜和人造假体虹膜分类.
1.1.1 光场图像预处理
光场通过表征空间中每一条光线的辐射亮度(Radiance),描述了光在三维空间的辐射传输特性.光场成像是一种计算成像技术,单次曝光即可同时捕获光线的能量和角度信息.因此,基于光场成像技术设计的光场相机可以记录拍摄场景的光场.现阶段,微透镜阵列广泛应用于光场调制过程.基于微透镜阵列的光场相机(Lytro,Raytrix 等)是由主光学系统、微透镜阵列、图像传感器组成,通过在传感器前放置微透镜阵列,可以对不同视角的光线进行分离,实现不同视角的快照式成像.
图1 光场虹膜活体检测方法流程图Fig.1 Flowchart of light-field iris liveness detection method
光场成像是一种编码成像,不是“所见即所得”,因此需要对获取的原始光场图像进行解码、标定和预处理,才能得到图像的光场数据.本文采用Dansereau 等[27]提出的方法1http://www.mathworks.com/matlabcentral/fileexchange/49683,使用双平面表达模型对光场进行参数化描述,通过使用白图像标定每个微透镜的中心坐标,计算配准参数,提取4D 光场数据L(u,v,x,y).
计算光场成像模型如式(1)所示,对光场矩阵L(u,v,x,y)的uv坐标积分,即可得到传统光学成像结构采集的2D 传统图像I(x,y).通过固定uv坐标可以得到不同视角下的子孔径图像I(x,y)u,v,由文献[28]可知,子孔径图像所对应的光瞳尺寸是原始光瞳尺寸的1/u,因此,理论上光场子孔径图像的景深是传统图像的u倍.以我们实验室自主研制的光场相机为例,u=13.
图2 为物方离焦分别为−10 cm、0 cm、+10 cm、+20 cm 时传统图像I(x,y)和对应距离采集的光场中心子孔径图像I(x,y)5,5.第1 行为传统图像,第2 行为与之对应的光场中心子孔径图像.比较两组图像可知,在聚焦位置1.6 m 处两幅图像都非常清晰,没有明显视觉差异;随着离焦量增大,传统图像趋于模糊,当离焦量较大时,弥散效应非常明显,虹膜数据已无法用于后续的数据处理,而光场中心子孔径图像仍然可以清晰看到瞳孔中反射的光点.这说明光场成像的景深远大于传统成像的景深,计算光场成像具有强大的景深扩展能力.
图2 传统图像(上)与光场中心子孔径图像(下)比较Fig.2 Comparison between traditional images(up)and light-field sub-aperture images(down)
传统成像技术一直存在景深与焦距(或孔径)的相互制约关系.利用传统相机拍摄远距离虹膜时必须选用长焦镜头,若固定其他光学成像参数,则焦距增大会导致景深变小,使高质量清晰虹膜图像的采集变得非常困难,需要参与者高度配合,否则容易出现严重的离焦模糊,为后续虹膜检测、分割、识别的研究带来巨大挑战.而光场成像技术具有“先拍摄,后对焦”的优势,在进行远距离虹膜图像采集时,使用实验室自主研制的光场相机配合70 mm∼200 mm 长焦镜头拍摄1.6 m 远的虹膜时,依然可以获得30 cm 的有效景深范围,有效解决了基于传统成像的虹膜图像采集的难题.因此,使用光场成像方式可以实现对用户交互、应用场景、成像环境鲁棒的远距离、大景深、高质量光场虹膜图像采集.
1.1.2 光场重对焦
对焦是通过改变探测器像面与镜头之间的距离,使拍摄物体在探测器像面上产生清晰图像的过程.在传统光学成像系统中,对焦是通过手动或自动调整对焦环使离焦模糊的目标变清晰,其实质是将光场重新投影到成像最清晰的像平面.基于微透镜阵列的光场相机能够同时对光线的能量和角度信息进行采样和成像,记录四维光场数据.因此可以通过计算成像的方式改变光场的投影像平面,实现数字重对焦(Digital refocusing).本文使用Ng 等[28]提出的重对焦方法,重对焦计算公式为:
如图3 所示,基于双平面表达模型对光场进行参数化描述,()表示重对焦平面记录的光场,L(u,v,x,y)表示原始成像平面记录的光场,α表示重对焦像平面与原始成像平面的相对位置,α=,F和分别表示重对焦前后主透镜平面到成像平面的距离.基于几何光学的光线传播理论,光线在均匀介质中沿直线传播,所以在式(2)中,重对焦前后光场uv坐标不变.因此,重对焦图像可由原始光场子孔径图像线性平移后叠加获得.通过均匀改变α可以得到一组对焦在不同深度位置的焦栈图像.
图4 为一组虹膜焦栈图像中的部分图像,可以直观地看到α=1.010 时图像最清晰(计算焦栈图像的对焦能量值亦可验证),在此基础上α减小或增大图像都逐渐模糊.
理论上在聚焦情况下,当α=1 时图像最清晰,但因为本文实验数据是在半受控环境下采集,实际拍摄中由于被采集者移动、姿态非对正、对焦目标是人脸等因素会导致虹膜的聚焦位置不是理想情况时的α=1.因此,通过光场数字重对焦技术不仅可以利用硬件法提取焦栈图像眼睛区域的立体结构特征,而且可以实现更准确对焦,获取最清晰的虹膜图像,从而利用软件法提取更有区分性、更鲁棒的纹理特征.虽然光场重对焦技术可以扩大图像景深,但是仍然受到香农采样定理的制约,偏离聚焦位置过大仍会导致图像模糊,产生非精确对焦(Inexact refocusing)[29].
图3 重对焦示意图Fig.3 Refocusing demonstration
图4 虹膜焦栈图像Fig.4 Iris focal stack images
1.2.1 对焦评价函数
本文使用对焦评价函数对焦栈图像的清晰度进行度量评价,从而得到焦栈图像的对焦能量值曲线,以此构建眼睛区域的立体结构特征.由于采集距离远,光照和离焦不断变化,采集的虹膜图像存在不同程度的噪声,因此本文采用对光照和噪声不敏感的基于图像梯度的对焦评价函数TGV(Tenengrad gradient variance)[30],以提升本方法的鲁棒性.
由式(3)∼(5)可知,TGV 方法首先使用索贝尔算子(Sobel operator)Sx和Sy提取重对焦图像IR(x,y)中的边缘信息,然后计算每个像素的梯度强度S(x,y)和整幅图像的平均梯度强度¯S,设置阈值T来滤除噪声产生的边缘像素,使用梯度强度方差FSF(IR)作为图像的对焦能量值.FSF(IR)越大,说明图像中边缘信息越丰富,图像越清晰.
图5 展示的是相机对焦位置为1.6 m 时,对1.5 m(−10 cm)、1.6 m(0 cm)、1.7 m(+10 cm)、1.8 m(+20 cm)处的虹膜进行光场成像得到的对焦能量值曲线.横轴表示焦栈中图像的位置序号(Sequence number),对应的重对焦区间为[0.5,1.7].纵轴表示对焦能量值大小.可以发现,随着采集距离增加,对焦能量值达到峰值时所在焦栈图像中的位置逐渐后移,与理论聚焦位置相符.对焦能量值曲线对应的峰值大小与离焦量有关,在实际对焦位置1.6 m 处离焦0 cm,此时对焦能量值最大,图像最清晰.当离焦−10 cm、+10 cm、+20 cm 时,虽然重对焦图像的清晰度提升很大,但是因为重对焦图像是由原始光场子孔径图像经过线性平移后叠加得到,这个过程相当于对图像进行了平滑滤波,图像丢失了部分的高频信息,边缘信息变少.因此,重对焦位置偏离聚焦位置越远,图像平滑越明显,高频信息丢失越多,图像对焦能量值越低.
图5 不同拍摄距离(离焦量)时焦栈图像对焦能量值曲线Fig.5 Focus measure curves of focal stack images at different capturing distances(defocusing amount)
1.2.2 立体结构特征构建
由于我们采集的是双眼虹膜图像,采集环境半受控,在拍摄时会因为被采集者移动、姿态非对正等因素导致左右眼区域的最优聚焦位置不同,影响立体结构特征的提取.所以左右眼区域最优聚焦位置的搜索过程是独立进行的.
重对焦过程本质是一个搜索过程,因此本文采用了由粗到精的方法确定最优聚焦位置α∗.首先使用∆α=0.03 的步长在[0.5,1.7]的重对焦区间内对图像进行大范围宽间距的搜索,寻找焦栈图像中聚焦能量值最高的图像对应的,然后以为中心,在[−0.03+0.03]区间内进行小范围窄间距的二次重对焦搜索,确定最优聚焦位置α∗.
根据相关实验结果(详见第3.1 节),确定最优重对焦范围为0.4,因此构建眼睛区域立体结构特征的重对焦区间为[α∗−0.2,α∗+0.2];重对焦步长∆α=0.0028,对应的焦栈图像数量NSN(Sequence number)为145.将该序列中所有图像对焦能量值依次排列,作为眼睛区域的立体结构特征FSF.立体结构通过对焦能量值曲线的形状反映了眼睛区域的深度结构信息.
图6 展示了同一虹膜在1.5 m、1.6 m、1.7 m 处拍摄的真实虹膜图像和利用该虹膜制造的三种人造假体虹膜图像的归一化立体结构特征曲线.对比真假虹膜的归一化立体结构特征曲线,可以发现两者之间存在显著差异.1)真实虹膜图像的归一化立体结构特征曲线峰值比较低,假虹膜曲线的峰值比较高.原因是真实人眼区域是立体结构,虹膜与眼周区域位于不同的深度位置,在一定重对焦范围内都有对象对焦,对焦能量值衰减较慢,因此在归一化立体结构特征曲线中峰值对应的比重较低.2)真实虹膜归一化立体结构特征曲线存在不同程度的波动,曲线不平滑,而人造假体虹膜曲线平滑.原因是打印虹膜和屏显虹膜是平面结构,没有深度变化,而真实人眼区域是立体结构,在计算对焦能量值时会产生较大程度的波动.
实验结果表明(详见第3.3 节),当单独使用眼睛区域归一化立体结构特征进行虹膜活体检测时,可以达到94.41% 分类准确率,5.90% 平均分类错误率,说明提取的归一化立体结构特征具有很强的区分性.
我们通过由粗到精的重对焦搜索确定了最优聚焦位置α∗和对应的最清晰虹膜图像.本方法使用最清晰虹膜图像进行虹膜定位、分割、归一化,然后使用LPQ 特征描述子提取虹膜图像的纹理特征.
LPQ 特征使用图像低频信息进行构建,对图像模糊不敏感,可以在远距离情况下提取更鲁棒、更有区分性的特征.首先对图像f(x)中每个像素x的矩形邻域Nx做短时傅里叶变换(Short-time Fourier transform,STFT)变换:
图6 不同类型真假虹膜图像归一化立体结构特征曲线Fig.6 Normalized structure feature curves of different kinds of real and fake images
式中,x、y是图像像素的二维坐标,u是频率,ω(x)是表示邻域Nx的窗口函数.只考察四个频率u0=(a,0),u1=(a,a),u2=(0,a),u3=(−a,a)的傅里叶系数,其中1.得到像素x的傅里叶系数特征F(x),如式(7)和(8)所示.将G(x)各分量的实部和虚部根据其正负号分别量化为1 和0,得到像素x邻域的傅里叶相位信息,将其转换至[0,255]范围就得到该像素的LPQ 特征值FLPQ(x).最后统计图像所有像素点的LPQ 特征值得到图像的LPQ 特征统计直方图,将其作为虹膜图像的纹理特征FLPQ.
图7 展示了同一虹膜在1.5 m、1.6 m、1.7 m 处拍摄的真实虹膜图像和利用该虹膜制造的三种人造假体虹膜图像的纹理特征曲线.真假虹膜之间的纹理特征在形状、幅值等方面存在显著差异.
立体结构特征表达了眼睛区域的深度变化信息,纹理特征表达了虹膜的纹理信息,两类特征相互补充,因此本方法融合两类特征进行虹膜活体检测.相比于分数层特征融合方式,本文使用的特征层级联的特征融合方式可以使分类器既能提取每一类特征的有区分性信息,又能利用两类特征之间隐含的相关性来提高分类结果,获得更高的分类准确率.分别对立体结构特征和纹理特征进行归一化,然后进行特征串联即可得到最终分类特征FF=[FSF,FLPQ].
本文采用径向基函数SVM 分类器进行特征分类,首先优化求解式(9),利用n个训练集数据求解变量和b∗的最优解,然后使用分类决策函数f(x)判断测试样本x的真伪.
图7 不同类型真假虹膜图像纹理特征曲线Fig.7 Texture feature curves of different kinds of real and fake images
我们计划建立一个大型近红外光场虹膜活体检测数据库.目前已完成第一阶段的采集工作,建立了一个中等规模的近红外远距离光场虹膜活体检测数据库.该数据库在半受控环境下采集,半受控表现为采集环境光照多变、采集背景复杂、采集姿态非对正、遮挡等.采集对象有14 人,采集的人造假体虹膜样本类型有打印虹膜(普通打印纸、高光相片纸)和屏显虹膜(iPad)两类.对采集的光场图像进行认真筛选,得到504 个可用真假虹膜样本(约5 万张重对焦光场图像).我们使用的采集设备有实验室自制光场相机和Lytro Illum 商业级光场相机,如图8(a)和8(b)所示.下面分别介绍真实虹膜样本图像和人造假体虹膜样本图像的采集流程规范.
图8 光场图像采集设备及采集场景Fig.8 Light-field image acquisition devices and acquisition scene
由于亚洲人种的虹膜在可见光下呈深褐色,虹膜纹理不明显,所以需要在近红外环境下采集真实人眼虹膜图像.真实人眼虹膜图像的采集过程分为两步.
1)使用图8(c)所示的近距离高清虹膜采集设备采集近红外条件下的双眼虹膜图像,专门用于人造假体虹膜样本的制作,以及后续的虹膜识别研究.图8(d)是采集白图像的过程,采集的白图像用于光场相机的标定与光场图像的平场校正、参数配准等预处理过程.
2)采集远距离不同离焦情况下的双眼真实虹膜样本.为了让拍摄环境更接近实际应用时的光照环境,我们通过调整摄影灯的光照强度和近红外光的强度人为模拟了高亮光照环境、自然光照环境、昏暗光照环境,每个参与者只在一种光照环境下拍摄虹膜图像.
我们将光场相机设置为拍摄1.6 m 距离处图像能清晰对焦,保持相机参数不变,让参与者分别位于1.5 m、1.6 m、1.7 m 和1.8 m 处拍摄离焦距离分别为−10 cm、0 cm、+10 cm 和+20 cm 时的光场虹膜图像,每个位置至少采集三张光场图像.采集的真实虹膜样本如图9(a)所示.
图9 采集的真假虹膜图像Fig.9 Captured real an spoofing irises
经过光场解码、标定、去渐晕等后处理增强,最终采用115 张真实双眼虹膜图像,获得230 个真实虹膜样本.
拍摄的人造假体虹膜类型有打印虹膜和iPad屏显虹膜两类,其中打印虹膜又细分为A4 普通打印纸黑白打印与高光相片纸彩色打印两种.图9(b)∼9(d)对应展示了A4 普通打印纸打印虹膜、iPad 屏显虹膜、高光相片纸打印虹膜三种人造假体虹膜图像.我们选择这三种人造假体攻击方式的原因有:1)图像来源简单可靠,高分辨率图像非常容易从社交媒体等渠道获取或盗用;2)攻击方式简单有效,文献[1−3]对这几种方法的有效性都进行了研究.
我们首先使用商业打印机制作两种打印类型的假体虹膜图像,打印机DPI(Dots per inch)设置为1 200,分别在高亮光照环境和自然光照环境下使用自制相机和Lytro 相机采集1.5 m、1.6 m、1.7 m距离时的人造假体虹膜图像,每个人造样本采集三张图像.iPad 屏显虹膜图像使用屏幕分辨率为2 048×1 536 的iPad mini 4 展示.我们分别使用两种光场相机拍摄1.6 m 距离时的iPad 人造假体虹膜图像.最终,我们采用137 张人造假体双眼膜样本图像,获得三种类型共274 个人造假体虹膜样本.
我们首先通过实验确定本文方法的关键参数,然后介绍活体检测方法的评价准则,最后在我们自主采集的光场虹膜数据库上进行实验,并对实验结果进行分析.
本文提出的虹膜活体检测方法需要利用光场重对焦技术来计算眼睛区域的立体结构特征,所以重对焦范围Ss和重对焦序列图像数量NSN的选取直接影响到立体结构特征的表达,进而影响活体检测方法的准确率.但是Ss和NSN无法根据理论和经验直接确定,所以本文通过实验的方式确定它们的最优解.
重对焦范围Ss可以表示为重对焦序列图像数量NSN与重对焦序列最小间隔∆α的乘积.
我们固定∆α不变,通过寻找Ss与活体检测准确率之间的关系来同时确定Ss和NSN.通过简单实验进行拟合,确定∆α的估计值为0.0028.图10 展示的是Ss取值分别为0.1,0.2,···,0.7 时与活体检测准确率Accuracy 的关系.实验结果表明Ss与活体检测准确率有相关性,Ss在[0.1,0.4]之间随着重对焦范围增大,准确率逐渐提升,在Ss=0.4 时准确率达到最大值94.41%,此后准确率随着Ss的增大缓慢波动.因为程序执行时间与焦栈图像数量是线性关系,Ss越大焦栈图像渲染的耗时越长.所以Ss的最优值为0.4,用于构建立体结构特征的重对焦区间为[α∗−0.2,α∗+0.2],NSN的最优值为145.
根据ISO/IEC[31]的规定,虹膜活体检测方法的评价指标为:1)Attack presentation classification error rate(APCER),表示的是把人造假体虹膜样本错误地认定为真实虹膜样本的比例;2)Bona fide presentation classification error rate(BPCER),表示的是把真实虹膜样本错误认定为人造假体虹膜样本的比例.最后本文使用平均分类错误率ACER 评价方法的整体性能.
图10 Ss与准确率Accuracy 关系曲线Fig.10 Relation curve between Ssand accuracy
平均错误率ACER 越小,说明算法整体表现越好,活体检测准确率越高.APCER、BPCER、ACER 均可以通过比较测试集真实标签和SVM分类器估计的标签得到.
由于传统方法可以直接使用光场子孔径图像进行活体检测,所以对比方法中包括了很多基于传统图像的方法,比如基于局部特征描述子的方法和基于图像质量评价的方法.对比方法使用的虹膜图像为焦栈图像中最清晰的虹膜图像.实验在自主采集的近红外远距离光场虹膜活体检测数据库上进行,将实验数据根据采集对象分为训练集和测试集,训练集包括5 人的真假虹膜图像,测试集包括9 人的真假虹膜图像,实验结果如表1 所示.
表1 中Bliinds2、BRISQUE、DIIVINE 是三种基于图像质量评价的方法,最好的DIIVINE 方法取得了89.14% 的分类准确率,11.43% 的平均分类错误率.BSIF、DSIFT、LPQ、SID、LBP、LBPV是基于局部特征描述子的方法,其中LPQ 特征描述子取得了最好的90.13% 的分类准确率,9.63% 的平均分类错误率.首次使用光场相机和重对焦策略进行虹膜活体检测的Raghavendra 等[14]方法只取得了59.54% 的分类准确率,平均分类错误率达到了41.44%.对于本文提出的方法,当单独使用归一化的立体结构特征FSF进行分类时(Ours_SF)便取得了94.41%的分类准确率,平均分类错误率为5.90%,而使用特征融合后的特征FF进行分类时(Ours_Fusion)更是取得了96.38%的分类准确率,相比最好的对比方法提升了6.25%,平均分类错误率为3.69%,降低了5.94%.因此,由实验结果可知,结构特征与纹理特征的融合对真实虹膜和人造假体虹膜有更强的区分性.
表1 虹膜活体检测方法在自主采集的数据库上的表现(%)Table 1 Performance of iris liveness detection methods on self-collected database(%)
由“质量差异”假设可知,人造假体虹膜在制作时不可避免地会丢失部分信息,因此基于图像质量评价的方法总可以取得不错的分类效果.由于实验样本为远距离采集的虹膜图像,光照明暗多变,图像采集时容易被曝光等原因产生的噪声干扰,影响部分特征描述子的特征提取,降低分类准确率.由于文献[14]中方法使用单阈值区分真假虹膜样本,无法同时应对多种攻击类型.所以在本文采集的混合攻击类型数据库中表现很差.
对于本文提出的方法,特征融合后的APCER和只使用归一化的立体结构特征的APCER 均为2.98%,一个可能原因是纹理特征误识别为真实样本的所有假体样本中,包含全部立体结构特征误识别为真实样本的假体样本,因此特征融合后APCER 无法进一步降低.而由于两类特征误识别为假体样本的真实样本之间不是此种包含关系,因此特征融合后BPCER 降低了4.41%.
由以上分析可知,本文提出的基于计算光场成像的远距离虹膜活体检测方法通过融合眼睛区域的立体结构特征和虹膜图像的纹理特征,可以有效地辨别真实虹膜和不同类型的人造假体虹膜,在所有方法中取得了最好的分类效果.
除了本文测试的三种平面假体虹膜类型,本方法对美瞳、义眼等假体类型也有区分性.美瞳和义眼等假体类型因为更接近真实人眼的结构和纹理,所以更逼真.对于平面假体样本,根据本文的实验结果,立体结构特征的区分性更强(94.41%),纹理特征的区分性相对偏弱(90.13%).而对于美瞳、义眼等假体类型,立体结构特征的区分性虽然会减弱,但纹理特征的区分性仍然很强,依然可以有效阻止此类假体攻击.因此,通过融合立体结构特征和虹膜纹理特征,本方法理论上可以有效应对所有类型的假体攻击方式.
本文提出了一种基于计算光场成像的远距离虹膜活体检测方法.通过软硬件结合的方式,使用光场相机采集虹膜图像,利用计算光场成像技术,使用硬件方法提取了眼睛区域的立体结构特征,使用软件方法提取了虹膜图像的纹理特征,并在特征层进行特征融合、分类.由于目前没有相关的数据库,因此,我们正在采集建立一个大型的近红外光场虹膜活体检测数据库,现已完成14 人的虹膜采集工作,建立了目前为止第一个中等规模的近红外光场虹膜活体检测数据库.在半受控环境下采集了真实人眼虹膜图像和打印虹膜(普通打印纸、高光相片纸)、iPad屏显虹膜两类共三种人造假体虹膜图像.实验结果表明,本方法可以对在1.6 m 距离,30 cm 景深范围内采集的实验样本取得96.38% 的活体检测准确率,3.69% 的平均分类错误率.相比最好的对比方法准确率提升6.25%,平均分类错误率降低5.94%.
本文提出的远距离、大景深、高精度的虹膜活体检测方法,通过软硬件结合的方式,使用光场相机进行虹膜图像采集;利用计算光场成像技术充分挖掘四维光场信息,获取更多有助于活体检测的信息来提升虹膜活体检测的准确率.本方法不需要使用额外的硬件采集设备,只需使用光场相机,就可以实现远距离、非接触、大景深范围的虹膜图像采集,对被采集者非常友好.本方法充分利用了四维光场信息和光场成像技术的“先拍摄,后对焦”优势,把光场重对焦技术与传统特征提取方法深度结合,可以同时提取眼睛区域的立体结构特征和虹膜的纹理特征,通过特征融合实现高准确率的虹膜活体检测,为虹膜、人脸的活体检测方法提供了新的思路.文献[14]验证了近距离情况下使用光场相机进行虹膜活体检测的可行性和有效性,本文在文献[14]的基础上通过实验证明,在远距离、大景深条件下利用计算光场成像技术,通过多特征融合能够同时应对多种攻击类型,进行高准确率虹膜活体检测.本文的不足之处是由于数据量不足,无法验证本方法对美瞳、义眼等假体类型的有效性.