基于FAST特征提取的指静脉识别

2020-04-08 06:45:22李伟剑
光学精密工程 2020年2期
关键词:欧氏识别率纹理

李伟剑,金 建, 邸 思*

(1.广州中国科学院先进技术研究所, 广东 广州 511458;2.成都理工大学信息科学与技术学院, 四川 成都 610059)

1 引 言

现有的指静脉识别算法大致分为基于细节及特征点的方法[1],基于局部模式的方法[2-3]以及基于纹理网络的方法[4-5]。基于细节及特征点的方法首先通过对图像的预处理,尽可能的突出静脉纹理部分,进而提取静脉结构中符合要求的特征点,并以此为基础进行图像匹配识别。这类方法在一定程度上综合了后两类方法的优势,发展前景较好。

日本日立公司的Yusuke Matsuda团队将图像强度轮廓的曲率用于提取特征点,并提出了一种手指形状模型和非刚性配准方法,降低了由于手指姿势变化引起的形变影响,增加了特征点的数量,提高了识别精度[6]。马来西亚马六甲信息科学与技术学院多媒体学院的Ardianto William团队提出了一种混合直方图描述符,利用二进制梯度轮廓(Binary Gradient Contours, BGC)提取纹理以及幅度分量,并使用局部直方图以确定混合纹理描述符的符号和数值的权重分布,该方法有效地降低了等误率[7]。国防科技大学的崔静团队通过采用基于Barron算子的改进Harris角点检测算法对静脉纹理中的交叉点进行检测,并通过非最大值抑制以及角点筛选方法,有效地提高了静脉纹理中角点检测的有效性[8]。山东财经大学的孟宪静团队则根据手指静脉图像对比度低、模糊等特点,利用灰度不均匀矫正增强静脉细节,在采用尺度不变性特征变换(Scale-invariant feature transform,SIFT)检测特征点的同时还考虑了潜在的特征匹配点,其发表的方法在香港理工大学手指静脉库上取得了较好的效果[9]。上述几种方法都将图像处理成灰度图后作为检测特征点的源图,尽管都采取了一些去噪、图像增强算法使静脉纹理更加突出,但图像中依然会出现一些不规则阴影以及非静脉特征,对下一步特征点的检测造成干扰。同时,上述方法以静脉纹理交点或在某一方向上具有较大曲率值的像素点作为特征点,经过刷选后,可供匹配分类的特征点可能不足,从而增大误匹配的几率。针对这些问题,本文提出基于阈值分割后的静脉纹理二值图进行特征提取,最大程度消除非静脉因素的干扰。同时采用FAST算法检测静脉纹理边缘上符合要求的像素点作为目标特征点,并将其描述成高维向量用于后续匹配。在匹配过程中,通过以特征点为中心构建圆形邻域以判断局部最优匹配质量,从而减少错误匹配对数目,最后通过综合正确匹配对个数以及平均欧氏距离两方面因素计算加权匹配距离,并以此衡量图片之间的相似程度。本文提出的方法在山东大学公开指静脉数据库(SDU-MLA)中取得了较好的识别结果,算法的有效性得到验证。

2 图像预处理算法设计

指静脉数据库中样本的采集原理是基于静脉血管相对于骨骼以及肌肉对于近红外光线吸收程度的不同,从而在图像中凸显手指静脉血管的纹路。但由于在实际采集过程中,光线的强度会对图像造成很大的影响,光线过强会导致图像中出现大块的亮斑,光线过弱又会导致静脉纹理和背景混淆。同时被采集的个体情况也有较大差异,手指的粗细程度,表层皮肤的厚度都会对采集到的图像有着很大的影响。因此对于采集到的静脉图像原始图,需要对其进行感兴趣区域(Region of interest, ROI)提取,去噪,增强,分割等处理。

由于手指轮廓边缘为横向分布,因此本文使用Sobel算子[10]纵向卷积核对手指区域进行粗提取,接着对其沿着梯度方向进行非极大值抑制,最终通过线性拟合分别拟合出手指的上下轮廓,并以此对原图进行ROI提取,结果如图1所示。从手指ROI图中可以看到,静脉的纹理较为模糊,与背景的对比度较低,如果直接进行纹理的二值化,将会丢失大部分可用的静脉信息或将背景错误的划分成静脉结构,这将严重地影响后续的匹配识别结果,因此需要对图像进行增强处理。

图1 ROI轮廓图Fig.1 ROI extracted image

图像经过增强以后,较为清晰的突出了纹理特征,但为了能够提取出整个纹理结构,进一步消除背景以及噪点等因素的影响,还需要对图像进行阈值分割。本文采用了NiBlack算法[13],利用其动态局部阈值的处理方法,可以有效的寻找到合适的阈值,二值化分割结果如图2所示。至此,图像预处理过程结束,最终获得了静脉纹理突出的二值图像。

图2 二值化分割图Fig.2 Binary segmentation image

3 特征点检测与描述算法设计

基于细节及特征点的指静脉识别方法,其基础与前提是要找到合适的特征点。本文采用了FAST算法[14-15]提取静脉纹理中的特征点。该方法通过比较像素点的灰度值进行特征点判定,降低了特征点检测的时间,可明显提高检测到的特征点数目,尤其适于对指静脉二值图的特征点检测。特征点检测结果如图3所示,相较于直接用灰度图进行特征点检测(如图4),基于二值图像检测到的特征点分布更加均匀,且都位于从背景分割出的静脉纹理轮廓边缘上。

图3 基于二值图检测Fig.3 Detection based on binary image

图4 基于灰度图检测Fig.4 Detection based on grayscale image

通过FAST算法检测到的特征点只包含了位置信息,无法直接用于匹配识别,必须根据一定的规则对特征点进行向量化描述。本文将计算特征点邻域梯度值以及方向,并以此构建梯度直方图用以描述特征点。在特征点检测过程中,我们构建了一个直径为7 pixel的圆形区域,为了保持一致性,在描述时依旧以直径为7 pixel来计算邻域像素的梯度值和方向。设像素点P的坐标为(x,y),其梯度的模m(x,y)以及方向θ(x,y)的计算公式如下:

(1)

(2)

其中L表示高斯尺度空间,是由图像和高斯函数G(x,y,σ)进行卷积计算得到。由于高斯滤波器的主要响应范围在6σ内,又因为特征点描述的邻域直径为7 pixel,因此这里的σ=1.17。

计算得到梯度方向以后,使用直方图统计特征点邻域内像素对应的梯度方向和幅值。构建一个方向直方图,其横轴是梯度方向的角度大小,纵轴是梯度方向对应梯度幅值的累加。方向直方图的峰值即代表了特征点的主方向。为了保持描述向量的旋转不变性,要以特征点为中心,在附近邻域内将坐标轴旋转θ(特征点的主方向)角度,即将坐标轴旋转为特征点的主方向。旋转后以特征点为中心取16×16的窗口,并将其分成16个4×4的小块,同样构建方向直方图,但以每45°为一个区间,这样每个小块有8个方向的梯度强度信息。因此最终每个特征点可以得到128维的特征描述向量。

4 匹配算法设计

传统的特征点匹配过程中,一般以欧氏距离衡量两个特征点之间的相似度,令n表示两幅图像之间成功匹配的特征点对数,通常以n的大小来衡量两幅图像的相似度。在特征点匹配过程中,由于静脉二值图像存在相似特征点,若特征点之间只以最小欧氏距离来判断是否匹配成功,将会导致大量错误匹配。本文将相应的改进匹配策略,减少错误匹配对数,同时综合两幅图像之间的平均欧氏距离以及成功匹配的特征点对数,构建衡量两幅图像相似度的匹配距离。

用di,j表示测试图像中的特征点向量i与数据库图像中的特征点向量j之间的欧氏距离,

(3)

其中:i∈[1,N1],j∈[1,N2]。

对于测试图像中的特征点I(x1,y1),在数据库图像中构建以相同的坐标点(x1,y1)为圆心,以r为半径的圆形邻域OI,若数据库图像中在该圆形邻域内存在m个特征点,分别计算测试图像中的特征点向量i与数据库图像中这m个特征点向量之间的欧氏距离,若其中最小欧氏距离为dip,则dip为局部最优匹配。接着对数据库图像中的所有非圆形邻域OI内的(N2-m)个特征点进行计算,若其中最小欧氏距离为diq,则diq为全局最优匹配。若dip=diq,则认为测试图像中的特征点I和数据库图像中的特征点P是正确匹配对。若dip≠diq,则认为对于测试图像的特征点I,数据库图像中没有相对应的匹配点。

由于在图像预处理步骤中已经精确的提取了每一幅指静脉图像的ROI区域,因此对于同源的指静脉图像,即使在图像提取过程中存在一定程度的平移或旋转,匹配的特征点点对的坐标位置也应处在一个相近的区域范围内。而对于异源的指静脉图像,其局部最优匹配通常并非是全局最优匹配,因此基于圆形邻域进行匹配判定可以最大程度减少异源图像之间的匹配对数目n。同时,本文将测试图像与训练图像之间所有判定为正确匹配对的平均欧氏距离也纳入相似度的评判范畴,因为对于异源指静脉图像来说,即使存在某些局部最优匹配恰好也为全局最优匹配的情况,其对应的平均欧氏距离也将大于同源图像之间正确匹配对的平均欧氏距离。两幅图像之间的匹配距离D定义如下:

(4)

5 实验与结果

本文提出的方法将在SDU-MLA(山东大学机器学习与数据挖掘实验室)公开的指静脉数据库上进行评估,SDU-MLA手指静脉数据库是同源多模态特征(SDUMLA-HMT)的一个子集数据库[16]。 该数据集是来自于106个受试者,每个受试者分别采集双手的食指,中指和无名指,每个手指采集6幅图像。因此,实验中使用的数据集包含636根手指,3 816幅图像。本文采用第2节所述方法将数据库中所有图片处理成二值化图像,并将图像统一裁剪成180×80的尺寸再进行后续的测试。

5.1 邻域半径r的选择

对于SDU-MLA数据集中的636类手指,统一选择每一类的第3幅图片作为测试样本,每一类的其它5幅作为训练样本,测试集中共有636幅图片,训练集中共有3 180幅图片。分别以图片高度的5%(4 pixel)作为起始半径和递增步长来设置r,同时将r的最大测试范围设定为图片高度的一半(40 pixel),即r=4,8,12,...,40。其不同的r值相对应的识别率(Rank-1 Recognition Rate)如图5所示。可以看到当r=24时识别率达到峰值,r的值大于或者小于24时,识别率都会有一定程度的下降。本文主要关注算法在数据集上的识别率等相关指标,因此后续的评估都将基于r=24进行。

图5 不同r对识别率的影响Fig.5 Recognition rate of different r

5.2 识别模式和验证模式的性能测试

在识别模式下,假设一幅手指静脉图像的来源未知,需要利用这幅图像识别注册者的身份。本文将在每一类图像中随机抽选一幅图像作为测试图像,剩下的5幅图像作为训练图像。相应地在数据库的测试集中有636幅图像,数据库中的训练集有3 180幅图像。具体的实验过程为,将测试集和训练集的所有图像经过图像预处理和阈值分割,生成二值化图像,并使用特征点提取和描述算法,将二值化图像转化为128维向量。取出测试集中的一个样本,根据公式(4)计算其与测试集中每一个样本的匹配距离,若其匹配距离最小的测试集样本对应的类别与该训练样本的类别一致,则认为该测试样本识别成功。对测试集中的636个样本进行相同的匹配识别操作,统计其识别率。重复上述实验10次,在MLA数据集上的平均识别率以及达到100%识别率时的平均最低序[17]如表1所示。从识别模式下的实验结果已经可以看出,本文提出的方法具有可靠性。

表1 识别模式下实验结果

图6展示了本文方法的受试者工作特征曲线(Receiver Operating Characteristic, ROC)。通过验证模式的结果可以看出,通过本文提出的图像处理及匹配算法,能够较好地区分出同源与异源图像。

图6 受试者工作特征曲线Fig.6 Receiver operating characteristic

通过将识别错误的测试图像和所对应类别的训练图像以及误分类的训练图像进行比对,发现导致出现识别误差的因素有:(1)个别测试图像在采集时出现了较大的平移或旋转,使得在经过图像预处理以及阈值分割以后,生成的二值图像与同类别的其它图像有着较大差异,超过了匹配识别算法可以弥补的平移旋转范围,以至于出现了错误匹配。(2)个别测试图像采集时手指处于弯曲状态,导致有部分手指部位不在相机的焦距范围内,由此采集图像的一些位置会出现大范围阴影,覆盖了静脉纹理网络,使得与正常采集的同类其他图像产生较大不同,无法得到正确识别结果。通过上述分析可知,出现识别误差的主要原因是由于采集时的一些错误导致测试图像与其对应类别的训练图像有着较大差异。

5.3 和现有类似方法的比较

5.2小节分别从识别模式和验证模式下展现了本文提出方法的有效性,本小节通过与本文提出方法相类似的方法进行比较,在相同的数据集上进行相关性能参数对比。与本文进行比较的有基于FAST+BRIEF的方法[18]以及基于传统SIFT的方法[19],比较结果如表2所示。其中,识别率的比较基于相同的测试集和训练集,测试集和训练集的划分方法如5.1小节所述。不同方法的EER按照5.2小节中验证模式所述方法进行计算。图7展示不同方法的ROC曲线。通过以上的比较可以看出,本文提出的方法在识别率和EER上都取到了更好的结果。

表2 不同方法的结果比较

Tab.2 Performance for different methods

MethodRecognition rateEERFAST+BRIEF0.8780.133SIFT0.9660.063Proposed method0.9930.019

图7 不同方法的ROC曲线Fig.7 ROC of different methods

6 结 论

现有的指静脉识别方法通常以包含静脉分布的灰度图为对象进行算法设计,但其中存在的灰度不均匀以及所包含的非静脉纹理结构常常对识别结果产生不利影响。因此,本文提出了基于包含静脉分布的二值图像的指静脉识别算法。该方法采用非极大值抑制的FAST算法用以检测特征点,并对其进行向量化描述。进而提出在圆形邻域内进行特征点匹配并考察其匹配质量。通过综合两幅图像之间的平均欧氏距离以及成功匹配的特征点对数,构建衡量两幅图像相似度的匹配距离,并据此给出匹配结果。针对SDU-MLA数据库的测试结果表明,本文提出的指静脉识别方法的识别率为0.993,EER为0.019 6,其识别结果优于常见的特征提取与识别方法。

猜你喜欢
欧氏识别率纹理
基于BM3D的复杂纹理区域图像去噪
软件(2020年3期)2020-04-20 01:45:18
基于类图像处理与向量化的大数据脚本攻击智能检测
计算机工程(2020年3期)2020-03-19 12:24:50
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
使用纹理叠加添加艺术画特效
提升高速公路MTC二次抓拍车牌识别率方案研究
TEXTURE ON TEXTURE质地上的纹理
Coco薇(2017年8期)2017-08-03 15:23:38
高速公路机电日常维护中车牌识别率分析系统的应用
消除凹凸纹理有妙招!
Coco薇(2015年5期)2016-03-29 23:22:15
基于多维欧氏空间相似度的激光点云分割方法
丽江“思奔记”(上)
探索地理(2013年5期)2014-01-09 06:40:44