(辽宁工业大学电子与信息工程学院,辽宁锦州 121001)
手背静脉因同时具有内部特征、非接触式采集、特定光源、活体识别等优势[1]逐渐受到越来越多人的关注,进而成为生物特征识别的研究热点问题之一。
提取出有效的静脉特征是实现准确识别的重要保证,而许多学者也针对该问题展开了较为深入的研究。目前,已有的静脉图像特征提取方式大体可分为以下两种:一是直接对采集的灰度静脉图像进行特征分析;二是对二值静脉图像中的脉络结构特征进行提取。由于静脉图像特征主要体现在静脉的方向上,而静脉的方向是由图像中的高频信息体现出来,因此,许多学者基于多尺度波变换思想对灰度静脉图像展开了分析,其中包括传统的小波变换[2]、带有方向性信息的条带波(Bandelet)变换[3]、轮廓波(Curvelet)变换[4]、Gabor 变换[5-7]、Gabor 变换编码[8-9]等;除波变换思想外,一些多尺度点特征也被证明是较为有效的,如尺度不变特征变换(Scale-Invariant Feature Transform,SIFT)[10]、加速鲁棒特征(Speeded Up Robust Feature,SURF)[11]、梯度直方图特征[12-13]等;近年来,随着处理器计算能力的大幅度提升,深度卷积神经网络[14-16]也被更多地应用在静脉识别中,并取得较好的识别效果;此外,一些基于灰度统计分布的识别算法也被验证是十分有效的,如图像强度分布[17]、稀疏表示[18]等。而二值静脉图像特征提取方式主要是针对静脉图像局部特征展开的,主要包括交叉点与端点位置特征[19]、特征点间结构关系[20]、二值静脉曲线信息编码[21-25]等,这些提取的二值静脉特征也成为了灰度静脉图像的重要补充。
以上两种思想的识别算法在某一数据集下可以取得较好的识别效果,但当更换静脉图像采集设备即更换数据集时,源数据集下获得的识别算法有效性将会出现明显下降。因此,本文基于迁移学习思想,提出了一种孪生非负矩阵分解(Nonnegative Matrix Factorization,NMF)模型。该模型除了考虑识别准确率外,而且还添加了迁移性约束,从而提高了识别算法对于多种静脉图像采集设备的普适性。实验结果表明,本文的算法可同时在多个静脉数据集中取得良好的识别性能。
对于图像识别问题,通过数据降维找到一组有效的特征基是十分关键的,而常用的有效降维方法主要包括主成分分析法、局部保持投影法等,它们的分解结果没有符号约束,既可以是正的,也可以是负的。但对于图像处理问题来说,在降维获得的基图像中,像素值不允许出现负值,因此,这里选择NMF模型去实现图像特征的降维,NMF思想如式(1)所示:
其中:F表示原始特征矩阵;U与V分别表示分解后的基矩阵与系数矩阵。
与一般的图像分类问题不同,静脉识别是采用图像匹配的方式进行身份认证的,属于单样本或少样本学习,也就是说对于每一个静脉对象来说,没有足够多的样本供机器去学习与训练,传统的训练学习模式难以适用。孪生网络近年来在衡量数据相似性上表现出了良好的效果[26],因此,针对静脉识别问题,这里将NMF 与孪生网络思想相结合,提出了一种孪生非负矩阵分解模型。
该模型将从源数据集中挑选出n对静脉图像,其中每一对图像表示同一对象,并将每一对图像拆分到两个子集中;而后,利用文献[13]中的特征提取方法,获取初始特征,从而形成孪生NMF模型的初始目标函数,如式(2)所示:
其中:Fk为第k个子集的初始特征矩阵,其中每一列为静脉图像的初始特征;Vk为分解系数矩阵,即每一列为静脉图像新的特征向量;U为特征基矩阵,这里两个NMF 模型的U是相同的,U为共享特征基。所提算法的目的就在于通过模型求解,能够获得一组最优的共享特征基U*,如式(3)所示。
根据模式识别理论,表示同一目标的图像之间应具有相似的特征向量;同样,提出的孪生NMF 模型除非负性要求以外,也应让两幅表示同一静脉的图像经过分解后,得到相似的特征向量。基于以上分析,有必要在目标函数中增加一个损失函数Em,提高特征的相似性,进而保证匹配的准确性,改进的目标函数如式(4):
式(4)中α为平衡因子。
由于初始特征矩阵F1与F2所表示的图像来源于同一数据集,使得优化得到共享特征基U*能够较好地适用于该源数据集,但很难保证是否能够适用于其他数据集,即共享特征基U*缺少普适性。针对以上问题,所提的模型将迁移学习思想引入到该模型中,即通过降低源数据集与目标数据集中静脉图像的特征分布差异,实现特征从源数据集到目标数据集的迁移,这里,最大平均差异(Maximum Mean Discrepancy,MMD)[27]度量损失函数Et被添加到目标函数中,用来保证特征的迁移性,目标函数可被进一步改进为式(6):
式中:β为平衡因子;当k=3时,F3为目标数据集中挑选图像的初始特征矩阵,c为挑选图像的数目;而当k=1,2时
综上,本文提出的识别模型结构如图1所示。
图1 迁移孪生NMF模型结构Fig.1 Structure of Siamese NMF mode with transferability
为方便对目标函数求解,可将目标函数做如下转换,即增加辅助向量A与B,如式(8)、(9),Et如式(10),而目标函数可进一步转化为式(11):
而后,分别对U、V1、V2、V3求偏导数,结果如式(12)~(15):
而后,根据文献[28]确定变量的迭代规则,如式(16)~(19):
确定变量的迭代规则后,由算法1 获得最优的共享基矩阵U*。
算法1 求解共享基矩阵U*算法。
输入:初始特征矩阵F1,F2,F3,平衡因子α与β;
输出:最优共享基矩阵U*。
2)按照式(16)~式(19)进行参数迭代;
3)如果|J(t+1)-J(t)|<e或t>Nmax,输出结果;否则,进入4),J(t)=J(U(t),V1,(t),V2,(t),V3,(t));
4)t=t+1,进入2);
优化得到共享基矩阵U*后,将对静脉图像进行匹配,匹配过程如算法2所示。
算法2 静脉图像匹配算法。
输入:两幅待匹配的静脉识别图像I1与I2。
输出:如果d(v1,v2) >ξ,两幅图像表示同一静脉;否则,表示不同静脉。这里,ξ为相似性阈值。
1)提取两幅静脉图像的初始特征向量f1与f2;
2)利用式v=(U*TU*)-1U*Tf获得两幅静脉图像特征v1与v2;
3)计算两幅静脉图像特征向量的余弦距离d(v1,v2)=
为证明式(16)~(19)的迭代是收敛的,需要各自引入一个合适的辅助函数,这里辅助函数的定义如下。
定义1如果式(20)成立,则定义G(h,h′)是H(h)的辅助函数。
由于式(21)成立:
因此,如果存在合适的辅助函数,便可证明式(16)~(19)的迭代过程是收敛的。
假定目标函数J中U为独立变量,求J对U的一阶与二阶偏导数,如式(23)与式(24)。
引理1如果令U为独立变量时,式(25)可被定义为J的辅助函数。
证明 由于G(u,u)=J(u),只需证明G(u,uij)≥J(uij)。根据泰勒级数可以得到式(26):
又因为式(27)成立:
假定目标函数J中V1为独立变量,求J对V1的一阶与二阶偏导数,如式(28)与式(29)。
引理2如果令V1为独立变量时,式(30)可被定义为J的辅助函数。
证明 由于G(v,v)=J(v),只需证明根据泰勒级数可以得到式(31):
又因为式(32)成立:
此外,容易得到引理2同样适用于V2为独立变量的情况,因此,式(18)的收敛性证明略。
假定目标函数J中V3为独立变量,求J对V3的一阶与二阶偏导数,如式(33)与式(34)。
引理3如果令V3为独立变量时,式(35)可被定义为J的辅助函数。
证明 根据泰勒级数可以得到式(36):
又因为式(37)成立:
综上,可以证明式(16)~(19)的迭代过程是收敛的。
本实验选取了4 个静脉图像数据集,分别为:1)数据集D1,自建手背静脉数据集,数据集下载地址为https://pan.baidu.com/s/1jIGLSEy;2)数据集D2,文献[29]中采用的手背静脉图像数据集;3)数据集D3,指静脉数据集,数据集下载地址为http://more.datatang.com/data/44299;4)数据集D4,文献[30]中指静脉数据集。所有数据集共包含475 个静脉对象,其中,每个数据集中的样本如图2所示。
图2 不同数据集中样本Fig.2 Samples in different datasets
该实验是在PC 上运行的,配置如下:处理器Intel Core i5-4460 CPU 3.2 GHz,内存16 GB,运行环境Matlab 2017b。
本文的模型参数设定方式可分为两种,分别为依据经验设定与基于实验结果设定。
1)在提出的模型中,将依据经验设定以下参数,手背静脉图像归一化为128× 128;指静脉图像归一化为128× 64;误差阈值e=0.1;最大迭代次数Nmax=30 000;源数据集选择样本数量n=300,目标数据集选择样本数量c=30。
2)除经验参数外,分解后的特征维度r,目标函数平衡因子α与β将通过实验获得,即通过不同参数组合下的实验结果比较,获得能够使识别性能达到最优的参数组合。这里,识别性能将由源数据集的错误接受率(False Accept Rate,FAR)与错误拒绝率(False Reject Rate,FRR)来衡量,其中FAR 为实验中表示不同静脉对象的图像被误认为是同一静脉对象的概率,而FRR 为表示同一静脉对象的图像被误认为是不同静脉对象的概率。而在本文实验中,衡量识别性能的函数将由式(38)表示:
其中:Fk=的标签。
而后,分别给出不同参数的取值范围,令α∈{0.1,0.5,1,5,10},={0.2,0.3,…,0.7},由于目标函数中Em表示n对静脉图像特征的差异,而Et表示平均特征的差异,因此取β=nα是合理的。这里,不同参数组合下的识别算法性能比较结果如图3所示。
图3 不同参数组合下的识别性能Fig.3 Recognition performances under different parameter combinations
由图3 可以看出,当维度降至初始特征维度的40%,且α=1 时,本文的模型可获得最优的识别性能。这里,算法2中的相似性阈值ξ同样是依据式(38)优化得到,即通过不断调整阈值,获得能够使式(38)得到最小值,而不同阈值条件下的识别性能结果如图4所示。
图4 不同阈值下的识别性能Fig.4 Recognition performances under different thresholds
由图4可以看出,当阈值ξ=0.873时,可以得到最优的识别性能。
确定了模型参数后,这里将对算法的迁移性进行分析,即通过对比包含迁移约束的模型与不包含迁移约束的模型之间的特征分布,来验证提出的模型中迁移性约束项的必要性,结果如图5所示。
图5 中,数据集1 与数据集3 为源域,数据集2 与数据集4为目标域,图中每一点分别表示NMF 降维后的特征经过主成分分析后,选取的前两项主成分特征。由图5 可以看出,当模型包含迁移项约束后,源域与目标域的特征分布是非常相似的,即验证了模型中迁移性约束项的必要性。
图5 迁移约束项对特征分布的影响Fig.5 Influence of transfer constraint on feature distribution
验证了迁移约束项的有效性后,将提出的识别算法分别与文献[8,13,15-16]中的识别算法进行比较。首先,令训练数据与测试数据来源于同一数据集,仍采用FRR 与FAR 作为衡量识别算法性能的指标,算法比较结果如表1 所示,表中数据为针对4个数据集实验的平均结果。
表1 样本来自同一数据集时的实验结果比较Tab.1 Comparison of experimental results when the samples come from the same dataset
算法识别准确性对比之后,将对算法的迁移性能进行比较,即训练与测试数据来源于不同数据集,结果如表2 所示。表2中,D1 →D2表示D1为训练数据集,D2为测试数据集。
表2 样本来自不同数据集时的实验结果比较Tab.2 Comparison of experimental results when the samples come from different datasets
由表1~2 可以看出,当训练数据与测试数据来源于同一数据集时,这些算法都可以取得较好的识别效果,FAR与FRR基本可以控制在0.05 以下;然而,当训练数据与测试数据来源于不同数据集时,已有算法的识别性能出现了较大幅度的下降,而本文提出的算法在训练时有少量目标数据集中的无标注样本参与,通过MMD约束减小了数据集之间的特征分布差异,算法对于目标数据集仍具有较好的识别效果,可以看出,本文的算法较好地将源数据集中的知识迁移到了目标数据集中,使得本文的算法获得的特征更具普适性。本文提出的识别算法运行时间0.56 s,能够较好地满足识别的实时性要求。
本文提出的基于孪生NMF 的识别算法同时考虑了误差损失、分类损失与迁移损失,获得了具有普适性的静脉特征,不仅使识别算法能够针对某一数据集取得较高的准确识别率,而且可以通过目标数据集中的少量样本,让源数据集中的特征同样适用于目标数据集,即模型具有较好的迁移特性,对于其他图像匹配问题具有一定的借鉴价值。本文研究仍存在一定问题有待解决,如数据集样本数量有待增加,从而才能更好地验证算法的有效性。