刘 博 王靖亚
随着人工智能和计算机视觉的快速发展,人脸识别已成为一种重要的生物特征识别技术。目前一般的人脸识别方法已经取得了优异的性能,甚至在一定条件下超越了人类①HE K,ZHANG X,REN S,SUN J.Deep Residual Learning for Image Recognition. IEEE Conference on Computer Vision and Pattern Recognition,NJ:IEEE,2016,pp.770-778.②Krizhevsky A,Sutskever I,Hinton G E.ImageNet classification with deep convolutional neural networks.Communications of the ACM,2017,60(6):84-90.。尽管一般人脸识别取得了显著的成功,但由于人脸识别技术受个体年龄、表情、姿态等多方面因素影响依然面临着极大的挑战。2015 年Chen 等③CHEN B C,CHEN C S,HSU W H.Face recognition and retrieval using cross-age reference coding with cross-age celebrity dataset.IEEE Transactions on Multimedia,2015,17(6):804-815.的研究显示在跨年龄识别任务中一般人脸识别模型的正确率会降低13% 以上。因此,在寻找长期失踪人口、排查潜逃多年的犯罪嫌疑人等实际应用中如何将年龄变化的影响最小化是一个不可避免的挑战。跨年龄人脸识别在以下方面仍然极具挑战性。首先,在跨年龄人脸识别中,当年龄差距较大时,年龄变化会主导面部外观,从而显著影响人脸识别性能。其次,目前获得大规模的同一身份各个年龄段均有图片并且年龄段跨度较大的人脸数据集是极其困难的。
为了解决上述问题,现有的两种跨年龄人脸识别方法是生成模型和判别模型。生成模型①Lanitis A,Taylor C J,Cootes T F.Toward automatic simulation of aging effects on face images,IEEE Transactions on pattern Analysis and machine Intelligence,2002,24(4):442-455.②Park U,Tong Y,Jain A K.Age-invariant face recognition,IEEE transactions on pattern analysis and machine intelligence,2010,32(5):947-954.提出合成不同年龄的人脸图像来辅助人脸识别。一些研究旨在利用强大的基于生成对抗网络③Goodfellow I,Pouget-Abadie J,Mirza M,et al.Generative adversarial nets, Advances in neural information processing systems,2014,27.的模型来提高生成的老化人脸的质量。然而,使用生成模型进行人脸识别通常分为两步,首先通过生成模型将人脸建模到某一个或多个年龄类别,其次通过面部特征进行人脸识别。因此生成模型无法以端到端的方式优化模型性能,并且准确地模拟人脸老化过程也是困难和复杂的,合成人脸中的额外的噪声会严重影响人脸识别的性能。因此,越来越多的研究集中于对判别模型的改进。
判别模型主要思想是从混合的人脸信息中剔除年龄相关特征,提取出年龄不变的身份特征,减小年龄因素对人脸识别的影响。早期的方法大多数使用局部描述符进行人脸特征的提取。Ling 等④Ling H,Soatto S,Ramanathan N,et al.Face verification across age progression using discriminative methods, IEEE Transactions on Information Forensics and security,2009,5(1):82-91.结合梯度方向金字塔(Gradient orientation pyramid,GOP)与支持向量机(Support vector machine,SVM)提取到年龄不变特征,实现了对不同年龄段的人脸验证。Gong 等⑤Gong D,Li Z,Lin D,et al.Hidden factor analysis for age invariant face recognition,Proceedings of the IEEE international conference on computer vision.2013:2872-2879.提出了一种基于隐藏因子分析(Hidden factor analysis,HFA)的年龄不变人脸识别方法。他们将人脸图像建模为两个因子的组合:身份因子和年龄因子。身份因子捕捉人脸的个体特征,相对稳定;而年龄因子则代表由于年龄变化而引起的差异。通过矩阵分解这两个因子并获得年龄不变的人脸表征。之后,提出了一种最大熵特征描述符用于年龄不变人脸识别,它具有更高的表达能力,因此可以产生比传统特征提取器具有更多区别信息的表示。Chen 等提出了一种称为跨年龄参考编码(Cross age reference code,CARC),该方法利用稀疏编码技术与参考字典将目标人脸图像编码为参考样本的线性组合,从而提取出对年龄变化不敏感的判别特征。尽管这些方法在一定程度上提高了年龄不变人脸识别的准确性和鲁棒性,但仍然存在一些挑战和待解决的问题。例如,如何处理非线性的年龄变化模式。深度学习在学习非线性特征映射函数方面性能优越。
其中基于卷积神经网络(convolutional neural network,CNN)⑥LeCun Y,Boser B,Denker J,et al.Handwritten digit recognition with a back-propagation network, Advances in neural information processing systems,1989,2.的判别方法在年龄不变人脸识别中取得了较好的结果。Wen 等⑦Wen Y,Li Z,Qiao Y.Latent factor guided convolutional neural networks for age-invariant face recognition,Proceedings of the IEEE conference on computer vision and pattern recognition.2016:4893-4901.利用潜在因子引导卷积神经网络(latent factor guided convolutional neuralnetwork,LFCNN)将HFA 扩展为深度学习框架。Zheng 等⑧Zheng T,Deng W,Hu J.Age estimation guided convolutional neural network for age-invariant face recognition,Proceedings of the IEEE conference on computer vision and pattern recognition workshops.2017:1-9.认为可以通过年龄回归任务得到显性年龄特征,因此提出了年龄估计任务引导下的跨年龄人脸识别模型(AE-CNN)。Wang 等⑨Wang Y,Gong D,Zhou Z,et al.Orthogonal deep features decomposition for age-invariant face recognition,Proceedings of the European conference on computer vision.2018:738-753.认为人脸上的年龄特征与身份特征是正交无关的,于是提出一种正交嵌入CNN(Orthogonal Embedding Convolutional Neural Network,OE-CNN)模型,该模型将CNN 网络提取出来的人脸特征通过正交分解的方式分解为年龄特征与身份特征。Wang 等⑩Wang H,Gong D,Li Z,et al.Decorrelated adversarial learning for age-invariant face recognition,Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition.2019:3527-3536.提出了去相关对抗学习(Decorelated Adversarial Learning,DAL),利用对抗的方式和批典型相关性分析(BCAA)思想提取出不相关的年龄特征与身份特征。Lee等①Lee J,Yun J,Park S,et al.Improving face recognition with large age gaps by learning to distinguish children.arXiv preprint arXiv:2110.11630,2021.人提出了一个原型间损失来最小化儿童面孔之间的相似性。Hou 等②Hou X,Li Y,Wang S.Disentangled representation for age-invariant face recognition: A mutual information minimization perspective,Proceedings of the IEEE/CVF International Conference on Computer Vision.2021:3692-3701.和Xie 等提出最小化同一个人的人脸图像中与身份和年龄相关的分量之间的相互信息,以减少年龄变化的影响。为保留更多的身份信息,文献③Z.Huang,J.Zhang and H.Shan,"When Age-Invariant Face Recognition Meets Face Age Synthesis:A Multi-Task Learning Framework and a New Benchmark," in IEEE Transactions on Pattern Analysis and Machine Intelligence,vol.45,no.6,pp.7917-7932,1 June 2023,doi:10.1109/TPAMI.2022.3217882.使用多任务学习框架(Multi-task Learning Framework,MTLF),在高层语义特征空间使用注意力机制约束分解年龄与身份特征。
年龄的变化不仅体现在面部形态的变化,还体现在面部的细节之处(如鼻唇沟稍加深、面部中间稍后陷)。目前大多数深度学习模型是从高层混合特征中分解出年龄特征,进一步使用正交分解或线性分解得到身份特征,但是高层混合特征对细节的感知能力较差,从而导致提取的年龄特征丢失了细节信息,进一步使身份特征依然含有年龄信息。并且特征解耦时,混合特征是高级特征具有很高的语义信息,年龄特征与身份特征严重纠缠其中,并不完全呈线性或正交关系。
基于对前人工作的分析与总结,本文提出一种新的单网络端到端训练的跨年龄人脸识别模型AM-FPN(Age Mask Feature Pyramid Network)。AM-FPN 主要由特征金字塔提取模块、掩码分解模块和多任务训练模块三部分组成。采用特征金字塔网络中的上采样提取混合人脸特征,并在下采样中加入空间注意力机制,融合低维和高维特征提取具有多维度年龄信息的年龄特征。通过本文提出的掩码分解模块中掩码生成器与特征相乘机制,将提取器所得年龄特征映射到年龄掩码空间,自动学习身份特征与年龄特征相关性。同时为了提高模型解耦效果,引入年龄估计损失函数、身份损失函数和跨年龄域对抗训练损失函数来提高模型鲁棒性。
本文模型主要贡献:1.引入特征金字塔结构同时提取混合和年龄特征。前人研究成果是使用CNN提取人脸混合特征,之后使用注意力机制等方式从混合人脸特征中分离年龄特征,这种方式提取的年龄特征缺少对细节的感知。使用特征金字塔结构中的上采样融合不同层人脸特征图,增强了所提年龄特征对细节的感知能力。2.提出年龄掩码分解模块用于解耦身份特征。前人成果认为年龄特征与身份特征成线性或正交关系,但具体是什么关系并不确定。掩码分解模块会自动学习身份特征与年龄特征相关性。3.与前人成果相比,提高了跨年龄人脸数据集上的人脸识别准确率。
如图1 所示,AM-FPN 沿用文献端到端的网络思想,主要由特征金字塔提取模块、掩码分解模块和多任务训练模块三部分组成。特征金字塔提取器采用自顶向下的架构,横向连接构建金字塔特征。与遮挡人脸识别类似,AM-FPN 采用了基于ResNet50 架构的LResnet50E-IR 作为骨干网络的主体部分,并对LResnet50E-IR 进行改进,在其横向连接处添加空间注意力模块(Spatial Attention,SA),以及在输出位置添加映射模块(Map)。掩码分解模块是将提取出来的年龄特征通过掩码生成器(Mask Generator)生成年龄掩码,之后与骨干网络提取的混合人脸特征进行相乘得到不随年龄变化的人脸特征。多任务训练模块主要使用跨年龄域对抗训练、年龄估计任务和身份识别任务来共同监督特征分解。
图1 整体模型图
AM-FPN 模型对混合人脸特征进行深度解耦生成年龄不变人脸特征。具体来说,将训练数据分批量输入模型,人脸图像通过特征金字塔提取器中的下采样方式,提取出不同层次的混合人脸特征图(X1、X2、X3)。其次,经过二倍下采样的X1(C1)与经过一维卷积和空间注意力机制后的X2 相加得到C2。同样,将经过二倍下采样的C2 与经过一维卷积和空间注意力机制后的X3 相加得到C3。然后,将提取出的年龄特征图通过映射模块映射到混合人脸特征空间。之后,使用掩码生成器去除共有特征生成年龄掩码,将掩码与混合人脸特征图相乘,从而剔除年龄信息得到不随年龄变化的身份特征图。之后,不随年龄变化的身份特征图经过多层感知机生成身份特征向量。使用身份特征向量进行损失函数计算以及反向传播更新模型参数。身份特征向量就是模型解耦得到的年龄不变人脸特征,将梯度反转层(GRL①Ganin Y,Ustinova E,Ajakan H,et al.Domain-adversarial training of neural networks.The journal of machine learning research,2016,17(1):2096-2030.)融入多任务训练策略是为了进一步提高模型解耦效果。
在传统的CNN 中,随着网络的层数增加,特征图的分辨率逐渐减小,而感受野逐渐增大,这导致网络对于细节的感知能力下降。如图2 所示,FPN 通过在网络中添加横向连接来构建特征金字塔。具体而言,它在网络的上层和下层之间添加了额外的连接,使得上层的粗粒度特征可以通过这些连接传递到下层。因此网络就能够同时获取高层和低层的特征信息,从而在不同尺度上实现更好的感知能力。为了增强年龄提取模块对年龄特征的感知能力,对FPN 网络结构进行改进,在其横向连接处引入SA 模块。SA 模块运用空间注意力机制建模卷积特征空间的相互依赖性来提高网络的特征提取能力。在特征空间进行校准的机制,使网络从全局信息出发来提升有价值的特征并且抑制对任务无用的特征。
图2 改进后的特征金字塔提取器
特征金字塔提取的年龄特征图大小为28×28×256,但是混合人脸特征大小为7×7×512。因为年龄特征与混合特征需要在相同大小的特征空间中进行掩码分解,所以使用Map 模块将年龄特征映射到与混合人脸特征相同大小的特征空间中。Map 模块是由两个3×3 卷积层、PReLU 和BN 层共同组成。
由于混合的面部表征严重纠缠于面部形状和纹理变化等不相关信息,这些信息会引发较大的类内变化,导致对同一个体不同年龄的一对面孔识别错误。所以由改进后的LResnet50E-IR 提取的人脸特征可以看作身份特征和年龄特征共同纠缠的混合特征。目前一般使用线性组合或正交的方式模拟年龄与身份的关系,但这两种方法在处理高级语义特征时过于简单粗暴,难免会导致年龄信息并不能完全剥离。受遮挡人脸识别的启发,本文提出了一种年龄掩码的方式对身份特征和年龄特征进行建模,我们将掩码分解定义为:
其中xid和xage分别表示身份特征与年龄特征,x表示人脸混合特征,·表示逐特征相与,f表示掩码函数。本文设计了类似于注意力机制的年龄掩码分解模块实现将年龄特征从混合特征中剥离。其表达式为:
其中R是特征映射函数,S是sigmod函数。当S(xage)等于特定值时,掩码分解模块将会学到复杂组合,所以掩码分解模式可以学到线性模式、正交模式和其他复杂模式。从模型角度来说,首先将融合了各特征层信息的X3通过映射函数R获得与混合特征相同特征空间的高级语义年龄特征,之后经过掩码器M生成年龄掩码与混合人脸特征逐特征相乘,获得不含年龄信息的身份特征。
本文使用年龄估计任务、人脸识别任务和跨年龄域对抗训练来监督特征分解。为了挖掘年龄特征,本文遵循文献①Z.Huang,J.Zhang and H.Shan,"When Age-Invariant Face Recognition Meets Face Age Synthesis:A Multi-Task Learning Framework and a New Benchmark," in IEEE Transactions on Pattern Analysis and Machine Intelligence,vol.45,no.6,pp.7917-7932,1 June 2023,doi:10.1109/TPAMI.2022.3217882.对年龄分组的做法,将年龄按照10 年为一间隔划分为7 个年龄组。年龄估计网络具有512 和101 个神经元的两个线性层,用于实现类似于(DEX)的年龄回归,通过计算softmax 期望值来学习年龄分布。其次在年龄估计网络上附加另一个线性层,使用交叉熵损失进行年龄分类,对学习分布正则化。年龄损失可表示为,真实年龄标签与年龄回归预测标签的交叉熵损失加上真实年龄组与年龄估计网络的交叉熵损失。
对于身份特征的学习,本文使用线性层l提取长度为512 的特征向量xid,并采用CosFace②Wang H,Wang Y,Zhou Z,et al.Cosface: Large margin cosine loss for deep face recognition,Proceedings of the IEEE conference on computer vision and pattern recognition.2018:5265-5274.损失函数增大类间距离,减小类内距离,监督xid地学习以进行身份分类。身份识别损失函数可表示为,512特征向量与真实身份标签的交叉熵损失。
其次引入跨年龄域对抗学习,通过使用梯度反转层(GRL)的连续域适应,提升xid的年龄不变性。综上所述,年龄不变人脸识别在多任务学习框架下的最终损失为:
Lid为身份损失,λage为年龄损失系数,Lae为年龄损失函数,λid为梯度反转层损失系数。与其他文献不同的是,公式(3)中的第二项与第三项使用相同的网络结构和参数进行共同训练。经实验此方式可以在减少训练参数的同时保证具有相同的模型训练效果。
实验用到的数据集如表1 所示。为了与目前先进的算法进行公平比较,先择SCAF①Huang Z,Zhang J,Shan H.When age-invariant face recognition meets face age synthesis: A multi-task learning framework,Proceedings of the IEEE/CVF conference on computer vision and pattern recognition.2021:7282-7291.为训练数据集,包含约为 50 万张图像及 12000 个不同身份。测试集包括一个人脸识别数据集(FG-NET(https://yanweifu.github.io/FG_NET_data)),两个人脸验证集(CALFW②Zheng T,Deng W,Hu J.Cross-age lfw: A database for studying cross-age face recognition in unconstrained environments.arXiv preprint arXiv:1708.08197,2017.和ECAF③Z.Huang,J.Zhang and H.Shan,"When Age-Invariant Face Recognition Meets Face Age Synthesis:A Multi-Task Learning Framework and a New Benchmark," in IEEE Transactions on Pattern Analysis and Machine Intelligence,vol.45,no.6,pp.7917-7932,1 June 2023,doi:10.1109/TPAMI.2022.3217882.)。CALFW数据集平均年龄差距为17.6 岁,在其中挑选6000 对图像,包括3000 对具有年龄间隔的相同个体作为正样本对和3000 对不同个体作为负样本对。ECAF 数据集平均年龄差距为41.3 岁,在其中分别选取6000 对和4000 对人脸图像,用于评估(Adult,Child)和(Child,Child)两个任务。
表1 数据集
如图3 所示,使用MTCNN④Zhang K,Zhang Z,Li Z,et al.Joint face detection and alignment using multitask cascaded convolutional networks. IEEE signal processing letters,2016,23(10):1499-1503.(Multitask cascaded convolutional neural network)检测面部5 个关键点进行人脸检测与对齐,并将图像裁剪为112×112 像素。
图3 图像处理
将SCAF 数据集按年龄分为7 个不重叠的年龄组0-10、11-20、21-30、31-40、41-50、51-60 和60+,根据年龄分组和年龄标签进行年龄估计任务。为了避免过拟合,训练时对图像进行随机翻转的操作,随后将图像归一化到[-1,1]区间。实验细节:直接采用文献⑤Wang H,Wang Y,Zhou Z,et al.Cosface: Large margin cosine loss for deep face recognition,Proceedings of the IEEE conference on computer vision and pattern recognition.2018:5265-5274.中对人脸识别损失CosFace 的参数设置(s=64,m=0.35),λage和λid分别设置为0.01 和0.001,训练批量大小为256,迭代次数为40000 次,动量因子为0.9,训练开始时学习率从0 到0.1 线性升温,迭代2000、20000、24000 次时,学习率以0.1 的倍数降低,使用随机梯度下降(Stochastic gradient d-escent,SGD)算法进行优化,使用一块GPU(V100-SXM2-32GB)进行加速训练。实验环境:Python3,Pytorch1.8.1 框架进行训练,显卡为V100-SXM2-32GB。
1.FGNET 数据集人脸识别结果。FG-NET 是跨年龄人脸识别中最受欢迎和最具挑战性的数据集,包括在野外收集的82 名受试者的1002 张面部图像,从儿童到老人的年龄跨度较大。为了公平比较,我们严格遵循文献⑥Wang H,Gong D,Li Z,et al.Decorrelated adversarial learning for age-invariant face recognition,Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition.2019:3527-3536.中的留一法(leave-one-out)评估方式。
具体来说,模型在SCAF 上进行了训练,之后选取1 幅图片作为测试样本,1001 幅图片作为样本库,将测试样本与样本库中所有样本进行余弦距离比较,距离从小到大进行排序,若距离最近的样本对身份相同,则为Rank-1 识别准确。重复此过程1002 次。表2 报告了Rank-1 识别率,可以看出AM-CNN与最先进的MTLFace 相比有小幅度提升。
式(3)中的超参数λage和λid变化会影响模型性能,为了探求合理的λ取值,在FG-NET 数据集上设置了以下几组实验。由表3 可知,λage值的变化对模型识别效果影响较大,λid值的变化对模型识别效果影响相对较小。当λage值较小时年龄估计任务重要性较低,会导致年龄特征提取不充分,使模型识别效果降低。相反λage值较大时年龄估计任务重要性相对较高,会引入一些不相关噪声,也会使模型识别效果降低。同理λid值的变化也会有相应的效果。经过实验,确定λage为0.01,λid为0.001时模型在FG-NET 数据集上的Rank-1 识别率最高。
2.人脸验证数据集结果。为了与之前跨年龄人脸识别模型进行公平比较,使用相同数据规模的SCAF 数据集进行模型训练,并在公开的大年龄间隔数据集CALFW、ECAF 上进行模型测试。测试结果如表4 和表5 所示,AM-CNN 超过了之前关于AIFR 的研究成果。AM-CNN 的识别准确率比最先进的MTLFace 方法在CALFW 数据上高了0.13%,在ECAF(Adult,Child)数据集上高了0.65%,在ECAF(Adult,Child)数据集上低了0.11%。在ECAF 数据集上最先进的MTLFace 是在SCAF 数据集端到端训练后,使用生成的图像进行微调所得到的结果。然而,本文所得到的结果均是在SCAF 数据集上一次性端到端的训练结果,并未使用其他的数据集或者生成数据进行微调。由此进一步说明AM-FPN 效果具有显著的优越性。
表4 和表5 仅仅展示了模型之间的准确率差异,为了更好地分析模型的性能,使用受试者工作特性曲线(receiver operating characteristic curve,ROC)对AM-FPN 和最先进的MTLFace 进行更为全面的对比。ROC 曲线可以评价模型对两类测试者(正样本对和负样本对)分类的效果,ROC 曲线下面积越大模型分类效果越好。
使用与AM-FPN 相同的实验环境对MTLFace 进行复现得到不同验证任务下的相应ROC 曲线。ROC 曲线下面积越大,模型整体效果越好。图4(a)是两个模型在CALFW 数据集上的表现,AM-FPN与MTLFace 所得ROC 曲线下面积差距较小,因此两个模型在此数据集上分类效果不相上下。图4(b)中AM-FPN 所得ROC 曲线下面积远超过MTLFace 所得ROC 曲线下面积,所以在此数据集上AM-FPN分类效果优于MTLFace。同样,在图4(c)中AM-FPN 所得ROC 曲线下面积略超过MTLFace 所得ROC曲线下面积,所以在此数据集上AM-FPN 分类效果略优于MTLFace。综上所述,AM-FPN 综合分类效果要优于MTLFace。
图4 各数据集ROC 曲线对比图
图5 展示了AM-FPN 在各个数据库任务上识别结果示意图。正正表示模型识别图像对为相同身份,真实标签也是相同身份;正负表示模型识别图像对为相同身份,真实标签是不同身份;负负表示模型识别图像对为不同身份,真实标签也是不同身份;负正表示模型识别图像对为不同身份,真实标签是相同身份。由图5 可知,各个数据集中的图像对有灰色图和彩色图,其中正正和负负是模型识别正确的图像对,正负和负正是模型识别错误的图像对。在正负图像对中,两张图像有明显的相似之处。在负正图像对中,两张图像由人为识别也是比较困难的。总体来看,模型可以正确识别灰色和彩色图对,但模型识别正确的图像对大多数为相同通道数,相反模型识别错误的图像对有一部分是不同通道数,并且有些图像清晰度太差。由此可知,图像的色彩和清晰度可以在一定程度上影响模型的识别。
图5 识别结果示意图
3.消融实验。为了进一步研究不同模块的效果,在三个数据集上进行了消融实验。(1)基线:去除除CosFace 损失外的所有额外模块,训练人脸识别模型。(2)基线+年龄:在基线的基础上增加年龄估计任务,并通过多任务联合训练的方式训练模型。(3)基线+年龄+GRL:在基线和年龄估计任务的基础上增加GRL,并通过多任务联合训练的方式训练模型。(4)基线+年龄+GRL+CBAM:在年龄估计任务、身份识别任务和GRL 的基础上,在FPN 横向连接处加入CBAM 注意力模块。(5)基线+年龄+CA:将CBAM 注意力模块换成CA 通道注意力模块。(6)AM-FPN:本文提出的模型,使用SA空间注意力模块增强年龄特征的提取性能。
由图6 可知,与基线模型相比基线+年龄模型性能显著提升,从而证明掩码分解模块在跨年龄数据集上实现了显著的性能改进。其次特征提取器在年龄特征提取时,融合了多层年龄特征信息。AM-FPN 采用CA 注意力机制进一步加强特征提取能力,与其他注意力模块(CBAM 和CA)相比实现了显著的性能提升,这也从侧面体现出在低维特征图中,年龄信息与空间信息联系更为密切。此外,使用跨年龄领域对抗训练也可以使模型性能得到进一步的提升。
图6 不同模块消融实验
图7 展示了掩码分解模块与先前所提出的分解模块性能比较。具体来说,模型采用相同的FPN 骨干网络分别与正交分解、线性分解和掩码分解组合,使用SCAF 数据集训练之后,在三个验证集上做公平比较。由图可知,AM-FPN 中的掩码分解模块效果优于先前所提的分解模块效果。
图7 不同分解方式
为了实现跨年龄人脸识别,在MTLFace 结构基础上,采用改进的基于特征金字塔的特征提取器,并使用新提出的一种掩码分解模块,使用多任务训练策略,获得了一种基于年龄掩码的跨年龄人脸识别模型(AM-FPN)。该模型对FPN 网络进行改进,使其可以提取混合人脸特征,并且可以适应性地融合不同层特征信息提取到更为细致的年龄特征信息。使用掩码分解模块从混合人脸特征中除去所提取到的年龄特征比以往所提出的分解方式效果更好。最后使用多任务训练策略监督特征分解,加快模型的收敛速度。在多个数据集上的实验结果表明AM-FPN 可以显著提升跨年龄人脸识别准确率。此外,AM-FPN 可以将年龄特征更改为姿态和表情等其他因素,从而扩展到其他类似解耦不充分的实例。