朱海荣
摘 要 活体检测是一种验证对象真实生理特征的技术,随着人脸识别技术在支付、门禁、移动设备等的广泛应用,人们对人脸识别的安全性也提出了更高的要求,活体检测技术也越来越被重视,其可有效抵御屏幕录制的照片、视频、打印的照片、立体假面等攻击手段,甄别欺诈行为,保障用户利益。本文通过深度学习中卷积神经网络(CNN)的分类网络,提供一种简单高效、识别率高、可扩展行强的静默活体检测方法。并提出了一种小区域特征对齐图像提高活体检测准确度和鲁棒性的方法。
关键词 活体检测;深度学习;静默;特征对齐
活体检测技术早期采用配合式检测方法,需要检测体按照提示配合眨眼、张嘴、摇头、点头等组合动作,使用人脸关键点定位技术判断动作的正确性来决定是否为活体操作,进一步决定终止或继续人脸识别过程。此方式的缺点:检测时间长,对检测体要求高,不适应门禁、闸机等要求快速完成检测的场景。静默活体检测不需要烦琐的脸部动作配合,根据真实人脸成像和照片、屏幕、面具成像的差别判断是否活体。照片、屏幕成像会出现摩尔纹,并且纹理和光线反射率和真实人脸差异较大,通过让机器捕捉学习这个特性准确完成活体检测,并且每帧图像都可检测得到结果,检测过程短、实时性强。
1设计思路
为了让机器学习到伪造图像和真实活体图像的区别,而不受人脸个体差异的影响,提高鲁棒性,需要把学习和检测的图像特征对齐、减少干扰内容、有较多的可用特征、减小图像区域。
1.1 图像特征对齐
活体检测图像位置一致,获取人脸相同区域图像,使机器学习的特征单一,学习收敛速度快,特征提取准确。获取高度为双眼中较高眼睛的中心位置到嘴巴中心、宽度为左眼中心到右眼中心的图像作为训练和检测图像。
1.2 减少干扰内容
活体检测图像减少人脸干扰图像内容,减少因个体差异而影响检测结果,尽量减少眼、鼻、嘴等个体差异图像内容,保留皮肤纹理等个体差异小的图像特征。
1.3 有较多的可用特征
活体检测图像要保留较多的可用特征,比如摩尔纹、反光、纹理等可用作检测判断的特征尽量保留,提高机器学习准确度[1]。
1.4 小区域图像
小区域图像在经过预处理缩小图像和后期的池化层后保留较完整的可用特征。
2训练过程
2.1 模型设计
模型输入为3层24宽24高的RGB图片输入,归一化到[-1,1]之间,进过4个卷积层加两个全连接层,输出一个代表活体和非活体的二分类张量。使用Softmax loss作为损失估算函数,增加Accuracy进行准确率测试。
2.2 素材采集
将视频或者图片通过人脸检测获取人脸和关键点位置,使用双眼位置和嘴的中心位置,获取高度为双眼中较高眼睛的中心位置到嘴巴中心、宽度为左眼中心到右眼中心的图像作为训练和检测图像。按照真实人脸和伪造人脸分类保存采集的图像。
2.3 预处理
将采集的图像缩放(Resize)处理到3x24x24,并归一化数据到[-1,1]之间,保存到各自的分类目录中。
2.4 训练
将分类保存的数据集按照7:3的比例分成训练集和测试集,使用较为流行的深度学习训练工具Caffe、TensorFlow或者Pytorch训练。训练中可以发现在迭代5000次后损失值快速减小收敛,并且准确率可达到99%以上[2]。
2.5 结果
进过10万次迭代的训练,发现损失基本稳定在0.0001±0.0005,准确率达到0.999±0.0005。结束训练。
2.6 应用
由于模型深度浅,输入图像小,推理速度在Arm A53 CPU上达到15fps,在带有NPU的Rk1808上达到150fps。
3优缺点对比
3.1 优点
训练图像和推理图像特征对齐,干扰较少,训练收敛速度快,准确率高;模型小,推理速度快,可在移动设备上部署,正常运行;静默检测,无须检测体配合动作,检测时间短,检测速度快;推理图像只保留相关的可用特征,减少了干扰特征,鲁棒性高,泛化能力强,无须不同人员的大量素材训练。
3.2 缺点
由于依靠人脸检测技术的关键点进行特征对齐,在关键点不准确的某些场景下,活体检测能力有所下降;在强光下由于图像过曝,图像特征缺失,或者弱光场景下噪点干扰,活体检测能力有所下降,可通过改用近红外摄像头改进对环境光的影响[3]。
4结束语
综上所述,本文提供的基于深度学习的小区域特征对齐的活体检测方法,检测速度理想、鲁棒性高,可在各种移动设备上部署,并为人脸识别的安全性和体验性提供了保障。
参考文献
[1] 李新豆.基于圖像扩散速度模型和纹理信息的人脸活体检测[J].计算机科学,2020(2):112-117.
[2] 黄海新.基于深度学习的人脸活体检测算法[J].电子技术应用,2019(8):44-47.
[3] 宛根训.人脸识别应用活体检测技术研究[J].中国安全防范技术与应用,2019(6):58-62.