◆王文烨
(福州大学数学与计算机科学学院 福建 350116)
随着深度学习在人脸识别、指纹识别、虹膜识别等领域取得的突破性发展,生物特征识别技术日益受到社会关注。步态识别是新兴的生物特征识别技术,旨在基于行走姿态识别行人的身份。由于可以在远距离下隐蔽地采集行人的步态特征,故步态识别技术具备非接触性、难伪造性等特点,因此在安全监控及庭审取证等领域具备一定的发展潜力。事实上,步态识别技术已经在刑侦领域得以应用[1][2]。然而由于原始步态特征通常是以视频的形式采集得来的,故传统的步态识别技术深受到步态视频拍摄环境、特别是拍摄视角这一扰动因素影响,识别准确率受到了限制。鉴于深度学习的成功,文献[3]提出使用卷积神经网络提取步态样本的深度特征,对视角变化具备不错的鲁棒性,在视角跨度较大时仍能取得较高的识别准确率。另一方面,基于特征重利用的思想,文献[4]提出了密集连接神经网络(DenseNet),并通过实验证明了其网络性能优于传统卷积神经网络,并且被成功地应用在许多机器学习领域。本文提出将密集连接卷积神经网络应用于步态样本的深度特征提取,并且通过对比实验证明该方法的有效性。
现有的步态识别方法有许多是通过文献[3]提出的方法,从原始步态视频样本中提取步态轮廓图,再对步态轮廓图进行下一步的特征提取。图1展示了CASIA-B步态数据集中不同拍摄视角下的步态能量图。
现有步态数据集存在属于同一身份标签的样本数较少、标签数较多的问题,如CASIA-B步态数据集共有124个身份标签,每个标签下最多仅有66个样本。因此,任取两个不同的步态样本将其组成二元组样本,若这两个步态样本所属身份标签相同,则该二元组样本的标签为1,否则为-1,从而将步态识别问题转化成二分类问题。
本文步态识别方法的网络结构如图2所示。对输入的二元组步态样本,将其作差并取绝对值,得到两步态能量图的差异特征图,再利用密集连接卷积神经网络提取差异特征图的深度特征,最后与线性分类器相连。密集连接卷积神经网络主要由两个密集连接块构成,每个密集连接块中包含六个隐含层,块中的每一层都与后面的隐含层相连接。两个密集连接块之间是由卷积窗窗高为1的卷积层与池化窗窗高为7的平均池化层组成的过渡层。
图2 本文步态识别方法流程图
本文通过与文献[3]提出的LBnet在CASIA-B步态数据库上进行对比实验,证明了所提出改进方法的有效性。由于二元组样本的组成特点,样本空间中标签为-1的样本数量将远高于标签为1的样本数量,故在采样时,对每一个身份标签,先随机取一同身份标签的样本组成正例二元组样本,再取一不同身份标签的样本与之组成负例二元组样本。该采样方式保证了训练样本的平衡性,由于所取样本的拍摄视角是随机的,故这种采样方式能保证训练得到的模型对视角变化具有鲁棒性。
在测试阶段,取一组已知身份标签的样本,逐个与待测样本组成二元组样本并输入模型。若识别出与待测样本身份标签相同的样本,则认为识别成功。为了探究模型性能,本文令已知身份标签的样本取自一固定视角X_view,分别求出待测样本取自11个视角的识别准确率,取其平均值来衡量模型在视角X_view下的性能。实验结果如表1所示。
表1 实验结果