陆欣娆
摘要:步态识别相比于人脸识别、指纹识别、虹膜识别等生物特征识别技术,更有技术难度,且容易感知,不易伪装,应用更加广泛,所以重点在步态识别技术。研究了步态识别的三大步骤,步态检测、步态表征和步态识别。在此基础上完成步态识别的商业应用研究。
关键词:步态识别;结构化特征;算法
中图分类号:TB文献标识码:Adoi:10.19311/j.cnki.1672-3198.2019.10.085
1步态识别概述
步态识别是生物特征识别领域一项新兴的技术,相比于人脸识别、指纹识别、虹膜识别等其他生物特征识别,它具有容易感知,非接触性,难于隐藏和伪装等优点。基于此,步态识别有非常广泛的应用,现已有大量综述文章。
步态分析不光是计算机视觉领域的课题,它是结合医学、心理学方面的课题。而步态识别就是分析包含人体运动的图像序列,通过人们走路的姿态进行身份识别,通常包括步态检测、步态表征和步态识别3个过程,其框架图如图1所示。
一般步骤是:首先通过摄像头去采集步态信息,然后通过背景估计等算法进行步态检测,接着对步态序列轮廓区域作特征提取,对比步态数据库,作最终的步态识别。
2步态检测
步态检测是从视频中将背景信息过滤,只提取目标物体——步态序列,从而截取步态信息,将人体步态轮廓区域从背景图像中提取出来,其中包括背景估计、目标检测和形态学后处理等。有效分割步态轮廓区域是后期特征提取、目标分类等处理的基础。视频序列中运动检测不同于静态信息识别,它更加复杂,包含的信息更多,现如今主要有4类方法去处理,而步态检测也同样适用:
(1)基于特征的方法。首先观察人体结构学特征,将人体结构学特征的变化与图像序列中的变化建立一定的关系,并计算物体结构学变化的运动参数。例如主动轮廓法、采用边缘和拐角作为特征去研究目标物体的方法。
(2)帧间差分法。就是结合连续的图像序列之间的亮度变化来提取运动目标。现在有很多的研究是在传统的帧间差分法基础上,结合形态学和人体结构特征来提取步态信息。这种方法简单易于实现,但只能检测目标边缘,无法检出整个物体。
(3)背景减除法。用当前帧图像去对比背景图像,将区别小的区域定为背景区域,区别大的区域定为运动区域,从而将背景减除,只提取运动信息。该方法有一定的局限性,其对外界扰动引起的场景变化特别敏感,一般要求背景静止。
(4)光流法。是一种基于灰度梯度基本不变的假设的目标检测算法,但其算法较为复杂,而且其基本假设在大多数步态识别中并不成立,抗噪性能差。
在以前的步态检测算法中,因为存储的大多数是静态图片,所以背景减除法应用较广。但近年来,随着研究偏向复杂背景和动态信息,我们往往要结合帧间差分法和光流法这一类更适合做运动物体检测的方法。应用这些方法时,往往要结合人体步态基本特征做具体检测,结合基于特征的方法。
3步态表征
步态表征就是步态特征提取,这些特征包括结构化特征、非结构化特征和融合特征。特征工程是计算机视觉领域的一个研究重点,步态识别也不例外。
3.1结构化特征方法
结构化特征方法是通过建立一个2D或3D模型来模拟人在步态行走时的结构化模型。一种基础的模型是基于腿部内链接钟摆模型,将小腿基于大腿的运动模拟为钟摆运动,且符合一定的角度变化。在此基础上又有人研发了动态耦合钟摆模型,将大腿的运动也模拟为钟摆模型,把小腿的运动模拟为以大腿的末端为顶点的钟摆模型,且其运动具有一定的周期性,各个人的运动符合一定的模式,正是这样才可以做结构化特征提取。
另一种方法则是从另一种角度出发,结合解剖学知识,在人体侧影中提取出头、脖颈、肩、胸、骨盆、膝盖和脚踝等各部位的位置参数,并计算各个位置的运动学特征,最终构建出2D人体杆状模型。将多个静态情况下的杆状模型连接起来后,形成一个能识别的步态模式。此方法弥补了钟摆模型没有描述上肢运动的缺点,后期应用较广,但对设备要求较高。
还有一种方法也是利用是将人体侧影图像,将人体划分成7个区域,每个区域用一个椭圆来表达,用每个椭圆的质心、长短轴之比、长轴的方向合家整个身体的质心高度等29个特征参数来描述人体侧影图像,再和模板匹配进行步态识别。和杆状模型相比模糊了人体着装对侧影图像的影响,但又因此损失了对人體上肢运动的描述。
鉴于上述2D模型的局限性,有人采用了分层结构模型对人体运动进行分析;还有人则通过2D人体数据拟合3D人体运动模型,从而获取,分析运动参数。
结构化特征方法通过建立模型,描述人在运动时整个身体各个部位的运动,更易于捕捉变化的信息,因为运动的序列性、规律性,还能根据之前的运动估算后面的运动。但该类方法对步态序列的清晰度的要求度高,而且对动态信息的计算量较大。
3.2非结构化特征方法
非结构化特征方法是从步态序列中提取基于人体轮廓、形状所产生的各种统计时空模式特征。鉴于结构化特征方法处理动态步态信息时的计算量大,较耗时的特点,它旨在通过提取人体轮廓,处理静态信息从而分析步态信息,它的特点是计算量小、便于实时计算,但对于背景和光照信号比较敏感,而且一旦场景中出现遮挡现象,识别率便会下降。最常用的一种方法是采集人体轮廓,用组成轮廓的点到中心之间的连线的信息变化来表达步态特征;又有人基于这种一维步态信号上应用小波包变换来提取步态特征,增强鲁棒性;有人尝试仅用轮廓的宽度描述人体形状特征,但因人的步态是动态信息,仅用轮廓信息太少,对步态信息描述不充分,步态提取的过程中会丢失一部分有用的信息,所以他们经实验发现,要将轮廓信息和整个侧影图像结合起来提取步态特征,才能取得比较好的效果。
最近,又出现了一些新的非结构表征算法。通过两个不同人体运动图片相对位置的变动,把图片转化成自相似图,能量图,步态流图等,再算两个图之间的差。这个方法没有结构化特征准确,但胜在计算量小,且比直接用两个图片计算更准确。
3.3融合特征方法
融合特征方法是将人类多种特征融合起来进行识别,一般有将不同的步态特征进行融合和将步态特征和其他生物特征进行融合两种。
在不同的特征融合中,有多种静态特征和动态特征相结合的方法,在特征结合间有不同的权重,给判断两步态相似度贡献率更大的赋更高的权重,贡献率低的赋低的权重,最后通过实验找到最优的特征融合方法。融合之后的步态特征比任何单一步态特征的识别率更高,但效率可能会降低。
4步态识别
4.1KNN分类算法
kNN分类算法(k-Nearest Neighbor),或称K最近邻分类算法,是一种监督学习算法,是基于实例的学习方法中最基本、最简单的方法之一。K最近邻,顾名思义就是k个距离最近的邻居的意思。其算法大致为:已知一些训练数据,当一个新数据进入的时候,就跟训练数据里的每个点求距离,找到k个和这个点距离最近的数据,如果这个实例的K个最相似的实例(即特征空间中距离最近的点)中的大多数属于某一个类别,则这个实例也属于这个类别。
KNN算法简单,易于实现,只需输入数据而无需训练,结果依据k个对象得出而不是单一对象,这些都是它的优势,它多被应用于多分类问题。然而KNN算法需要存储大量训练数据,在存储效率上是低效的,且它的准确性很大程度上依赖于k值的选取,不同的k值对结果有很大影响,想要选取一个较为合适的k值只有前期反复试验调整。而且图像的明暗度、图像上的遮挡等都会使得距离计算出现很大的偏差从而导致错误的判断,这些都是KNN算法的缺陷。
4.2线性分类算法
鉴于KNN算法存储效率低及计算时间长等缺陷,我们需要另一种算法——线性分类算法。线性分类器由评分函数和损失函数组成,它通过特征的线性组合来进行分类,在优化过程中,将通过不断变更评分函数的参数,从而使损失函数值达到最小。评分函数是一种简单的线性映射,通常表达为:
f(xi,W,b)=Wxi+b
其中f为函数,x为变量,W,b是函数的参数,W通常叫作权重,b通常叫作偏差。
我们的目的是通过学习输入的训练数据,得到合适的参数W,b,使得每个训练数据计算出来的分类情况和训练集中图像数据的真实值相符。
损失函数计算的是通过给定参数的评分函数计算得到的分数与数据真实值不相符的程度,以此来定量表现当前参数的好坏,当损失函数值高的时候不相符程度大,此时需要根据不相符程度适当调整参数值,从而通过不断调整参数权重W和偏差b来找到最好的参数。
与KNN算法相比,线性分类器在得到参数后只需保留参数即可,不再需要存储训练数据,大大节省了空间和效率,所以线性分类算法也可算作是KNN算法的高效应用。
4.3CNN算法
卷积神经网络(Convolutional Neural Networks),又称CNN算法,是一类包含卷积或相关计算且具有深度结构的前馈神经网络模型,是计算机深度学习的重要代表算法之一。卷积神经网络仿造生物的视知觉机制构建,局部感知,类似于生物在看东西时会将目光聚集在很小的一块区域,在卷积神经网络中,每个节点只连接到符合卷积核的图像像素点上,使全连接变成局部连接,相比于普通的多层感知器的节点连接到一个图像的每个像素点上,大大减少需要训练的权值参数数量。
权值共享网络结构能够进一步减少权值参数数量,当不同的图像或者同一张图像出现相同的特征时可以共用一个卷积核,减少重复的卷积核,从而进一步减少权值参数,加快运算速度。
卷积神经网络具有传统神经网络的较好容错性、自适应性和较强自学习能力等优点,同时又具有可以自动提取特征、具有良好的容错能力、可处理高维数据等优势,是一种较为良好的算法,现已大量应用于计算机视觉领域。
4.4步态识别的商业应用
近年来步态识别被逐渐投入商业应用。2017年中国科学院自动化所对外介绍了对步态识别的商业应用,50米内,只需要被测试者走两步路,几秒钟的时间,无需被测试者特意配合即可识别出被测试者的身份。北京的初创团队银河水滴推出了全球首款步态识别成熟产品——步态检索智能一体机“水滴神鉴”,为公安部门侦查破案、锁定追踪嫌疑人提供了巨大帮助。另外,步态识别也在被逐步应用于生物医学康复领域,将步态识别系统加入截肢病人的假肢中,使之与人类的健康腿的功能、相似度进一步提高,形成真正的智能化假肢。目前各类科创团队正在致力于将硬件和软件结合,将技术融入产业,步态识别技术商用化正在逐渐落实。
5总结
步态识别算法包括KNN算法、线性分类算法和基于卷积神经网络的深度学习算法,目前商用效果最好的是将这些算法相融合。步态识别有很大的应用前景,也有很大的商业市场,但同时也面临很大的挑战,例如如何在人群密集出解决人群遮挡问题、在季节着装变化大时如何准确识别以及智能传感设备对步态识别的影响,这些都需要我们进一步探索和改进。
參考文献
[1]王修晖,严珂.基于连续密度隐马尔可夫模型的人体步态识别[J].模式识别与人工智能,2016,29(08):709-716.
[2]余杰.基于视频的人体目标跟踪与识别技术研究[D].成都:电子科技大学,2016.
[3]卢官明,衣美佳.步态识别关键技术研究[J].计算机技术与发展,2015,25(07):100-106.
[4]王欣,唐俊,王年.基于双层卷积神经网络的步态识别算法[J].安徽大学学报(自然科学版),2015,39(01):32-36.
[5]马玉良,马云鹏,张启忠,罗志增,杨家强.GA-BP神经网络在下肢运动步态识别中的应用研究[J].传感技术学报,2013,26(09):1183-1187.
[6]柴艳妹,夏天,韩文英,李海峰.步态识别研究进展[J].计算机科学,2012,39(06):10-15+46.
[7]余涛,邹建华.基于Bayes规则与HMM相结合的步态识别方法研究[J].计算机学报,2012,35(02):2386-2396.
[8]王科俊,刘丽丽,贲晛烨,陈薇.基于步态能量图像和2维主成分分析的步态识别方法[J].中国图像图形学报,2009,14(12):2503-2509.
[9]薛召军,靳静娜,明东,万柏坤.步态识别研究现状与进展[J].生物医学工程学杂志,2008,(05):1217-1221.
[10]王科俊,侯本博.步态识别综述[J].中国图像图形学报,2007,(07):1152-1160.
[11]赵黎丽,侯正信.步态识别问题的特点及研究现状[J].中国图像图形学报,2006,(02):151-161.