杨和峰
(宜春职业技术学院,江西 宜春 336000)
人体运动行为特征识别是对人体运动类型的分类,也是人类了解自身的途径之一。基于人体运动特征数据进行的人体行为识别,可应用于很多领域。在运动分析领域,可帮助运动员分析肢体动作技巧;在智能监控方面,可通过身份识别进行安全认证;在医疗看护方面,可以用于疾病诊断和健康监护;同时在虚拟现实、人机交互、军事发展方面,人体运动行为特征都具有极高的发展潜力,可以提高识别的准确性,增强设备工作效率,促使人们通过计算机观察和理解世界[1]。由于人体运动行为符合马尔可夫特性,因此基于马尔可夫的隐马尔可夫模型能够考虑人体运动状态,具有很好的运动行为微小变化的鲁棒性。但由于隐马尔可夫模型计算过于复杂,状态输出概率也存在较大随机性,影响人体行为识别效率,因此该文选取基于人体运动特征的改进后的隐马尔可夫模型——N-SCHMM模型进行人体行为特征识别验证,进而获得更具信息性的表示,进一步探究人体行为识别方法[2]。
运动目标检测是人体运动行为特征的预处理阶段,主要目的在于分割运动目标以便获取运动特征,其运动特征数据的精准度对运动行为特征模型的建立具有重要作用,影响行为识别的精确程度和智能应用的应用前景[3]。在实际研究中,为方便运动行为特征的提取,需要借助背景差分法等对运动状况下的摄像头进行检测,处理运动区域内部的小缝隙,获取完整的人体运动目标,提高信息的真实性。背景差分法具体流程如图1所示。
图1 背景差分法具体流程图
该方法将当前帧图像与实时画面相减,如果像素差值大于某一阈值,则这一像素为运动目标像素,根据运动对象的位置、大小以及形状等检测人体运动行为目标,可提升计算效率,增强检测效果,为运动目标提供最完整的特征数据。
根据运动特征数据,利用关联特征挖掘方法,进行时域特征提取和频域特征提取,借助粒子群优化和蚁群优化选择运动行为特征,构建特征向量,降低特征向量的维度[4]。假定人体行为特征参数的数据集合为{a1,a2,...,an},n个人体子区域的数据集合为{b1,b2,...,bn},计算人体运动行为特征参数γ,对比特征关联性的公式如公式(1)所示。
式中:an为第n个人体特征参数;k为运动行为特征比例;A为行为时间。
针对运动行为的不同分类描述基本特征,计算特征关联性系数。在此基础上利用黄金分割方法,按照人体行为特征运动强度Qi和运动幅度Q0,进行人体运动行为特征阈值计算,如公式(2)所示。
式中:SQDS为阈值动态变化参数。
根据行为特征阈值判断人体运动行为的真实性,降低运动行为识别过程的延迟,获取最优的人体行为分类。
提取运动行为特征后,改进原始的K-means即K均值聚类算法的随机选择缺陷,利用MIK-means关键帧提取算法提取人体行为的关键帧序列和聚类行为特征向量的序列,优化人体行为识别,并将行为序列进行网格特征化处理。假定每个提取人体运动区域的二值图像有MI×NI个像素,如果将此二值图像划分为MM×NM个像素网格,用网格特征表示人体行为的特征向量。网格特征f(i,j)的计算过程如公式(3)所示。
基于原始的聚类算法步骤可根据网格化特征融合MIKmeans算法精确提取关键帧,初步删选后进行聚类,接着建立包括所有行为的关键姿势帧,对特征向量序列进行矢量量化,最终转化为符号序列,提取运动行为特征,用网格特征来表示人体运动行为的特征向量,进行人体行为序列转化[5]。
针对运动特征数据观测函数矩阵,其中每个元素函数的函数特征都可用向量表示,具体如公式(4)所示。
式中:ve f为运动数据函数化的数据特征。
它是一个由函数最大值、最小值以及频率构成的三维向量,从一个图像序列中提取其特征向量,将时序图像转换为符号序列,最终运动行为的顺序关键帧序列可由一个一维符合序列来表示[6]。对人体运动行为特征向量序列进行矢量量化,并对聚类网格特征向量的特征空间进行分类,用码字表示特征空间的聚类中心,每个聚类中心都分配对应的符号向量,形成最终观察序列。
在基于运动特征的人体运动行为学习和识别过程中,采用MIK-means聚类算法得到聚类结果。接着规划化处理人体运动中心的质心,对运动特征进行量化改进。根据聚类中心距离最近的码字创建码表,生成特征向量序列,将关键姿势帧的网格特征向量按照顺序依次排列在码表中。基于已训练好的各个行为的N-SCHMM模型进行序列输入,使网格特征向量矢量量化为一个符号,生成特征符号序列,进行计算机的有效识别。
在人体行为识别中,采用马尔可夫模型的改进模型隐马尔可夫模型[7]。隐马尔可夫模型如图2所示。它能够识别人体行为的运动时空序列,把握空间和时间尺度上的微小运动变化,是一个全连接结构的模型。这一传统模型没有充分考虑人体的运动特征与模型之间的关系,状态转移概率冗余,状态输出概率随机,计算方法和行为模型训练解决方法都比较复杂,影响人体行为的识别率。
图2 隐马尔可夫模型示意图
该文采取改进的隐马尔可夫模型,假定人体运动行为由K个关键的姿势表示,图2中简化为3个,以1、2、3表示,按时间序列分布关键姿势,代表人体运动行为的发生过程。基于这一假设,该文提出一种N个状态组成的、半连接的隐马尔可夫模型——N-SCHMM模型,并对其中状态输出概率进行改进,便于更好地适应人体行为的运动特征,改进后的模型结构示意图如图3所示。
图3中,λJ表示一个N-SCHMM的参数,SA表示模型状态转移概率,SB表示模型状态输出概率,以此类推,SN表示参与计算的模型状态。根据运动行为特征提取和矢量量化,转化人体行为的符号序列至N-SCHMM模型,得到模型参数并进行行为识别,每种运动行为的参数集合λJ即表示N-SCHMM模型,可减少系统计算的数据量。在该设计中,确定N-SCHMM模型的转移概率和输出概率十分重要[8]。在模型的参数集合λJ中,状态J时的以此行为状态转移概率矩阵AJ中的每个元素都表示一种转改转移概率。根据码表中的运动特征向量,对有N个状态的一个行为N-SCHMM,在状态输出概率矩阵中,元素代码表示其中的每个关键姿势的概率。
图3 改进的N-SCHMM模型结构示意图
在基于运动特征数据的人体运动特征关联分布N-SCHMM模型训练与识别中,先要构建训练集,对模型参数集合进行训练,对人体行为进行建模,并在建模过程中不断优化参数集合,改进参数训练的转移状态[9]。采用Baum-Welch估计参数对已知的人体行为观察值序列进行参数训练,训练每个N-SCHMM模型。在前一个人体运动行为状态只能向后一个状态转移,且状态之间没有回路的前提下,改进后的状态转移概率aij的计算如公式(5)所示。
式中:i的取值为[1,N];j的取值为[i,N];γt(i,j)为在设定训练时刻t时,在N-SCHMM模型中,针对给定关键帧的序列,按从左到右的顺序从i转移到j的人体运动行为状态的转移概率,且无须对参数中的0元素进行估计。
在N-SCHMM中,状态输出概率的决定性因素为该概率的所属状态,因此在参数训练过程中对运动状态的输出概率进行优化,在状态输出概率上加上权重,计算带权重的状态输出概率bj(ck)如公式(6)所示。
式中:SA为最前端的状态;p为当前输出状态的权重;q为当前状态对应其他运动位置关键帧的输出状态权重;k为关键姿势帧的状态输出概率个数。
在N-SCHMM模型训练中,通过计算估计状态转移概率aij和状态输出概率bj(ck)进行人体运动行为特征识别,将给定的待识别人体行为分类为已知人体行为,利用前向算法归纳出某一状态下该行为的观测序列与模型参数的相似程度概率,计算最大似然值的识别结果,找出最大似然概率的已知行为并进行归类,达到对人体行为进行识别的目的。
为验证基于运动特征数据的人体运动行为特征关联分布模型的有效性,该文的试验环境为Intel(R) Pentium(R) CPU G3220 @ 3.00GHz,3.00GHz处理器,32 G RAM内存,64位操作系统的PC机。选择Weizmann数据库中的人体行为的数据集进行试验,验证N-SCHMM模型在行为识别上的性能。在数据集中提取6个人的运动特征数据做测试,实施跑步、走路、弯腰、单手挥动以及双手挥动5种不同的行为,总计特征(时域和频域特征)数为30条。训练每种运动行为的N-SCHMM模型,测试这种模型对位置行为序列的识别情况。针对数据集中不同差异的人体行为特征进行分析研究,捕捉运动过程中的行为特征。
该文在数据集上对MIK-means聚类提取关键帧算法进行验证。提取人体运动行为特征,用N-SCHMM模型对数据集不同行为进行行为识别验证。分别检测Weizmann数据库中6个人做出的随机30个人体行为运动特征,对同一行为的不同对象进行验证,试验结果见表1。
根据表1所示的待识别行为的分类情况,该文提出的N-SCHMM方法对大部分行为都可以正确识别分类,其中跑步识别率为95%,走路识别率为100%,弯腰识别率为90%,单手挥动90%,双手挥动识别率为95%,平均识别率为94%,也存在小部分识别错误,是因为单手挥动、双手挥动等几类运动的侧影图相似度较高,该文认为这是正常的误差。试验结果表明,基于运动特征数据的人体运动行为特征关联分布模型可进一步提高人体运动行为特征关联分布的准确率,进而能验证人体行为状态与人体运动特征之间结合的可行性。
表1 待识别行为的分类情况
综上所述,针对运动数据在人体行为识别方面的重要性,该文在充分考虑运动形态变化的基础上,对人体运动行为特征进行了预处理,表征人体运动目标特征,检测人体运动目标,利用关联特征挖掘方法,提取运动行为特征,构建特征向量,采用K-means模型中的K均值聚类算法提取人体行为的关键帧序列,对特征向量序列进行矢量量化,最终转化为符号序列。试验验证说明该文提出的模型计算复杂度低、识别人体行为准确率高。对更复杂的人体运动行为特征关联以及运动特征数据的运用,还有待很多学者在未来研究工作中进行更深层次的研究。