基于DTW的人体行为模式识别算法

2019-06-20 10:31贾贺林

电子技术与软件工程 2019年5期

贾贺林

摘要针对人体行为模式识别问题，本文提出了一种基于动态时间规整的模式识别算法。首先根据动作视频序列进行人体行为学习，生成待匹配的模板信息，对待识别的动作序列进行相似想度量，获取相似性信息，然后使用动态时间规整对待识别模板数据间的相似性进行计算，选取相似性度量最大的模板，从而完成对视频序列人体行为模式的分类识别。

【关键词】动态时间规整模板匹配相似性度量人体行为识别

随着摄像头等监视工具的应用，人体行为模式识别受到广泛的关注。人体行为模式识别主要面临着识别精度以及实时性的问题，本文提出了基于动态时间规整的人体行为模式识别算法，能够准确的识别出人体行为，相比于模板匹配算法有很大的提升。

1 模板匹配

模板匹配就是把不同传感器（通常是摄像头）或同一传感器在不同时间和环境下对固定场景拍摄的两幅或多幅图像进行处理，并将图像规整到统一的空间尺度，在相同尺度空间中查找对应模式的方法。本文中的DTW就是一种添加了时序约束的模板匹配方法。

模板匹配算法的基本思想：首先根据已知视频序列生成模板，然后对模板与图像对应区域进行相似性度量，相似性超过给定阈值就认为匹配，否则就匹配失败。模板匹配需要大量计算模板间的相似性，因此需要在匹配过程中选择合适的相似性度量公式和匹配方法，从而提高算法的整体效率。

2 行为学习

将不同人的行走、奔跑、跳跃等不同动作利用轮廓提取算法，得到多组轮廓后，分类存储，每一个视频动作序列都可以使用一组数据来表示，通过数据的变化来反映该动作的姿态变化，从而描述一个动作。在学习过程中，学习样本越多，得到的模板数据就更准确，模板匹配的概率就越大，但随之而来的是计算时间的加长。图1反映的是人体不同动作模式下的姿态数据变化趋势。

3 相似性度量

匹配比对算法离不开相似性度量，需要使用“距离”的概念来衡量两组数据的相似度，应用较为广泛的距离描述方式主要有：切比雪夫距离、欧氏距离、信息熵和夹角余弦等，需要根据不同需求采取相应的描述方法。

本文中算法考虑到算法的运行效率，采取向量夹角余弦来进行距离度量，对应公式如下其中x1k，x2k分别表示向量的坐标。两组向量夹角越小，余弦值越大，相似度越高，通過使用夹角余弦的计算方法，极大降低了算法的时间和空间复杂度，提高了算法的计算速度效率。

4 动态时间规整

使用模板匹配算法进行行为识别虽然比较简单，但是算法执行过程中会由于视频序列的时长不同产生误差，而且行为持续的时间也会对识别效果产生影响，因此本文提出了基于动态时间规整DTW（Dynamic Time Warping）算法来解决时序性的影响，只要时间次序约束存在，模板间的动作时间序列即便不一致，也不会影响算法的结果，提高了算法对时间序列的鲁棒性。

本文提出的人体行为识别算法主要步骤描述如下：

（1）将学习样本按动作分成不同小组，并且按顺序编号，每个小组学习了若干个人的动作数据.

（2）使用DTW计算待测数据的第一帧与第一组中第一个动作数据的所有帧的相似性，找到相似度最高的一帧并记录相似度度量值.

（3）等间隔采样若干帧，重复步骤（2），求出所有相似性度量值的平均值并记录.

（4）把待测数据采用步骤（2）（3）方法，计算其他小组的相似性平均值.

（5）比对待测数据与各组相似性平均值的大小，取最大的作为本次分类结果，分类识别完成.

本文算法将动态时间规整与模板匹配算法相结合，在学习阶段生成模板，识别过程中使用动态时间规整提高识别准确性。

5 实验结果

本文使用网上的数据集，包含基本的人体行为类别，行走，奔跑，跳跃，挥手，跳远等动作，通过数据集进行模板生成与动作识别。本文算法与模板匹配算法的准确度比较如表1。

通过表1可知，在对上述的人体动作进行识别时，本文的算法准确性要优于模板匹配方法，而且识别准确度受到人体行为的复杂度以及动作幅度的影响，简单的人体行为，如行走、挥手，识别的准确性较高，而在奔跑，跳跃，跳远等较为复杂的行为中，识别的准确性就较差。

6 总结

本文提出了基于动态时间规整的人体行为识别算法，相比于传统的模板识别算法，本文算法的准确性更高。但在处理十分复杂的人体行为时，本文算法的准确性并不明显，需要进一步的研究与优化。

参考文献

[1]邵延华，郭永彩，高潮.基于特征融合的人体行为识别[J].光电子激光，2014，25（09）：1818-1823.

[2]史东承，冯占君.视频中人体行为分析[J].吉林大学学报（信息科学版），2014（05）：521-527.

[3]赵海勇.基于视频流的运动人体行为识别研究[D].西安电子科技大学，2011：15-18.