基于贝叶斯决策的多方法融合跟踪算法

2016-10-18 18:55周旭马玉良
电脑知识与技术 2016年21期
关键词:压缩感知

周旭+马玉良

摘要:针对单一的跟踪算法难以适应复杂多变的环境,提出一种融合多种跟踪算法的方法。考虑到压缩跟踪算法的鲁棒性优势,和HOG行人检测的轮廓检测特点,利用算法之间的互补性,根据贝叶斯决策理论,提出了多算法融合的跟踪方法。融合过程中按照分类的思想,将图像中像素点按照其是否包含在跟踪框内分为两类。通过分析跟踪目标的移动范围,预测目标的下一位置,求出目标出现的先验概率分布。针对目标与环境的具体情况,调整每种算法的融合权值,得到融合后的各个像素点的类条件概率密度,最后根据贝叶斯决策估算各像素点的所属类别,确定跟踪框范围。实验结果表明,与单一算法相比,融合后的跟踪算法有更好的适应性和鲁棒性。

关键词:行人跟踪;压缩感知;行人检测;贝叶斯决策;多方法融合;

中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2016)21-0265-04

Abstract:A method of integration of various tracking algorithm is proposed, for single tracking algorithm is difficult to adapt to the complex environment. Considering the robustness of compressed tracking algorithm and the characteristics of HOG contour detection, using the complementarities of the two algorithms, the multi-method fusion tracking algorithm is proposed based on Bayesian decision theory. The pixels in the image are divided into two categories according to whether it is included in the track frame. The prior probability distribution of the target is obtained by analyzing the movement and predicting the next position of the target. The class conditional probability density of each pixel is obtained by adjusting the weight of each fusion algorithm. Finally the class of each pixel is estimated and the scope of tracking box is determined based on the Bayesian decision. The experimental results show that, compared with single algorithm, the fused tracking algorithm has better adaptability and robustness.

Key words: pedestrian tracking; compressed sensing;pedestrian detection; Bayesian decision theory; multi method fusion;

1 概述

目标跟踪是计算机视觉中的一个重要研究方向,在各个领域都有着广泛的应用前景[1~2]。过去的几十年里,人们研究出了许多的跟踪算法[3~8]。但每一种跟踪方法都有其自身的适应性和局限性,而环境具有多样性和多变性,这就使得单一的跟踪算法很难适用于各种环境,融合多种算法已是必然趋势。图像处理领域内的数据融合可分为三个级别:像素级融合、特征级融合与决策级融合[3]。研究人员在粒子滤波框架下,提出了大量基于多特征(颜色[6]、纹理、边缘[9]、灰度、运动等)融合的跟踪算法,其主要区别在于特征提取和融合策略的不同[3~4]。吴等[5]提出的多方法集成,融合了三种算法,实现了鲁棒的目标跟踪,但其并没有提出明确的融合策略。

压缩跟踪算法[10-12]是目前跟踪问题研究的一个主流方向,在物体的纹理和光照变化不大的情况下,其跟踪效果较好。但是,Compressive Tracking算法对目标大小变化的自适应性较差。基于HOG的行人检测[13],有效地使用了行人的空间信息。

本文综合考虑了压缩跟踪算法在微观领域的特点,和HOG行人检测在宏观领域的优势。利用算法之间的互补性,根据贝叶斯决策理论,提出了多算法融合的跟踪方法。实验结果证明,与单一的跟踪算法相比,该算法具有更好的适应性和鲁棒性。

2 跟踪算法概述

本文目标是构建一种在线跟踪算法,既能够适应目标形状大小的快速变化,又能够实现稳定可靠的跟踪。为实现跟踪算法的适应性与鲁棒性,本文采用了具有互补性的两种经典的跟踪算法:压缩感知跟踪法、基于HOG行人检测的跟踪。压缩跟踪算法在物体的纹理和光照变化不大的情况下,其跟踪效果很好,但对目标大小变化的自适应性较差。基于HOG的行人检测,有效地使用了行人的空间信息。但时常会发生检测错误或检测失败的情况,所以通常需要结合其他跟踪算法才能使用。

具体来说,基于压缩感知的跟踪算法[10~11],首先利用符合压缩感知RIP条件的随机感知矩对多尺度图像特征进行降维,然后在降维后的特征上采用简单的朴素贝叶斯分类器进行分类[12]。但此算法对目标形状大小变化的自适应性较差,行人检测恰好可以精确的弥补此缺陷。

在跟踪目标是行人的情况下,基于行人检测的行人跟踪,通常可以较为准确地找到行人所在的位置,得到不错的跟踪结果。不过时常会发生检测错误或检测失败的情况。跟踪算法通常是采用这一帧的结果作为下一帧的输入,所以当跟踪结果出现了偏差之后,误差会逐渐累加。跟踪框偏移或跟踪的范围发生改变的情况可能会发生,这都将导致跟踪目标的改变,以至于跟踪出错。

为了避免跟踪过程中的“漂移”现象,提高跟踪的鲁棒性。本文使用了贝叶斯决策将两种跟踪算法进行融合,有效地减少了由于误差累计造成的“漂移”,使跟踪保持适应性的同时又兼顾稳定性。

然后预测跟踪目标在下一帧中可能出现的位置,由目标的预测位置求出目标在各像素点出现的概率分布,作为贝叶斯决策的先验概率。多种跟踪算法得到的结果,根据融合权值进行结合,得出类条件概率密度。由贝叶斯决策求出后验概率,属于类的像素点集合的最小外接矩形,即为最终计算得到的跟踪框。

3.1跟踪目标位置预测

在第一帧图像中,用矩形框圈定一个区域作为跟踪目标。之后都使用上一帧图像的跟踪结果为依据,预测跟踪目标在下一帧的可能位置。本文假设帧间质心位置偏移[3]较小,跟踪目标在相邻帧间的移动范围小于跟踪框面积的四倍(中心点不变,长宽各放大二倍)。在此范围内,估计跟踪目标在下一帧图像中各个像素点出现的概率。

如图2所示,由(a)中的预测位置,根据公式1得到跟踪目标位置的概率分布图。其中越白的区域表示跟踪目标出现的概率越大,黑色区域表示跟踪目标出现概率较低。

3.2融合跟踪结果

跟踪时,压缩感知跟踪算法、与HOG行人检测在跟踪过程中同时运行,互不影响。直到得到的最终结果,再作为他们下一帧的输入。

考虑到跟踪算法之间的差异性和互补性,合理调整跟踪算法的融合权值。同时,像素点被越多的跟踪结果包含,说明其为跟踪目标的可能也就越大。由此得到目标状态的类条件概率密度。

3.3贝叶斯决策

基于上述分析,由目标位置预测得到的先验概率,和由各跟踪结果融合而来的类条件概率密度,利用贝叶斯公式:

4 实验结果及分析

实验均在PKU-SVD-B数据库上进行,PKU-SVD-B数据库由北京大学视频编解码技术国家工程实验室联合北京大学保卫部建立并整理,该数据集采集自固定在校园某些位置的摄像头。视频图像大小为1280×720像素,帧率为30帧/s。算法在VS2013和Opencv2.4下实现。

为了说明本文方法的有效性,分别对压缩感知跟踪法、基于行人检测的跟踪和本文融合后的跟踪算法进行试验对比。部分跟踪结果分析如图5、图6所示。图5为三种算法跟踪框的中心点距跟踪目标中心点的距离。行人检测在一百多帧时检测失败,目标丢失。压缩感知算法的跟踪效果相对较好,但其在四百帧之后开始出现偏差。本文算法在三百帧左右,融合结果出现跳变,但很快又重新锁定了目标;之后本文算法依旧能够稳定跟踪。

图6为两种算法跟踪框面积偏差比例的比较。由图可以看出本文算法在融合了行人检测后,其对目标大小变化的适应性明显争强。

5 结束语

本文考虑到压缩感知跟踪算法、与HOG行人检测算法之间的差异性与互补性,提出了多方法融合的跟踪算法。通过采用HOG行人检测算法,提高了跟踪的外观变化的适应能力。同时,位置预测有效地避免了跟踪过程中出现的跳变。实验表明,相对于单一算法,对背景干扰、光照变化、目标形状变化等更具鲁棒性。

本文的部分研究工作还有待深入,例如,本文提出了利用贝叶斯决策进行多算法融合的方法,选择不同的算法组合,势必会带来不同的效果。实验中曾融合了光流法和均值漂移跟踪法,但其跟踪效果非但没有提高反而减弱。所以,哪些算法之间具有互补性,还有待进一步论证。

参考文献:

[1] Viola P, Jones M J, Snow D. Detecting pedestrians using patterns of motion and appearance[C]//Computer Vision, 2003. Proceedings. Ninth IEEE International Conference on. IEEE, 2003: 734-741.

[2] Avidan S. Support vector tracking[J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 2004, 26(8): 1064-1072.

[3] 雍杨, 王敬儒, 张启衡. 基于多特征融合的弱小运动目标识别[J]. 量子电子学报, 2006, 23(5): 594-598.

[4] 顾鑫, 王海涛, 汪凌峰, 等. 基于不确定性度量的多特征融合跟踪[J]. 自动化学报, 2011, 37(5): 550-559.

[5] 吴伟, 李斌. 基于多方法集成的目标跟踪算法[J]. 中国科学技术大学学报, 2011, 41(11): 1000-1005

[6] 沈云琴, 陈秋红. 自适应均值漂移算法目标跟踪检测仿真研究[J]. 计算机仿真, 2012, 29(4): 290-292.

[7] Comaniciu D, Ramesh V, Meer P. Kernel-based object tracking[J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 2003, 25(5): 564-577.

[8] 刘小宁, 陈晓冬, 郁道银. 基于 DSP 的运动目标识别与跟踪系统的设计[J]. 电视技术, 2010, 34(11): 107-110.

[9] 王君本, 卢选民, 贺兆. 一种基于快速鲁棒特征的图像匹配算法[J]. 计算机工程与科学, 2011, 33(2): 112-117.

[10] Chummun M R, Bar-Shalom Y, Kirubarajan T. Adaptive early-detection ML-PDA estimator for LO targets with EO sensors[J]. Aerospace and Electronic Systems, IEEE Transactions on, 2002, 38(2): 694-707.

[11] Li H, Shen C, Shi Q. Real-time visual tracking using compressive sensing[C]//Computer Vision and Pattern Recognition (CVPR), 2011 IEEE Conference on. IEEE, 2011: 1305-1312.

[12] Zhang K, Zhang L, Yang M H. Real-time compressive tracking[M]//Computer Vision–ECCV 2012. Springer Berlin Heidelberg, 2012: 864-877.

[13] 曲永宇, 刘清, 郭建明, 等. 基于 HOG 和颜色特征的行人检测[J]. 武汉理工大学学报, 2011, 33(4): 134-138.

猜你喜欢
压缩感知
顺序小波包图像压缩感知方法