孙景伟,丁学用,雷 歌
(三亚学院 理工学院,海南 三亚 572022)
基于HOG的实时压缩跟踪研究
孙景伟,丁学用,雷 歌
(三亚学院 理工学院,海南 三亚 572022)
压缩跟踪利用压缩感知理论将Harr类特征投影到低位空间中,实现了实时性跟踪。但该方法提取是关于颜色信息的特征,易受光照影响,在光照剧烈变化的场合会跟踪失败。基于此,提出一种基于梯度方向直方图实时压缩跟踪算法。该算法采用HOG特征取代Harr类特征,增强对光照的不敏感性,提高了跟踪鲁棒性。通过不同视频的测试结果表明,文章提出的方法在光照剧烈变化、形变等情况下能准确地跟踪目标,且平均帧率15 frame/s,基本满足实时性要求。
压缩感知;Harr类;梯度方向直方图
运动目标跟踪是近年来计算机视觉领域的热门研究方向之一,在视频监控、军事领域、智能机器人、智能交通系统方面有着广泛的应用背景。2006年压缩感知被Candes和Donoho提出来以后,就成为国内外的研究热点,压缩感知被应用到运动目标跟踪上来,并取得较好的效果。文献[2]中通过采用稀疏投影矩阵的方法对Harr类特征进行压缩,快速的提取特征,提高跟踪效率,然而,该方法提取的是关于颜色信息的特征,光照不敏感性差,当光照变化剧烈时会跟踪失败。
本文针对文献[2]中的跟踪算法中的缺陷,提出了改进算法。文章采用梯度方向直方图特征(Histogram of Oriented Gradient, HOG)代替harr类特征,增强目标特征表达能力,增强光照的不敏感性,提高了跟踪的鲁棒性。并通过实验表明,本文提出的算法能在光照剧烈变化、形变等情况下能实时稳定的跟踪目标。
1.1 观测矩阵
依据压缩感知理论,当观测矩阵满足有限等距特性(RIP)[3]时,信号能投影到低位空间中:y=Rx (1)其中x∈Rn×1是原始信号;R∈Rm×n(m<<n)是观测矩阵,y∈Rm是观测值。R要满足有限等距特性(RIP)[3]。
本文根据文献[4],选取了非常稀疏的观测矩阵,定义如下:
1.2 梯度方向直方图
先用高斯滤波器对图像进行平滑,然后使用3×3的Sobel掩膜对图像进行水平、垂直方向滤波,获得水平和垂直方向的梯度。根据感兴趣的矩形区域内各点在水平和垂直方向的梯度值GXi,GYi计算出各点梯度值的幅值Gi和方向θi:
为了计算梯度方向直方图,将各点梯度方向归并量化为有限个方向,本文设定为4个方向(bins),每45°为一个区域。完成梯度方向的归并量化,统计各个方向的点的数目,并对其归一化处理,映射到[0,1]区间,得到感兴趣矩形区域的梯度方向直方图,即得到四维的HOG特征x=(a1,a2,a3,a4),其中a1+a2+a3+a4=1。
本文借鉴文献[2]的跟踪框架,提出了改进算法:基于HOG实时压缩跟踪。首先,根据第n帧的跟踪结果来提取正样本和负样本,提取正负样本的矩形HOG特征,然后利用稀疏的测量矩阵对其进行压缩,进而更新分类器;然后,在感兴趣区域内提取第(n+1)帧的候选目标,用上面的方法获取压缩后的HOG特征,进而根据分类器选取分类值最高的候选目标作为跟踪的结果。
2.1 快速的HOG特征提取
假设图像的大小为w×h,那么矩形HOG特征数达到(w×h)2,特征数总数的等级达到105~1010,数量十分庞大,为了降低计算量,选取非常稀疏的测量矩阵进行压缩:
从R可知测量矩阵中每一行的非零元素的个数不超过4个,从而大大减少了计算量,图1显示了HOG特征提取的过程,记xi=(ai1,ai2,ai3,ai4)为第i个矩形对应的HOG特征。
2.2 贝叶斯分类器
对样本图像Z,计算其相对应的HOG特征Y=(y11,y12,y13, y14;…;ym1,ym2,ym3,ym4),假设Y中每一列所有的元素是相互独立,且p(z=1)=p(z=0),则有
图1 HOG特征提取流程
其中z=1代表正样本,z=0代表负样本,且
最后,选取H(Y)最大的候选目标作为跟踪的结果,并对下面的系数进行更新:
式中λ表示前一帧对当前帧影响的程度,使用最大似然估计求解u1
j和σ1j,即
2.3 算法流程
本文针对文献[2]中的算法缺陷提出了基于HOG实时压缩跟踪算法,具体流程如下:
(1)手工提取第一帧的跟踪目标。
(3)根据式(5)选取最大的值作为跟踪的结果。
(5)根据式(7)和(8)对分类器进行更新。
(
6)跳到第二步骤进行下一帧处理。
为了验证本文的跟踪效果,将其用于跟踪下面的3种视频序列:David indoor,Car4,Car11;并与下面的两种跟踪算法作了比较:Compressive Tracking(CT)[1],Online AdaBoost(OAB)[5]。图2是上面的跟踪方法对3种个视频序列的部分跟踪结果;图3显示的是相应的跟踪误差;表1显示的是平均误差的比较。
表1 平均误差的比较
(a)David indoor
(b)Car4
图2(a)显示的是有姿势变化和光照变化的David indoor视频序列跟踪结果,本文的方法、CT都能成功的跟踪目标,而OAB在人转身和光照变化时会发生跟踪偏移,且从表1可知本文的跟踪方法平均跟踪误差最小,跟踪效果最好。
图2(b)显示的是光照急剧变化的Car4视频序列跟踪结果,从188帧开始即当车经过桥底,光线从亮变暗时,CT和OAB开始跟踪失败,只有本文的方法能成功的跟踪目标。
图2(c)显示的是对夜晚中车辆行驶的Car11视频序列的跟踪结果,视频中有剧烈的光照变化且目标物体与背景颜色相似的情况。从第10帧开始,由于受到光照的影响,CT开始跟踪失败;从第221帧开始,当光照从白光变成红光,且车辆转弯时,OAB开始跟踪失败;而本文的方法能成功的跟踪目标。
图2 跟踪结果
图3 相应的跟踪误差
综上所述,由于CT和OAB提取的都是关于图像的颜色信息,易受光照影响,跟踪稳定性差,而本文提出的方法提取的是图像的梯度信息,光照不敏感性强,在光照剧烈变化的情况下,也能成功的跟踪目标。
本文分析了CT算法的缺陷,提出了一种基于HOG实时压缩跟踪算法。本文方法提取的HOG特征,即提取的是图像的梯度信息,受光照影响小,克服了CT算法对光照的不敏感性,提高了跟踪的鲁棒性。本文的跟踪算法,在CPU 2.0 GHZ、内存2 GB笔记本电脑上运行,跟踪速度达到15 frame/s,保证了跟踪的实时性,并且通过对比实验,验证了本文算法的优越性。
[1]LI H, SHEN C, SHI Q. Real-time visual tracking using compressive sensing[C].Computer Vision and Pattern Recognition(CVPR), 2011 IEEE Conference on, 2011:1305-1312.
[2]ZHANG K, ZHANG L, Yang M H.Real-time compressive tracking[M].Heidelberg: Computer Vision–ECCV 2012. Springer Berlin, 2012.
[3]CANDES E J, TAO T. Decoding by linear programming[J].Information Theory, IEEE Transactions on, 2005(12):4203-4215.
[4]ACHLIOPTAS D. Database-friendly random projections:Johnson-Lindenstrauss with binary coins[J].Computer and System Sciences, 2003(4):671-687.
[5]GRABNER H, GRABNER M, BISCHOF H. Real-time tracking via on-line boosting[C].Proceedings on British Machine Vision Conference,2006(1):47-56.
Research on real time compression tracking based on HOG
Sun Jingwei, Ding Xueyong, Lei Ge
(Institute of Technology of Sanya University, Sanya 572022, China)
Compression Tracking projects Harr features onto the lower space to achieve a real-time tracking by using the compressed sensing theory. However, the feature which is extracted by this method is about color character, which is sensitive to light. In the occasion of the light with dramatic changes, it easily leads to the failure tracking. Based on the above discussion, we propose a HOG-based real-time compression tracking. In this paper, we use HOG features to replace Harr features to enhance the insensitivity to light, improve the tracking robustness. Through different video test results ,they show that the proposed method could track the target accurately in the light of dramatic changes and deformation circumstances, and the average frame rate is 15 frame/s, which is basically meet the real-time requirements.
compression sensing; Harr features; histogram of oriented gradient
孙景伟 (1988— ),男,海南三亚,硕士研究生,助教;研究方向:图像处理。