频繁抖动相机下的运动目标快速检测算法

2016-06-24 00:52徐西平周宝灿

电视技术 2016年3期

关键词：目标检测图像处理

徐西平，周宝灿

(凯迈(洛阳)测控有限公司，河南洛阳 471009)

频繁抖动相机下的运动目标快速检测算法

徐西平，周宝灿

(凯迈(洛阳)测控有限公司，河南洛阳 471009)

摘要:为了区分相机抖动导致的图像运动与真实目标导致的图像运动，提出一种新的算法，其分析了两类运动分布，而不是亮度/彩色分布。一类运动分布是长时间范围建立起来的，其仅包含背景运动。另一类运动分布是短时间范围建立起来的，既包含背景运动也包含目标运动。最终通过对这两类运动分布的差分进行阈值分割实现运动目标检测。该算法运行速度快，且内存开销低，实验表明其在有着频繁相机抖动的室内及室外场景中表现出优异的性能。

关键词:图像处理；背景相减；目标检测；运动分布；相机抖动

1运动目标检测

作为计算机视觉的基础课题，运动目标检测在视频监控中有着广泛的应用。由于视频监控通常采用静止的相机，因此一条直观的运动目标检测思路[1-2]就是将输入图像与不含运动目标的参考图像(即背景图像)求差分，然后利用差分将图像中的像素分为目标或者背景。为了更为准确地处理图像噪声，文献[3]使用单个高斯分量建模每个背景像素的亮度分布。基于噪声与时间无关的假设，高斯分量的参数通过一序列静态背景图像训练得到。而后认为概率值低于预设阈值的像素即为运动检测结果。可是，在许多户外场景中，背景并非完全静态的，比如风吹动的树枝、水面的波纹、雪花等自然现象。在这些场合，每个像素的亮度分布通常是多模态的，难以用单个高斯分量描述。因此，研究人员相继提出了混合高斯模型[4-6]及非参数背景模型[7-8]。文献[4]利用混合高斯模型对每个像素进行建模，并使用一种逼近的在线算法对模型进行更新，该方法对渐变的背景具有很好的适应性。在文献[7]中，核密度估计方法被用来对每个像素进行建模，其中每个像素均涉及到两种模型，即选择性更新的短时模型与随时更新的长时模型，而后应用一个概率阈值分割出相应的前景目标。此外，还有研究人员利用Winer滤波[10-11]或者Kalman滤波[10-11]预测动态背景的亮度值。这些预测的优势在于能够学习重复的纹理模式，因而即使运动目标的亮度分布背景相似，它们仍能被检测出。文献[12]虽然能够快速检测出运动目标，但其只能在相机静止情形下适用。

虽然上述方法可以很好地适应背景的渐变变化，但是，当场景中存在频繁的相机抖动时，这些方法的性能会大打折扣。如图1所示，在强边缘附近存在大量的虚假检测，这是因为相机的频繁抖动会引起这些区域像素的亮度发生快速变化，而传统的统计建模方法难以将这类变化与运动目标导致的图像变化区分开来。尽管通过相机运动补偿来配准图像可以克服该缺陷，但是，相机运动估计及补偿会极大地增加算法的复杂度。因此，本文提出一种新的运动检测方法，其无需相机运动补偿配准图像的过程，且仍能在相机频繁抖动的情形下表现出不错的性能。传统的统计建模方法主要是对亮度/彩色分布进行建模，而本文提出的方法是对运动的分布进行建模。此外，本文的方法仅需少量的存储开销且拥有较快的运行速度。

2算法

2.1概念

将背景图像与第t帧输入图像分别记为b={b(x)|x∈S}与I={I(x,t)|x∈S}，S为图像中像素坐标集合。对灰度图像序列而言，b(x)与I(x,t)表示0～255之间的标量，而对于彩色图像而言，b(x)与I(x,t)为(0,0,0)至(255,255,255)之间的向量。

2.2具体思路

如前所述，相机的抖动可通过相机运动补偿来移除，然而这样会极大地增加算法的运算复杂度。因此本文算法的目的是在无需相机运动补偿的前提下实现频繁抖动相机下的运动目标检测。

传统的运动检测算法往往使用像素的亮度/彩色特征，本文提出通过分析像素的运动特征来进行运动检测。尽管对于图像序列而言存在多种多样的运动特征可供使用，但是最简单而意义最直观的运动特征为背景相减获得的二值结果，也就是Lt。

图2　本文算法流程

(1)

其中，M是训练图像的数量。如图2所示，A图像包含了背景的平均运动特征，其在强边缘附近的值较大，而均匀区域的值较小。同时，假如M足够大，即使训练序列中含有运动目标，但其对于A图像的值几乎不会产生影响。

类似地，第t帧观测到的前w帧的运动特征平均值可定义为

(2)

由图2所示，O图像在强边缘附近的值较大，这是因相机抖动导致的，同时在含有真实目标运动的区域，其值也较大。因此，一种新的运动检测结果可以通过对O图像与A图像的差分进行阈值分割来得到，其在很大程度上移除了因相机频繁抖动导致的虚假检测，公式如下

L′(x,t)=(O(x,t)-A(x))>τ

(3)

其中，τ为阈值。为了适应场景的变化，A图像还需进行更新，更新过程如下

A=αA+(1-α)O

(4)

其中，α为更新参数，其值处于0至1之间。此外，用于计算L的背景图像b也需进行类似的更新。

算法的具体步骤(伪代码)如下：

输入：视频图像I

输出：运动检测结果L′

初始化：

1.b←对序列图像(I0,I30,I60,…,IN)进行

时域上的中值滤波

2.A←0

3.For每一帧t=1,2,…,M

A←A+Lt/M

End

运动检测：

1.k←0

2.For每一帧t

L′←(O-A)>τ

A=αA+(1-α)O

k←mod(k+1,w)

End

3实验结果

为了验证所提出的方法，接下来将采用室内及室外包含频繁相机抖动的图像序列进行测试。实验参数设置为τ1=35，τ=0.5，M=300以及w=30。在此，将提出的算法与混合高斯模型[5]及核密度估计技术[7]进行比较。为了便于比较，对二值检测结果均不进行形态学滤波等后处理工作。

两个序列分别为人行道场景及羽毛球馆场景，两个场景均存在频繁的相机抖动。如图3所示人行道场景，3b为混合高斯检测结果，3c为核密度估计检测结果，可以看出，以上两种技术无法处理相机的频繁抖动，因而强边缘附近均存在大量的虚假检测，而这些在本文算法的检测结果3d中都得到了极大的移除。与此类似，对于图4所示的羽毛球馆场景，本文算法对相机频繁抖动的处理效果明显优于混合高斯模型及核密度估计技术。

图4　羽毛球馆场景

此外，本文算法仅需很低的存储开销，但具有较快的运行速度。对每一个像素，O与A分别需要一个浮点数，存储L[·]需要w/8byte，这远低于高斯混合模型及核密度估计技术所需的存储开销。同时，在双核2GCPU/ 1GbyteRAM的PC上，对于320×240的图像序列而言，本文算法在MATLAB上运行速度约为20f/s(帧/秒)。

4结论

为了处理相机频繁抖动下的运动目标检测问题，本文提出了一种新的方法，其利用场景的运动分布，而不是亮度/彩色分布，并且无需相机运动补偿过程。该方法累积两种运动分布：一种是较长时间范围内的运动分布，其对应着背景的运动；另一种是较短时间范围内的运动分布，其既有目标的运动又有背景的运动。通过对这两种运动分布求差分并进行阈值分割，即可得到最终的运动目标检测结果。实验证实该方法可有效处理相机的频繁抖动，且运算速度快，存储开销低。

参考文献：

[1]代科学，李国辉，涂丹，等. 监控视频运动目标检测减背景技术的研究现状和展望[J].中国图象图形学报，2006，11(7)：919-927.

[2]ELHABIANSY，EL-SAYEDKM，AHMEDSH.Movingobjectdetectioninspatialdomainusingbackgroundremovaltechniques-state-of-art[J].Recentpatentsoncomputerscience，2008(1)：32-54.

[3]BARNICHO，DROOGENBROECKMV.ViBe：Auniversalbackgroundsubtractionalgorithmforvideosequences[J].IEEEtransactionsonimageprocessing，2011，20(6)：1709-1724.

[4]WRENCR，AZARBAYEJANIA，DARRELLT，etal.Pfinder：Real-timetrackingofthehumanbody[J].IEEEtransactionsonpatternanalysisandmachineintelligence，1997，19(7)：780-785.

[5]STAUFFERC，GRIMSONWEL.Learningpatternsofactivityusingreal-timetracking[J].IEEEtransactionsonpatternanalysisandmachineintelligence，2000(22)：747-757.

[6]ZIVKOVICZ，VANDERHEIJDENF.Efficientadaptivedensityestimationperimagepixelforthetaskofbackgroundsubtraction[J].Patternrecognitionletters，2006，27：773-780.

[7]MIGDALJ，GRIMSONWEL.Backgroundsubtractionusingmarkovthresholds[C]//Proc.IEEEWorkshoponMotionandVideoComputing.WashingtonDC：[s.n.]，2005：58-65.

[8]ELGAMMALA，DURAISWAMIR，HARWOODD，etal.Backgroundandforegroundmodelingusingnon-parametrickerneldensityestimationforvisualsurveillance[C]//ProcIEEE. [S.l.]：IEEEPress，2002，90：1151-1163.

[9]MITTALA，PARAGIOSN.Motion-basedbackgroundsubtractionusingadaptivekerneldensityestimation[C]//ProceedingsofIEEEConferenceonComputerVisionandPatternRecognition. [S.l.]：IEEEPress，2004：302-309.

[10]TOYAMAK，KRUMMJ，BRUMITTB，etal.Wallflower：Principlesandpracticeofbackgroundmaintenance[C]//ProceedingsofInternationalConferenceonComputerVision. [S.l.]：IEEEPress，1999：255-261.

[11]ZHONGJ，SCLAROFFS.SegmentingforegroundobjectsfromadynamictexturedbackgroundviaarobustKalmanfilter[C]//ProceedingsofInternationalConferenceonComputerVision. [S.l.]：IEEEPress，2003： 44-50.

[12]许亚军，许慧芳，张艳春. 智能视频监控系统中运动目标检测的研究[J]. 电视技术，2014，38(9)：228-231.

责任编辑：闫雯雯

Fastmovingobjectdetectionwithheavycamerajitter

XUXiping，ZHOUBaocan

(CAMA(Luoyang) Measurements&Controls Co.，Ltd.，Henan Luoyang 471009，China)

Abstract:In order to deal with the disambiguation of image motion induced by the camera jitter and image motion influenced by the truly moving objects， a new method is proposed by analyzing two types of motion distributions instead of intensity and color distributions. One type of motion distribution is accumulated during a long period of time， and contains only the background motion. The other is accumulated during a short period of time， and includes both the background motion and the object motion. Finally moving objects can be detected by thresholding the difference between the two distributions. The proposed method is fast and requires little memory. Experimental results validate the method performs well on both indoor and outdoor video sequences with heavy camera jitter.

Key words:image processing； background subtraction； object detection； motion distribution； camera jitter

中图分类号:TP391

文献标志码：A

DOI：10.16280/j.videoe.2016.03.027

收稿日期：2015-06-24

文献引用格式：徐西平，周宝灿. 频繁抖动相机下的运动目标快速检测算法[J]. 电视技术，2016，40(3)：126-129.XUXP，ZHOUBC.Fastmovingobjectdetectionwithheavycamerajitter[J].Videoengineering，2016，40(3)：126-129.