基于贝叶斯框架的目标分割方法研究

2013-12-29 00:00:00周雷陈喆王惠清
电脑知识与技术 2013年4期

摘要:运动目标的检测与分割是视频监控系统的基础,所分割出的目标的完整性对视频的后续处理如目标分类、跟踪及行为理解产生重要影响。实际场景通常很复杂包括静态的背景和动态的背景及运动目标。该文提出了基于贝叶斯框架的目标检测方法。首先求相邻两帧之差,通过自适应阈值把帧差图二值化为变化部分和静止部分。每个像素维护两个表分别对应静止和运运两种状态,表中表项记录像素最近最重要的概率信息,检索这些概率代入贝叶斯公式,求出当前帧像素点的最大后验概率,根据贝叶斯分类原则,对当前帧的像素进行分类。最后,对室内、室外拍摄的两个视频做实验进行验证,实验表明该方法在较复杂环境下,也具有较好的目标检测能力。

关键词:贝叶斯;目标分割;

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2013)04-0866-04

在视频流中检测和分割前景目标是后续处理如目标分类、目标跟踪和行为理解的基础。人脑智能所谓的前景通常是自已感兴趣的目标,其他场景成分一概归入背景。固定的摄像机,分割前景常用的方法有帧差法、背景减除法等,这些方法假设背景都是由静止的物体(其颜色或强度缓慢变化)构成。然而,当背景中含有目标物体的阴影如车影,运动物体如晃动的树枝,水波以及光照变化给前景目标的正确检测和分割带来挑挑战。当背景处于或场景缓慢变化时,单高斯就能较好的描述背景像素的噪声。对于周期运动的背景如摇动的树叶,像素在叶子和叶子后面的地面两种颜色为均值的分布中变化。像素呈现双峰状态。基于背景中可能有周期性动用的物体,近来,人们又提出了采用高斯混合模型(多个高斯的线性组合)来描述每个背景像素。高斯的权重、均值,方差迭代更新以适应环境的变化。但是,这些方法不能处理光线的缓慢的变化和突变。如从早到晚的光线变化和开关灯的全局背景光线的突变。此外,存在前景目标与背景的相互转换的情况如移动背景物体而产生的背景局部变化(如移动凳子)及开车停在停车位,车成为了背景物体。在某些情况下,背景像素可能有多种状态,因此,对于复杂的场景,背景的不同部分应用不同的特征来描述。

本文中采用基于贝叶斯框架目标检测方法。首先求相邻两帧之差,通过自适应阈值把帧差图二值化为变化部分和静止部分。每个像素维护两个表分别对应静止和运运两种状态,表中表项记录像素最近最重要的概率信息,检索这些概率代入贝叶斯公式,求出当前帧像素点的最大后验概率,根据贝叶斯分类原则,对当前帧的像素进行分类。

1 贝叶斯分类

假设[vt]是序列图像中t时刻, [s=x,y]位置,像素的特征向量。由贝叶斯规则,[vt]的后验概率是

[PC|vt,s=Pvt|C,sPC|sPvt|s] (1)

式中的分母

[Pvt|s=Pvt|C,sPC|s] (2)

其中[C]为前景或背景,这是两类判别问题,由贝叶斯决策论,比较后验概率[Pb|vt,s]和[Pf|vt,s]的大小,如果满足

[Pb|vt,s>Pf|vt,s] (3)

则把[vt]分类为背景。将式(1)、(2)代入(3)中得

[2Pvt|b,sPb|s>Pvt|s] (4)

这个公式说明,我们只要知道了当前像素的三个概率:[Pb|s],[Pvt|b,s],[Pvt|s]就可以判定像素的类别。

2 特征统计表示

背景通常被认为是没有出现感兴趣目标的场景,由无生命的物体组成,静止在原地不动,背景像素的状态稳定。而感兴趣目标经常在场景中移动。因此,所选取表达背景的特征,在像素s,特征向量会集中在一个特征直方图很少量直方块内。而前景的特征向量会分布在较宽的范围。这种意味着,选择好的特征,可以覆盖大部的特征向量(背景在s处的像素,在时间域上的直方图,少量的柱块,就能反映大部分的像素变化),比例为[M],如[M1]=90%,[M2]=10%。设[Pvt|b,s,i=1,…,N1],是[Pvt|b,s]的降序排列的前[N1]个概率值。[N1]是经验值,稳定的背景特征相对集中,[N1]取较小值,而对于变化较大的背景,取稍大的值。

[i=1N1Pvit|f,s>M1], [i=1N1Pvit|f,s

每个像素,在t时刻都维护着一个统计表[Ss,t,ivt],记录[N2]([N2>N1])个最重要的值的概率信息。表中的每个表项,由三项组成,这三项对就于(4)式中的三个概率。

[Ss,t,ivt]= (6)

此表由特征直方图的最重要的部分构成,表中的元素以[pt,iv]降序排列。同时[ps,tb=Pb|s]要据场景的变化,迭代更新。表中的前[N1]个元素足以覆盖背景特征向量绝大部分。所以在表的前[N1]个元素中有,[pt,iv≈pt,ivb]。

3 特征选择

静态背景的像素,采用颜色的三个分量(r, g, b)做为特征向量,[vt=ct=[rt,gt,bt]]。对于运动的背景物体,虽然像素的颜色变化很大,但相邻两帧间运动物体上的颜色发生相似的变化。据此,采用前后帧两组颜色分量做为特征向量,[vt=cct=[rt-1,gt-1,bt-1,rt,gt,bt]]。为了表达背景中的像素具有静止和运动两种状态,每个像素维护两个记录表[Ss,t,ic]和[Ss,t,icc]。

4 算法描述

4.1 变化检测

前后两帧求差和背景减除得到两副帧差图[FDjs,t=Fjs,t-Fjs,t-1]和[BDjs,t=Fjs,t-Bjs,t],其中[j=r,g,b],[Bjs,t]为参考背景图。分别对[FDjs,t]和[BDjs,t]求灰度直方图,直方图求区间[255-i,255]上的方差[δ2i],其中[i=1,…,255]。 [T=maxδ2i] 。对[FDj]及[BDj]二值化,图像静态区域置0,变化区域设置1。

(7)

(8)

[T]取最大方差,考虑的是只有当像素灰度变化很大时,才把像素分为变化部分,提高了静态背景的搞噪声能力。

4.2 细分类

二值图把图分为静止区域和变化区域。应依像素状态的不同选择的相应的描述像素的特征向量。属于静止物上的像素,采有特征向量[vt=Ct=[rt,gt,bt]],变化的像素采用特征向量[vt=CCt=[rt-1,gt-1,bt-1,rt,gt,bt]]。当前帧的像素的特征向量[vt]与该像素维护的对应表的前[N1]元素的向量比较,如果向量对应分量差的绝对值均小于预定义阈值[δ],则认为它们匹配,[M=1],否则[M=0]。把表项中所有匹配(即所有与[vt]相似的向量)的相应概率相加,求出当前在[s]处的像素的两个概率[P(vt|s)]及[P(vt|b,s)]。因此,根据贝叶斯判别式(4),可以把像素分类为背景或者前景。如果表中无匹配的项,则令 ==0。

(9)

4.3 联合时空域信息的分割

通过像素的邻域约束关系可以减少目标的破碎或孔洞的情况,提高分割的质量。为了进一步剔除被错误检测为前景的背景像素和填充漏检的前就像素,我们联合像素时空信息来对目标二值化模板进行处理。对于第t帧,由前面方法检测的目标区域,统计当前二值图像目标外接矩形框内各像素在前面[L]帧中属于前景点的情况,计算像素的累计值。令[ps,t]表示当前帧中像素[s]基于时域特征属于前景的概率:

[pus,t=1Li=t-L-1tFtds,t] (10)

[pus,t]反映了各像素在时间轴上的相关性,即如果一个像素在序列图像前若干帧中的对应像素属于前景,则该像素在当前帧中属于前景的可能性会比较大,相反,该像素属于前景的可能性就小。

考虑第[t]帧二值图像中像素[s]的[3×3]邻域,如果一个像素邻域内有若干个像素属于前景,则该像素属于前景的可能性会比较大,反之,属于前景的可能性就小。

[pvs,t=19k=-11j=-11Ftdx+k,y+j,t] (11)

令[pmaxs,t=maxpus,t,pvs,t],当[pmaxs,t]大于预定义的阀值[Tp]时,表示像素属于前景。

4.4 模型更新

4.4.1 渐变时表更新

表的更新采用迭代等式同时进行。

其中[Ms,tb]为最终分割出来二值图像在[s=(x,y)]处的值。当[vt]与[Ss,t,ivt]的[vit]最匹配时,[Ms,t,iv=1],[Ms,t,jv=0,j∈1,…,N2,j≠i],由上式可以看出当等式右边的匹配项[Ms,tb],[Ms,t,iv],[Ms,tb∧Ms,t,iv]为1时,等式左边的[ps,t+1b],[ps,t+1,ivb],[ps,t+1,ivb]分别略有增大,否则,减少。[α]决定背景的更新速度,[α]越小,越稳定,越大,越来越能适应环境的变化,但会对噪声敏感。当在[Ss,t,ivt]中找不到匹配项时,令[Ss,t,ivt]的第[N2]项[ps,t+1,N2v=α],[ps,t+1,N2vb=α],[vN2t+1=vt]。表项更表完后,要对表项以[ps,t+1v]降序排序,保证最常出现的特征排在前面。

4.4.2 突变时表更新

背景稳定时由(5)式,两边乘[Pf|s]得

[Pf|si=1N1Pvit|f,s

由此可以得出,当由于背景突变时,存在关系式

[Pf|si=1N1Pvit|f,s>T] (14)

将式(3)代入式(14)中,变换得

[i=1N1ps,t,iv-ps,tbi=1N1ps,t,ivb>T] (15)

此式为检测到背景突变的判断标准,当检测到背景像素有突变时,每个像素维护的表以下方式更新

4.4.3背景更新

根据像素s是否是变化点,采用不同的更新方式如下:

5 实验结果

拍摄了两个视频:视频1:一个人在室内来回走动,室内光线强度发生变化。

视频2是户外的以晃动的树为背景,两个人在树前来回走动,稍后,其中一个人停在原地不动,另外一个人,继续走动。

从以上视频处理的结果,可以看出本文中提出的算法,对树木摆动,光线变化,以及运动目标转变为背景等环境具有较好的适应能力。

6 结束语

本文提出了基于贝叶斯框架的目标检测方法。首先求相邻两帧之差,通过自适应阈值把帧差图二值化为变化部分和静止部分。每个像素维护两个表分别对应静止和运运两种状态,表中表项记录像素最近最重要的概率信息,检索这些概率代入贝叶斯公式,求出当前帧像素点的最大后验概率,根据贝叶斯分类原则,对当前帧的像素进行分类。最后,对室内、室外拍摄的两个视频做实验进行验证,实验表明该方法在较复杂环境下,也具有较好的目标检测能力。

参考文献:

[1] Wren C, Azarbaygaui A, Darrell T, et al. Pfinder: Real-time tracking of the human body[J]. IEEE Trans. Pattern Analysis and Machine Intelligence, 1997,19(7):780-785.

[2] Rosin P. Thresholding for change detection[J]. In Proceeding of IEEE Int’t Conf. on Computer Vision, 1998:274-279.

[3] 葛庆国.基于自适应背景更新车辆检测算法[J].电子测量技术,2004,27(3):17-18.

[4] Stauffer C, Grimson W E L. Adaptive background mixture models for real-time tracking[J].In Proceedings.1999 IEEE Computer Society Conference on Computer Vision and Pattern Recongition. IEEE Comput. Soc.,1999.

[5] Christopher M. Bishop. Pattern Recognition and Machine Learning[M].Springer Science+Business Media, LLC,2006.