史东承, 李雪燕, 石小丁
(1.长春工业大学 计算机科学与工程学院, 吉林 长春 130012;2.吉林省长春市高新技术产业开发区管理委员会, 吉林 长春 130012)
ViBe背景减除步态检测
史东承1,李雪燕1,石小丁2
(1.长春工业大学 计算机科学与工程学院, 吉林 长春130012;2.吉林省长春市高新技术产业开发区管理委员会, 吉林 长春130012)
摘要:在步态检测过程中,ViBe算法利用单帧进行像素建模以及背景突然变化的处理。与混合高斯模型进行了对比分析,结果表明,该ViBe算法在建模、识别率等方面具有优势。
关键词:步态检测; 背景消除; 背景建模;ViBe; 混合高斯模型
0引言
步态检测是从视频序列中提取出人体轮廓,是步态识别过程的第一步,也是至关重要的一步,步态特征的提取及识别与步态检测息息相关。从国内外的文献来看,步态检测的算法包括光流法、背景减除法以及帧间差分法。
背景减除法是目前检测中最常用的方法,它利用含有运动目标的当前图像减除背景图像得到运动区域的轮廓。背景减除法最重要的是建立合适的背景模型,中值滤波法、均值滤波法以及混合高斯模型是背景减除法常用的建模方法[1-2],前两者适合背景不变或者缓慢变化的场景,自动更新效果不好,后者通过多个高斯分布混合模型对像素进行建模,在背景发生变化时能够取得良好的结果,但其依赖于概率密度函数或统计学,这就要求我们对数学知识有非常好的掌握。文中提出一种不依赖概率密度函数基于像素建模的算法,即ViBe算法[3]。该算法简单,可以有效地完成人体轮廓的提取,并且提取的结果比较理想。
1ViBe算法描述
在实时应用中,要想取得理想的结果,背景减除方法要处理好3个问题:
1)背景建模;
2)模型初始化;
3)模型随时更新。
大多数论文描述了背景建模和更新机制,只有少数讨论了初始化,而当期望获得快速响应时,初始化是至关重要的。另外,省略模型初始化过程会使得模型和更新机制之间缺少连贯性。
1.1像素模型和分类过程
ViBe算法是基于像素的模型,该方法为每个像素点存储了一个样本集,像素点过去的像素值和其邻居点的像素值就是样本集中采样值,然后通过比较每一个新的像素值和样本集相似的程度来判断是否属于背景点。
ViBe背景建模如图1所示。
图1 ViBe背景建模
为每个像素点建立一个背景模型,此背景模型包含N个样本
(1)
式中:p(x)----x处的像素值;
M(x)----x处的背景建模值;
N----样本集大小。
然后比较像素p(x)与背景模型M(x)的相似度,如果不相似,分类为前景,否则为背景。数学上相似度可表示为:
(2)
式中:SR(p(x))----x处以R为半径;
p(x)----中心的球体;
U----球体与背景模型的交集。
当给定的阈值Umin大于U时,待分类像素p(x)与背景模型不相似;否则为相似。
1.2单帧初始化背景模型
文献[4-6]中很多主流的方法都需要多帧初始化模型,但是人们更希望从比传统背景减除算法初始化序列需要的更短序列中获得前景。针对这种情况,文中提出了一种新的方法,背景模型可以仅从单帧中获得。在应对突发光照变化时这种方法很简单,丢弃现有的背景模型,并且瞬时初始化一个新的模型。
由于单帧中无法体现时间信息,假设邻居点像素有相似的时空分布,用每个邻居点的值填充像素模型。准确来说,我们是用第一帧中随机选取的邻居点的值进行填充。需要邻域的大小可以选择,以使得它大到足以包括不同样本的足够数量,同时牢记在不同的位置值之间的统计相关性随邻域的尺寸变大而减小。
形式上,我们假设t=0时为第一帧,NG(x)为像素x的邻居点。因此
(3)
式中:y----随机选择的邻居点。
这种策略很好,但是也存在一些问题,就是会出现“鬼影”[7],即运动物体在第一帧时是以运动形式存在的,而在后续检测中却不运动了。这是由于在背景抽样过程中,把运动目标作为抽样得到的初始化结果,这种错误的初始化结果出现了“鬼影”。为了消除“鬼影”,提出了以下更新方案。
1.3背景模型更新策略型
背景模型能够适应比如光照的变化,背景物体的变更等背景的变化,这就是背景模型的更新。
严格意义上来说,时间信息对于比较模糊的背景是没有作用的。但是背景减除是一个时空过程,为了优化这个方法,我们可以假设该相邻点像素的时间分布与该像素点是相似的。根据这个假设,为了能够把隐藏在前景当中的背景像素更新到背景模型中,最好的方法就是在采用保守更新策略的基础上同时扩展空间信息。文中提供了一种利用空间信息的简单而有效的方法,这使得我们能够克服大多数纯保守更新方案的缺点。
更新策略包含3个重要部分:
1)无记忆更新策略,背景像素模型中样本的平滑生命周期得以保证;
2)随机时间二次采样,扩展时间窗口的背景像素模型;
3)空间上传播背景像素样本机制,空间连续性得以保证。
为使“百条禁令”落地生根,宿州公司不断创新管理的方法和手段,强约束、硬考核,聚力“两个融合”,深化“三个结合”,努力塑造安全型员工,打造安全型企业,形成安全管理新常态。新措施带来新成效,“百条禁令”颁布实施以来,该公司共下发通报20期,考核约8万余元,有效遏制了现场违章,2013年-2015年,该公司呈现了不安全事件逐年下降的良好态势,为该公司顺利完成五星级三连冠、全国安全文化示范企业等年度安全目标任务提供了坚实的保障
2更新策略
2.1无记忆更新策略
采用先进先出的策略更新模型是很多基于样本方法经常使用的方法[8-9]。为了合理处理背景场景各种事件,文献[5]提出了包含大量样本的像素模型,但是这对于高帧率视频来说是不适用的。文中提出了一种指数单调衰减剩余样本周期的方法,这种方法为了提高估计的时间相关性,允许像素模型中仍然保留一些较早的样本。最终使得模型中不会包含前景值,是这种方法和保守更新策略相结合的结果。
这种方法简单而有效:在均匀概率密度函数前提下,不是死板的把最早的样本从样本中移除,而是随机地选择舍弃的样本,然后移除的样本被新值代替。这种随机策略不能算是真正意义上的保守更新策略,因为它与原来的思想相矛盾。原来的思想是最先替换的应该是越早出现的像素样本,并且更新过程的稳定性对于保守更新策略来说是至关重要的。实际上,一种不确定性的背景减除算法在保守更新策略中出现,模型不会随着时间产生偏离在保守更新策略中得以保证。尽管这样,不同时间的同一序列在此背景减除算法下的处理结果也可能产生细微的差别。
从数学上来说,假设时间是连续的,一个样本值在时刻t不被更新的概率是(N-1)/N,那么样本值在dt时间之后仍然保留的概率是
(4)
也可写作
(5)
这个表达式表明模型中的这个样本值被替换与否和时间t无关。这种性能被称作无记忆性能,对指数密度是可用的,在背景减除领域有显著、独特的性能。它完全可以让我们定义一个时间段的历史像素样本,从某种程度上来说,允许更新机制适应任意的帧速。
2.2时间二次采样
采取随机时间二次采样可以进一步扩展时间窗口大小,这个时间窗口是由固定大小像素模型覆盖的。其思想是在很多实际情况中,每一新帧的每个背景像素模型没有必要全部更新,通过让背景更新不频繁,背景样本的预期寿命可以人为的延长。但是固定的二次采样间隔在周期或伪周期背景运动存在时,可能会阻止背景模型正确的适应这些运动。当该点像素值已经属于背景时,随机过程决定这个值是否随像素模型相应地更新,所以采用随机的二次采样策略成为当务之急。实际上,当该像素值已经属于背景时,随机过程决定这个值是否用于更新相应的像素模型。
2.3背景样本传播空间一致性
由于使用了保守更新方案,当务之急就是解决如何把前景当中隐藏的背景像素模型进行更新。W4的算法[10]是现在流行的方法,该方法通过计算该像素连续被检测为前景的次数来确定是否更新为背景点。即要想将一个像素点更新为背景,就要使得该像素点连续N次检测为前景。背景像素模型中永远不会存在前景的像素值,这是保守更新策略的优势,为了方便,在前景像素融入背景模型过程中,这些方法起到了一定的延缓作用。此外,由于这些方法取决于二元判决,从一个夹杂真实前景物体的背景模型中恢复出来需要时间,因此,提出了不同的方法。
邻域像素模型可以把一个新的背景样本更新进来,因为邻居点背景像素拥有相同的时空分布。根据这个策略,在背景样本更新时,被前景遮挡的背景模型也会随着更新,依赖抽样的背景模型中出现空间信息的扩散是可以的。背景模型因此能够适应不断变化的照明和背景变化(添加或移除背景物体),同时依靠严格保守的更新方案。更精确来说,考虑像素x的4或8邻域的空间邻域,即NG(x),并且假设它已经决定更新样本集M(x)。然后根据统一的规则,随机选择v(x)值从邻居点一个像素更新样本集M(y∈NG(x))。
3步态描述及实验
3.1步态描述
流程图如图2所示。
图2 流程图
3.2试验及分析
实验中,选取室外的场景拍摄了一段步态视频,并用OpenCV进行了仿真,参数设置如下:选取半径R=20,每个像素的样本模型个数N=20,随机时间二次采样因数φ=16,这样每一个背景像素值被选择更新,其像素模型的几率为1/16。从图2可知,当Umin=2或Umin=3时,PCC达到最高。但是实验中发现,由于Umin很小的一个增大就会增加计算的复杂程度,最后确定在稳定背景场景下设置Umin=1,即可取得良好的实验结果。实验中,在每个像素的8邻域连接处随机选择样本的方法可以取得令人满意的640*480分辨率的图像。
文中采用正确分类比例(PCC)对实验进行性能分析,公式如下:
(6)
式中:TP----正确分类为前景像素的个数;
TN----正确分类为背景的像素个数;
FP----被错误分类为前景像素的背景像素个数;
FN----错误分类为背景像素的前景像素个数。
Umin在1~20范围时的PCC值如图3所示。
图3 Umin在1~20范围时的PCC值
同时,文中把ViBe背景减除算法与混合高斯过程进行对比,步态检测结果显示ViBe算法比混合高斯取得的效果好很多。对比效果如图4所示。
这两种算法正确率情况比较见表1。
表1 正确率比较 %
4结语
针对传统建模算法存在的问题,提出一种基于ViBe算法的步态检测。该算法实现简单,检测速度快,和混合高斯模型相比有一定的优势。但是此算法检测过程中会出现“鬼影”,虽然“鬼影”会随之慢慢的消失,但是“鬼影”在一定时间内对步态检测还是有影响的。因此,要想获得更好的步态检测结果,如何有效的去除“鬼影”是接下来需要解决的至关重要的问题。
参考文献:
[1]DRMagee.Trackingmultiplevehicleusingforeground,backgroundandmotionmodel[J].ImageandVisionComputing,2004,22(2):143-155.
[2]王亮,胡卫明,谭铁牛.基于步态的身份识别[J].计算机学报,2003,26(3):353-360.
[3]OBarnich,MVanDroogenbroeck.ViBe:Apowerfulrandomtechniquetoestimatethebackgroundinvideosequences[C]//Proc.Int.Conf.Acoust.,SpeechSignalProcess.,2009:945-948.
[4]KKim,TChalidabhongse,DHarwood,etal.Real-timeforeground-backgroundsegmentationusingcodebookmodel[J].RealTimeImaging,2005:172-185.
[5]HWang,DSuter.Aconsensus-basedmethodfortracking:Modellingbackgroundscenarioandforegroundappearance[J].PatternRecognition,2007:1091-1105.
[6]AElgammal,DHarwood,LDavis.Non-parametricmodelforbackgroundsubtraction[C]//Proceedingsofthe6thEuropeanConferenceonComputerVision-PartII,2000:751-767.
[7]RCucchiara,MPiccardi,APrati.Detectingmovingobjects,ghosts,andshadowsinvideostreams[J].IEEETransactiononPatternAnalysisandMachineIntelligence,2003:1337-1342.
[8]CCChiu,MYKu,LWLiang.Arobustobjectsegmentationsystemusingaprobability-basedbackgroundextractionalgorithm[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2010:518-528.
[9]BWhite,MShah.Automaticallytuningbackgroundsubtractionparametersusingparticleswarmoptimization[C]//IEEEInternationalConferenceonMultimediaandExpo,Beijing:[s.n.],2007:1826-1829.
[10]HaritaogluDHarwood,LDavis.W4:Real-timesurveillanceofpeopleandtheiractivities[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2000,22(8):809-830.
GaitdetectionbasedonViBebackgroundsubtraction
SHIDongcheng1,LIXueyan1,SHIXiaoding2
(1.SchoolofComputerScienceandEngineering,ChangchunUniversityofTechnology,Changchun130012,China;2.TheCommitteeofManagement,ChangchunNationalHi-TechIndustrialDevelopmentZone,Changchun130012,China)
Abstract:Duringtheprocessofgaittesting,ViBealgorithmisusedtoestablishthesingle-framepixelmodel,anddealthesuddenchangesinbackground.ItiscomparedwiththeGaussianmixturemodelandtheresultsshowthattheVibealgorithmissuperiorinmodelingandrecognitionrate.
Keywords:gaitdetection;backgroundsubtraction;backgroundmodeling;ViBe(VisualBackgroundExtractor);Gaussianmixturemodel.
收稿日期:2015-11-10
基金项目:吉林省教育厅基金资助项目(吉教科合字[2016]第 349号)
作者简介:史东承(1960-),男,汉族,吉林长春人,长春工业大学教授,硕士,主要从事图像处理方向研究,E-mail:dcshi@ccut.edu.cn.
DOI:10.15923/j.cnki.cn22-1382/t.2016.3.07
中图分类号:TP391
文献标志码:A
文章编号:1674-1374(2016)03-0241-05