龙思凡 金路 王仁捷
摘要:教室人数统计方法,该方法适用于在教室这个特定场景下使用,将采集视频的摄像头垂直向下拍摄,能够有效地避免人体相互遮挡和重叠,能够将人体目标划分为单独的个体。实验数据表明,该方法计算精度可达90%左右,计算速度可达每秒20帧左右。与现有方法相比,该方法在精度、实时性和健壮性方面都有很大的提高。
关键词:人数统计;前景分割;背景差分;运动检测;目标跟踪
中图分类号:TN948.6 文献标识码:A 文章编号:1007-9416(2019)05-0134-02
1 背景
1.1 教室人数统计研究背景
当我们在讨论大创的研究方向的时候,我们就在考虑我们的学习生活中有哪些还不够方便,或者能更方便的地方。我们发现教室的相关情况信息包括人数,在上什么课,将会有什么课,会有什么活动都是封闭的,同学们往往需要打开门看看里面有没有课,或者有多少人在上自习。想要用教室组织活动的时候,往往也是要在黑板上写占用教室相关的信息。这种流程是可以更简单的,并且教室的资源应可视化,并依此合理调度管理。因此我们想做一个以即时视频图像识别人数为技术基础的教室信息活动管理APP。
1.2 课题研究的目的和意义
从算法的角度来看,传统人数统计算法的一般过程是:首先采用合适的方法如帧差法、背景减除等进行运动目标提取,然后利用时空关系、帧间关系等进行运动目标的跟踪,最后通过某些判断方法统计出人数。在这个过程中,最重要的步骤是目标识别和目标跟踪,其中目标识别的效果直接影响运动目标选择的准确性,目标跟踪的效果则是影响最终跟踪计数的准确度。目前已有的算法能够取得不错的人数统计效果,但是不论是在实时性还是准确度上都存在一定程度的限制和不足,仍然存在改进和优化的可能,这也是本课题研究意义所在。
同时,从应用方式的角度来看,人数统计系统的视频获取部分一般由红外摄像头组成,而且为了在高度一定的时候扩大可视区域摄像头常常会带有广角镜头。但是在实际的应用当中,人数统计系统的方案经常会遇到一些复杂的情形与问题:如果摄像头采取轴线垂直向下的方式安装,系统能够避免运动目标相互重叠和遮挡,并且重点针对人头部分进行处理,避免人体其余部分的干扰。
1.3 国内外研究现状
现在国内外都有人流量统计的技术,但我们自己想针对教室环境,和我们需要的信息做出优化,能够让硬件高效准确的给我们传递需要的信息。当前的视频人数统计大致分为两类:
(1)基于特征提取的人数统计方法。考虑到在教室中人头部分遮挡较小,多样性也相对人体较低,所以本文选择检测人头作为人数统计对象。首先通过机器学习Adaboost的方法得到人头检测分类器,并使用多尺度滑动窗配合非极大值抑制算法对视频图像进行人头初步检测。然后,将第一步人头初检测出的结果图像输出,并人工挑选出这些难分的正确分类与错误分类的图像,再将它们作为SVM算法的训练样本进行再学习。学习得到人头筛选的二次分类器用以对初步检测结果进行二次筛选,以此方式有效去除错误检测,增强了计数可信度。最后,使用卡尔曼滤波与检测结果数据关联算法弥补帧间漏检,并把数据关联处理后的结果作为最终的人数统计结果。实验证明该方法解决了有效去除误检测与帧间漏检问题,使得检测与人数统计结果更加稳定,对比初步检测结果,计数准确率提了10%以上。
(2)基于背景差分的边缘信息统计方法。通过背景差分等方法获得图像的一些边缘信息,加以深度信息,高斯建模等进行匹配。由于我们主要是针对教室视频监控的实时人数统计,容易获得稳定的背景信息.这里参考了基于背景差分法的CSDN博客信息:根据目标的运动轨迹计算目标运动方向和位移,判断目标是进入还是离开指定区域,从而对目标进行数目统计。例如:需要统计公交车的人数,就可以利用python-opencv对人头统计,然后利用轨迹分析计算目标运动的方向和位移,来判断目标是上公交还是下公交。
2 算法简介
目前有许多实现视频目标跟踪的方法,这些方法目的稍微不同。例如,当跟踪所有移动目标时,帧之间的差异会变得非常有用;当跟踪视频中移动的手时,基于皮肤颜色的均值漂移方法在这里有着最好的应用;当知道跟踪对象的一方面时,模板匹配又会是最优的选择。所以没有最好的算法,只有在适当场景中最合适的方法针,对在教室门口跟踪人体这个特定应用,本文提出了一种基于MeanShift的跟踪和计数算法,能够有效实现目标跟踪并满足实时性要求。
2.1 目标跟蹤
为了跟踪视频中的所有目标,首先要识别视频帧中那些可能包含运动的目标区域,最简单的就是帧差法,所谓帧差法就是将视频中的前几帧作为输入的背景然后对于以后读取的帧都会计算它与背景之间的差异。在这之前要先将帧转化为灰阶,并进行模糊处理(每个输入的视频都会因为自然震动、光照变化或者摄像头本身而产生噪声。对噪声进行平滑是为了避免在运动和跟踪时将其检测出来),之后进行侵蚀和膨胀处理来达到透明,最后在计算出的差分图中找到所有白色斑点的轮廓。
2.2 计数线的设置和计数
计数之前需要确定计数线和辅助计数线(可以形成技术区域),这里需要注意的是,计数线和计数区域设置完成后,计数区域不做显示,仅仅显示计数线,但是计数区域的数据已经被保存在算法当中,用于辅助判断。首先通过背景分割器识别出感兴趣的区域和与之相应的运动对象(提取出每一个区域,实例话学生类,记录帧以及跟踪窗口的目标形成感兴趣区域),进而提取ROI的HSV直方图,计算学生HSV直方图的反向投影,接下来使用均值漂移对目标进行跟踪,当目标进入计数区域时根据计数线来判断学生运动方向,计数区域用于辅助计数线进行判断。只有进入了计数区域内的对象才会成为计数的候选对象,在此区域外的对象只是被检测和跟踪。
3 计数部分算法详解
3.1 计数线的设置和计数区域
目标跟踪计数之前需要确定计数线,其中计数线用于判断行人进出的方向以及是否过线,计数线的方位分为水平方向和垂直方向,分别对应上下过线和左右过线;计数区域中心线即为计数线,基于运动目標在过线时间段内仅仅在局部区域内运动的事实,在此区域外的目标只是被检测和跟踪。采用本方法能够在大大减少计算量的同时保持统计的准确度。
3.2 目标跟踪
本文采取的目标跟踪算法主要步骤为:算法维持一个跟踪目标数组,每个节点存储了被跟踪目标的信息(中心点坐标,大小,颜色直方图)。算法对每一帧检测到的所有新目标根据特定算法逐个做出判断:若该目标已经在跟踪目标中,则忽略该目标;若该目标不在跟踪目标列表中,则视为新的跟踪目标,并插入跟踪目标列表。对于跟踪目标列表中的每个目标都采用MeanShift算法进行更新,直到满足某种终止条件则停止跟踪并清除。
3.3 本章小结
本文提出了一种基于MeanShift的运动物体跟踪与计数算法,通过维持一个检测目标的跟踪数组,实时记录对象的中心位置,通过判断轨迹与计数线和区域的相对位置关系来判断计数与否。从最终的人数统计实验结果可以看出,本文所提出的人数统计算法能够取得92%以上的统计精度而且在统计速度和效率上相较于传统方法有了很大提升。
4 结语
基于教室的这一特定场景,本文提出了一种新颖和有效的人数统计方法断面式人数统计,首先教室相比于外界背景稳定受光线影响小易于使用帧差法,且运动物体单一(只有人)容易识别误差小,本文的主要创新点在于:我们想对教室活动和信息的管理和展示的想法本身,以及针对性的统计人数算法的开发与优化。把教室的信息集合在app上,并有一个主动的信息公布(app上有教室信息),基本信息包括实时人数,教室一天的活动,app将会能够查询到更多信息并提供更有针对性的信息查询功能,比如针对占用教室组织活动的查询,针对上自习人数的查询。在教室内这个特殊场景下我们采用了断面式人数统计,将摄像头自上而下拍摄能够有效地避免多个人时的相互遮挡和重叠,利用腐蚀和膨胀还有连通器原理能够将多个人体目标划分为单独的人体,能够准确的确计数。与现有的基于人脸检测和人体检测的人数统计方法相比,本方法大大提高了统计准确度而且降低了计算复杂度。
参考文献
[1] 黄凯奇,陈晓棠,康运锋,谭铁牛.智能视频监控技术综述[J].计算机学报,2015(06):1093-1118.
[2] 李苗,刘卫宁.视频监视技术在公交车自动乘客计数中的应用[J].西华大学学报,2006,25(4):04-08.
[3] 张英.基于视频的实时人数统计关键技术的研究[D].杭州电子科技大学,2014.
[4] Ahuja N,Todorovic S.Extracting texels in 2.1D natural textures[C].Computer Vision,2007.ICCV 2007.EEE l1th International Conference on.IEEE,2007:1-8.
[5] Rabaud V,Belongie S.Counting crowded moving obj ects[C].Computer V ision and Pattern Recognition,2006 EEE Computer Society Conference on.EEE,2006(1):705-711.
[6] Chen L, Tao J, Tan Y P, et al. People Counting Using Iterative Mean-Shift Fitting with Symmetry Measure[C].The 6th International Conference on Information, Communications & Signal Processing,2007:1-4.
[7] Wen W, Ho M, Huang C. People Tracking and Counting for Applications in Video Surveillance System[C]. International Conference on Audio, Language and Image Processing,2008:1677-1682.
[8] Aik L E, Zainuddin Z. A Kernelized Probabilistic Neural Network Approach for Counting Pedestrians[C].IEEE International Symposium on Industrial Electronics,2009:2065-2068.