禹明娟,张英烈,陈临强
(杭州电子科技大学 计算机学院,浙江 杭州 310018)
医院监控场景下的人群密度估计方法
禹明娟,张英烈,陈临强
(杭州电子科技大学 计算机学院,浙江 杭州310018)
摘要人群密度估计是智能化人群监控中的重要内容,在公共安防、管理控制和商业决策等方面起着重要作用。文中针对医院应用场景,采用一种基于分块的方法,对每一个子图像分别利用基于像素特征与最小二乘直线拟合方法进行人数定量分析和基于灰度共生矩阵与支持向量机的方法进行密度定性分析,得到整幅图像中不同子图及整幅图像的人数和密度分布图。实验表明,该方法能有效的提高人群密度估计的准确率,且还能对局部的密度异常精准定位。
关键词人群密度估计;医院;最小二乘法;灰度共生矩阵;支持向量机
Crowd Density Estimation Method for Hospital Surveillance
YU Mingjuan,ZHANG Yinglie,CHEN Linqiang
(School of Computer Science,Hangzhou Dianzi University,Hanghzhou 310018,China)
AbstractCrowd density estimation,with increasing attention,is the primary content of intelligent crowd surveillance.It plays an important role in the public security,management control as well as business decision.In this paper,we apply it in the situation of hospital with partition methods.We firstly divide the crowd image to sub images.Then for every sub image,we conduct quantitative analysis to the number of people with the function based on pixel feature and least-square line regression respectively.We also conduct a qualitative analysis of the density of people with the function based on gray level co-occurrence matrix (GLCM) and support vector machine (SVM).The number and density distribution of different sub images included in the whole image are obtained for real-time monitoring of the number of people in hospital with accurate location of the local density abnormity.
Keywordscrowd density estimation;the situation of hospital;least squares method;GLCM;SVM
近年来,随着我国医院就诊人数的不断增长,各类大型综合性医院一号难求、人满为患的现象突出,对医院的就医环境和医疗秩序产生隐患[1]。因此,结合先进的图像处理和机器学习技术,对医院内的人群密度进行实时监测,对密度异常区域进行及时预警并及时采取措施疏散人群,合理分配医疗服务资源,维护就医秩序,保障就医环境是必要的。
根据人群密度特征的表征方式不同,人群密度估计方法[2]通常分为基于像素统计、基于纹理分析和基于目标分析3类方法。文献[3]提出基于像素统计方法,而文献[4]改进了这种方法,引入神经网络估计人群密度。该方法能获得准确度较高的密度估计结果。但由于高密度人群之间存在较为严重的遮挡现象,密度估计误差较大。文献[5]提出基于纹理分析的方法,但该方法主要适用于人群密度较高的场景,因低密度人群的纹理特征区分度较低,在进行分类时误差较大。文献[6]提出基于目标分析的方法对于分割技术要求较高,但实际应用中的人群图像通常难以用现有技术进行有效分割,误差较大。针对这些相关方法存在的问题,本文提出一种基于医院监控场景下的人群密度估计方法。
1方法整体框架
在医院的实际监控场景中,通常会出现整幅图像的人群数量较少,但局部人群过密的情况,无论采用基于像素特征与最小二乘直线拟合的低人群密度估计方法,还是采用基于灰度共生矩阵与支持向量机的高人群密度估计方法,均无法准确有效地估计人群密度。本文在医院实际场景下,采用一种基于分块的人群密度估计方法对医院人群进行实时监测。该方法通过摄像头采集医院场景图像,然后划分子块,对每一个子图像进行人数和密度估计。该方法主要有以下创新:(1)引入分块思想,根据摄像头的透视模型将图像划分为若干子图像,不仅可提高人群密度估计准确度,而且还能得到局部图像的人群密度分布图;(2)对每个子图像分别采用基于像素特征与最小二乘法的方法和基于灰度共生矩阵与支持向量机的方法,进行人数的定量和定性估计,从两方面确定了人数和密度,进一步提高人群密度估计精度。
图1 系统流程图
2方法设计与实现
2.1子图像的划分
在医院的实际监控场景中,视频监控区域面积较大,出现人群密度分布不均匀,采用传统方法无法发现局部密度异常,因此需要估计局部人群密度。本文采用一种分块的方法,分别估计子图像的人群数量,累加后得到整幅图像的人群数量,在提高人群密度估计准确度的同时,还能估计局部人群密度。由于摄像头成像存在一定的透视效应,同一场景下的同一物体在不同的位置外,成像大小不一致。因此,本文利用摄像头的透视模型进行子图像划分。
首先对视频图像进行纵向上的划分,子区域的划分比例可根据摄像头成像在纵向上的模型来确定,如图2所示。根据图2模型,可得
(1)
其中,c=Hcotα,a=d/3,b表示摄像头与最近拍摄点A在水平方向上的距离。由于医院监控场景中摄像头处于45°方向,根据和式(1)求出比例系数,3个实际监控区域大小基本相等,如图3所示。
图2 摄像头成像在纵向上的模型
图3 视频图像纵向上的划分
通过纵向划分保证子区域内图像对应的场景高度一致,为划分出面积基本一致的子图像,还需要对子区域在横向上进行划分。子区域的横向划分比例可根据摄像头成像在横向上的模型来确定,摄像头成像在横向上的模型如图4所示。
图4 摄像头成像在横向上的模型
根据图4模型,可得
(2)
其划分结果如图5所示,然后按顺序对每个子图编号。
图5 视频图像横向上的划分
经过划分处理,视频图像就被划分为若干个子图像,每个子图像对应的实际监控区域面积基本相等。值得注意的是,分块后会出现人体目标被分散到几个子图像中的情况,由于本文估计的是人群密度而不是人群人数,个体目标的分散对子图像中的像素特征和纹理特征影响基本可忽略,不影响人群密度估计结果。
2.2拟合的人数定量估计
在低密度人群情况下,人数与人群前景目标的像素特征之间有着较强的线性关系。因此,本文采用前景目标的像素面积特征和边缘像素特征这两个像素特征来表征前景图像,并利用最小二乘法分别建立人数与这两个特征之间的线性模型,并利用该线性模型对人群图像进行人群密度估计,其算法流程如图6所示。
图6 算法流程图
其主要过程如下:(1)人群图像的前景目标提取。由于医院场景是室内环境,背景单一。所以,本文一种结合平均背景[7]和帧间差分的方法。相邻帧进行差分处理,对背景部分的像素灰度值求平均值,即可得到背景图像;(2)计算前景像素面积。统计1中提取的前景像素个数,由于前景像素面积受前景目标距离摄像头的远近影响不同,故需进行归一化处理。提取前景面积像素后再除以整幅图像的像素,得到前景像素面积比特征;(3)统计前景边缘像素。使用基于二值图像的边缘检测方对图像进行边缘提取对样本图像进行二值化,以1为前景点,0为背景点,若某一非零点的4邻域内任一点为0,则为边缘点,否则为内点。通过该方法得到高精确的人群前景边缘,实时性高,然后统计边缘像素数量;(4)像素特征与人数的直线拟合。从监控视频中抽取80幅样本图像,并人工统计实际人数及其对应的前景像素面积比和前景边缘像素数量。利用最小二乘拟合法[8]便可分别计算出这两个像素特征与人数的线性方程。根据具体实验数据拟合得到的直线方程函数表达式为
(3)
由于采用单一的像素特征对人群人数进行估计存在一定的误差。因此,本文利用加权平均的方法使前景面积和边缘相结合,得到准确度更高的估算值。根据不同特征对人数估计影响的不同来确定相应的估算系数,改进后的人数估算公式如下
y=ay1+(1-a)y2=a(0.921x1+1.836)+(1-a)(0.006x2-0.162)
(4)
式中,y1表示基于前景像素面积估算的人数;y2表示基于前景边缘数量估算的人数;x1和x2分别表示前景像素面积比和前景边缘数量;a表示基于前景像素面积估算方法的估算系数。通过实验确定的估算系数a的最佳值为0.35。
2.3人群密度定性估计
在高密度人群情况下,由于人群之中相互遮挡现象比较严重,导致部分有效人群前景像素特征丢失,无法准确地描述人群密度,密度估计误差较大。但高密度人群图像的纹理特征显著,而且灰度共生矩阵[9]能有效地描述纹理信息。同时,由于支持向量机[10]拥有较强的泛化能力,并能够较好地解决局部最优和非线性等问题,且训练性能高,分类效果显著,因此本文结合纹理分析法的思路,采用一种基于灰度共生矩阵与支持向量机(SVM)的人群密度估计方法,其算法流程,如图7所示。
图7基于灰度共生矩阵与支持向量机方法的算法流程图
其具体过程如下:
(1)特征提取。灰度共生矩阵是像素对的联合概率密度P(i,j,d,q)组成的矩阵,其数学表达式定义为
[P(i,j,d,θ)]N×N
(5)
从上式可看出,灰度共生矩阵由灰度等级、方向和距离这3个参数决定。其中N表示灰度等级,即图像中像素对的灰度值范围,一般可取为8、16、32等;θ表示方向,即像素对之间的相对角度,一般只取4个角度0°、45°、90°和135°,需要选取恰当的构造参数来计算灰度共生矩阵,本文根据实际场景,选取θ=0°、90°以及d=10来计算灰度共生矩阵。
由于灰度共生矩阵直接作为纹理特征计算复杂度过高。因此,一般需在其基础上提取有效统计量作为纹理特征。本文使用以下5个纹理特征统计量作为人群密度特征:
能量统计量(Energy)
(6)
对比度统计量(Contrast)
(7)
相关性统计量(Correlation)
(8)
式中,μ1,μ2,σ1,σ2分别定义为
(9)
(10)
熵统计量(Entropy)
(11)
逆差矩统计量(Homogeneity)
(12)
(2)支持向量机分类训练。选取训练样本图像,从同一监控环境的不同时间段的实验视频中抽取了4种密度等级共800幅样本图像,其中每种密度等级的样本图像各200幅;提取图像纹理特征,计算5个纹理特征量,其中0°和90°方向的灰度共生矩阵各有5个特征量,每幅样本图像组成一个10维特征向量;建立分类器,利用支持向量机的机器学习方法,采用RBF核函数,并利用一对一的多类分类方法,样本图像的特征向量进行分类训练。由于样本图像中的密度等级有4种,其分类类别共4个,所以一共训练出6个SVM密度分类器。根据得到的支持向量机密度分类器便可对人群图像进行密度分类。
3实验结果与分析
实验环境:主机为处理器为i3 2.0 GHz,内存为2 GB的PC机,开发工具为Visual C++ 6.0和OpenCV1.0。实验视频由PC机自带摄像头采集,视频图像尺寸为320×240。经过上述处理过程可得到人群密度分布图,如图8所示,每个子图像的左上角表示其编号,右下角表示该子图像的估计人数与密度等级。
图8 人群密度分布图
图中每个子图像的左上角表示其编号,右下角表示该子图像的估计人数与密度等级。根据得到的人群密度分布图,文中不仅可得到整个监控区域的人群总人数,还可了解人群的分布情况和运动规律,对于图像局部的密度异常能有及时发现并准确定位。对所有子图像中的人群数量进行累加统计便可得到整幅图像的总人数,其实验结果如图9所示。
图9 整幅监控图像的估计总人数
图9中横坐标表示视频帧数,纵坐标表示人数,其中与纵坐标垂直的3条直线分别表示较高密度、高密度和中密度的对应人数。图9中细线表示估计人数,粗线表示实际人数,可看出估计人数的变化曲线与实际人数基本一致,只是在密度较高的时候估计人数比实际人数少,存在一定的误差,而在对于低密度情况,准确度较高。实验过程中处理每帧图像的平均耗时为0.197 s,每秒抽取两帧图像进行处理,基本可以满足医院实时监测的需求。
4结束语
针对医院场景实时人数监测的应用要求,采用一种基于分块的方法得到监控区域的密度分布图。通过对某医院门诊大厅内采集的一段视频进行人群密度估计,实验表明,该方法能有效地估计人群数量和密度,准确度较高,能满足实时性的需求。
参考文献
[1]曹杰,杨晓光,汪寿阳.突发公共事件应急管理研究中的重要科学问题[J].公共管理学报,2007(2):84-93,126-127.
[2]Davies A C,Yin J H,Velastin S A,et al.Measurement of crowd density using image processing[C].Edinburgh,UK:Proceedings of the VII.European Signal Processing Conference (EUSIPCO-94),1994.
[3]Ma R,Li L,Huang W,et al.On pixel count based crowd density estimation for visual surveillance[C].London:2004 IEEE Conference on Cybernetics and Intelligent Systems,IEEE,2004.
[4]Hussain N,Yatim H S M,Hussain N L,et al.CDES:A pixel-based crowd density estimation system for Masjid al-Haram[J].Safety Science,2011,49(6):824-833.
[5]Wang B,Bao H,Yang S,et al.Crowd density estimation based on texture feature extraction[J].Journal of Multimedia,2013,8(4):331-337.
[6]Lin S F,Chen J Y,Chao H X.Estimation of number of people in crowded scenes using perspective transformation[J].IEEE Transactions on Systems,Man and Cybernetics,Part A:Systems and Humans,2001,31(6):645-654.
[7]Monnet A,Mittal A,Paragios N,et al.Background modeling and subtraction of dynamic scenes[C].Shanghai:Ninth IEEE International Conference on Computer Vision,IEEE,2003.
[8]Chan A B,Vasconcelos N.Counting people with low-level features and Bayesian regression[J].IEEE Transactions on Image Processing,2012,21(4):2160-2177.
[9]Chen Y,Yang F Y.Research on characteristic properties of gray level co-occurrence matrix[J].Applied Mechanics and Materials,2012(204):4755-4759.
[10]Adankon M M,Cheriet M.Support vector machine[M].Springer US:Encyclopedia of Biometrics,2009.
中图分类号TP391.41
文献标识码A
文章编号1007-7820(2016)03-075-05
doi:10.16180/j.cnki.issn1007-7820.2016.03.019
作者简介:禹明娟(1990—),女,硕士研究生。研究方向:视频图像处理。
收稿日期:2015- 07- 12