雷松泽
(西安工业大学 计算机科学与工程学院,西安710021)
与可见光相比,红外成像具有独特的优势.红外图像的主要优势在于他是物体的热成像,具有强大的“穿透”能力.红外成像几乎不受光照条件和环境的影响,可以透过黑暗和烟雾,进行全天候工作.因此,红外图像中人体目标识别技术广泛应用于各个领域,如近距离军事侦察和打击、边境及特殊场所安全监控、人员解救、辅助驾驶(行人检测)、人机接口、机器人视觉等.
红外图像中人体目标的检测的核心技术在于对场景中人体目标进行快速分割和分类,其中目标的准确分割是整个识别系统的基础和关键.但由于不同红外成像设备参数的差异以及目标周围环境的影响,关于红外人体目标分割阈值自动选取算法的鲁棒性问题一直没有很好的解决方案.
由于红外图像是热成像,通常情况下,人体的温度比周围环境的温度要高,因此红外成像中人体的亮度比图像中背景的亮度要高,故采用阈值分割技术对红外图像进行分割是非常直接有效的方法得到了广泛应用.阈值法的特点是简单、快速、有效、实用.常见的阈值方法有Otsu方法[1]、矩不变分割 方 法[2]、最 小 误 差 法[3]、P-tile 法[4]、熵 方法[5]等.
在人体目标分割应用中,基于阈值的方法有Fang等[6]定义亮度域值投影曲线来描述人体特征,用水平和垂直方向亮度投影获取人体可能区域,采用当前图像亮度最大值减去统计亮度余值来确定阈值.王江涛等[7]提出的方法则将当前图像的亮度最大值和均值的加权和作为亮度阈值,根据该阈值使用水平和垂直方向亮度投影进行人体区域初定位.这些方法的不足是在对图像做了一级投影以后,高亮度区域的大小因受水平投影带和垂直投影带上其他区域的影响较大,得到的高亮区域往往包含很大部分的非高亮区域,很多时候无法得到精确的人体感兴趣区域.
考虑信息一般由概率分布来表示,所以用信息熵来表示目标和背景的灰度分布.阈值选取的不同,会使获取的目标区域和背景区域的总信息量不同,从而使他们的总信息量最大的阈值就是分割效果最好的阈值[8].文献[9]认为,基于熵的方法是最好的分割方法之一.文中提出基于最大熵阈值的红外图像人体目标分割方法,在对比度较低和含有噪声较多的红外图像中分割准确清晰的行人目标.
熵是平均信息量的表征,根据信息论,假设一幅尺寸为M×N的图像,其中f(x,y)是点(x,y)处的灰度值,f(x,y)∈ {0,1,…,L-1}灰度集合.设第i个灰度级的频数为Ni,则图像熵定义为[5]
设p1,p2,…,pn为灰度级的频数,并设阈值为s,则把整个灰度分为目标灰度与背景灰度,目标灰度分布为
背景灰度分布为
目标熵为
背景熵为
定义目标与背景熵的和为
最大化ψ(s)在目标和背景的分布中获得最大信息,以此为准则选择阈值,则使ψ(s)达到最大的s即为阈值.
基于最大熵阈值的红外图像人体目标分割具体步骤为
1)图像预处理.采用中值滤波,滤掉红外图像的杂波和噪声,这有利于后续步骤的处理.
2)阈值化.利用最大熵阈值法来确定分割门限,得到人体目标的二值图像.
3)后处理.经过图像预处理和阈值分割后的图像中仍然可能混杂有大量的噪声点,即虚警点.利用目标的形状、大小、位置等特性,考虑人体长宽比大的形状特点,采用竖形结构元素,用区域开闭运算排除噪声、去除一些虚警点,消除内部的细小物体,以减小后续处理的复杂度,得到人体目标图像.
为了验证文中方法的有效性,采用OTCBVS(Object Tracking and Classification Beyond the Visible Spectrum)Benchmark Dataset数据库[10]的红外图像进行实验,图像尺寸大小为360×240.实验采用Matlab7编程实现,硬件环境为i5 2.67 GHz cpu,4GB内存.
文中方法分割过程如图1所示.图1(b)为红外图像经过滤波后最大熵阈值化结果,由结果可见,人体目标清晰完整,利用后续的判别工作,但是还存在一些噪声.图1(c)为形态学后处理结果,经过形态学处理后,噪声消除.由于受其他热源的影响,在分割结果图像中还存在其他物体,这留在后续的检测判别中去除.
对比几种经典的阈值分割方法如图2所示,几种方法分别为Otsu、矩不变法、最小误差方法、和P-tile方法.由于红外图像对比度较低,信噪比较差,这几种方法的分割结果都较差,无法得到清晰的人体目标.Otsu、矩不变法和P-tile方法分割后都有大片的目标区域.最小误差阈值方法的分割阈值过低,造成基本上整幅图像都为目标.Otsu方法是一种比较好的阈值选择方法,但其倾向于将图像分割成大小相等的两个部分.P-tile方法选取图像固定百分比的背景像素,他要求百分比基本固定,但在实际应用中,目标的大小会随探测的改变和周围环境的改变而发生变化.
文中算法的运行时间为0.055 8s,运算速度快,满足实时性要求,也利于后续步骤的处理.
图1 文中方法处理过程Fig.1 The process by the proposed method
图2 不同分割方法结果比较Fig.2 Comparison between the segmentation results obtained by different methods
利用红外图像进行人体目标的检测与分类的应用越来越广泛.红外图像利用热成像技术,几乎不受光照条件和天气等的影响,人体温度比周围环境的温度通常要高,利用阈值分割是直接有效的方法.利用熵来表示目标和背景的灰度分布,是较好的分割方法之一.本文基于最大熵阈值的方法对红外图像的人体目标实现了较好的分割,分割出的人体清晰且完整,运行时间快,仅为0.055 8s,利于后续判别阶段的进行.
[1] OTSU N.A Threshold Selection Method from Gray Level Histogram [J].IEEE Transactions on Systems,Man,and Cybernetics,1979,9(1):62.
[2] GLASBEY C A.An Analysis of Histogram-Based Thresholding Algorithms [J].CVGIP:Graphical Models and Image Processing,1993,55(6):532.
[3] KITTLE J,ILLINGWORTH J.Minimum Error Thresholding[J].Pattern Recognition,1986,19(1):41.
[4] DOYLE W.Operation Useful for Similarity-Invariant Pattern Recognition[J].Journal of the Association for Computing Machinery,1962,9(2):259.
[5] KAPUR J N,SAHOO P K,WONG A K C.A New Method for Gray-Level Picture Thresholding Using the Entropy of the Histogram[J].Computer Vision,Graphics,and Image Processing,1985,29(3):273.
[6] FANG Y,YAMADA K,NIOIMYA Y,et al.A Shape-Independent Method for Pedestrian Detection with Far-Infrared Images [J].IEEE Transactions on Vehicular Technology,2004,53(6):1679.
[7] 王江涛,杨静宇.红外图像中人体实时检测研究[J].系统仿真学报,2007,19(19):4490.WANG Jiang-tao,YANG Jing-yu.Research on Real Time Pedestrian Detection in Infrared Images[J].Journal of System Simulation,2007,19(19):4490.(in Chinese)
[8] 刘志伟,雷斌,雷鸣.带有运动检测功能的远程图像监控系统[J].西安工业大学学报,2006,26(2):131.LIU Zhi-wei,LEI Bin,LEI Ming.Remote Image Surveillance System with Motion Detection[J].Journal of Xi’an Tchnological Unversity,2006,26(2):131.(in Chinese)
[9] SEZGIN M,KOCAELI G,SANKUR B.Survey over Image Thresholding Techniques and Quantitative Performance Evaluation[J].Journal of Electronic Imaging,2004,13(1):146.
[10] DAVIS J,KECK M.A Two-Stage Approach to Person Detection in Thermal Imagery [C]//IEEE Workshop on Applications of Computer Vision,Washington:IEEE,2005(1):364.