(东北电子技术研究所 锦州 121000)
对于地面红外识别技术,红外背景是比较复杂的地物背景。在这样的背景环境中,存在各种自然红外辐射源及红外背景干扰。在复杂的红外背景图像中识别特定目标,是目标识别技术的难点。有效的图像识别算法,是系统提高探测概率、降低错误识别的有效手段。本文对红外运动目标图像处理、目标检测和识别算法、运动目标跟踪算法等,作进一步的研究和探讨[1]。
红外运动目标图像处理涉及图像滤波、图像增强、目标提取、图像分割,图像识别、图像跟踪等处理技术。每种处理技术的方法千差万别,既有时域方法,又有频域方法,处理结果满足实时性要求是解决问题的关键[2~3]。
红外成像原理是通过感知红外辐射能产生光信号(即红外图像中的灰度),目标的表面温度与灰度成正比。目标应具有相对较强的红外辐射,比如以人体目标为例,相对于可见光图像,人体的红外图像应具有以下特征:
1)相比背景中的房屋、道路、树木等,人体通常会辐射更多的热量,因此,红外图像中的人体以及其他的“热”物体的灰度会比背景环境的灰度更强(通常背景环境是“冷”的)。
2)红外图像中的灰度是与目标物体的体表温度成正比的,所以,尽管每个人的打扮穿着都不同,但是,在红外图像中所显现的样子几乎是一样的。即红外图像自动过滤了复杂背景,简化了图像处理的复杂度。
3)因为每个正常人的体温近乎相同(37℃),所以红外图像中凡是有人的区域灰度近似,并保持不变。
虽然红外图像有着上述优点,但仍然存在如下一些问题:
(1)由于红外图像的成像原理和不是非常清晰的成像效果,所以想要从红外图像中提取出个体的某些独特的特征是很难的(比如,肤色,眼部位置,嘴巴,眉毛,等等)。
(2)红外图像缺少清晰的图像结构,且图像的对比度低,降低了拐角特征点的可信度。
针对上述两个问题,使用Haar小波[5~8]的矩形特征来表达目标从而进行目标识别,避开了这些细节特征问题。
图像信息处理总体框架如图1所示。首先对图像进行背景剔除,得到前景目标,然后根据目标在图像中的位置、尺寸估计其在监控区域中所处方位、距离,并通过提取目标的形态特征判断其是否为真目标,如果是真目标且满足系统相应的判定准则,则选定目标,给出识别提示。
当前背景剔除方法主要有三种:光流法、帧间差法和背景差法。其中光流法运算量大,实时处理有困难;帧间差法有时只能检测出目标轮廓,中间内容空洞,不利于后续处理,而且对于慢目标和静止目标很难检测出来;背景差法兼有实时性和有效性,因此采取背景差法进行背景剔除。而由于昼夜温差的关系,白天和晚上的红外图像背景差别比较大,因此必须做自适应背景估计,否则检测出来的目标噪声比较多,不利于后续处理。
图1 图像信息处理总体框架图
背景差分法是运动目标检测最常用的方法之一,它的基本思想是获取一个参考背景图像,将当前图像与参考背景进行比较,从中分割出前景运动目标。设B(x,y)为背景图像。C(x,y)表示当前图像,则:
S(x,y)表示背景差分所得图像。我们可以从中获得运动目标,即感兴趣区域(Regions of Interest,ROIs)。
由于应用环境的不同背景也有很大差异,在处理过程中有必要知道这种应用所针对的背景的类型以采取不同的实现算法。在背景差分法中为保证运动目标检测随环境变化的鲁棒性,常常需要适时地更新背景模型。背景的变化有两种可能:一种是由于环境光照引起的全局较少像素值的改变;另一种是原来背景图像中增加或减少物体引起的局部的较大改变(比如背景中移走了一个静止物体,或者一个运动物体长时间滞留在背景中)。背景模型应能够很快的响应背景变化,避免移走的物体和滞留物体长时间地出现在检测结果中。在背景模型更新时需要注意两方面问题:一方面是背景模型对背景变化的响应速度要足够快;另一方面是背景对运动目标要有较强的抗干扰性。在背景更新模型设计时总是趋向于采用新的背景更新旧背景,而不希望用待检测的运动目标更新背景。因此,在背景更新模型的设计中应该与目标检测算法相结合,使用背景与目标分割的结果来决定是否进行背景更新。
背景差方法在提取运动目标时假设图像序列的背景是相对固定不变的,应用该方法能十分有效地检测出快速和缓慢运动、甚至是静止的非背景的目标。但是这种方法对背景的变化比较敏感,当背景光照发生变化时,如果不能及时地更新背景图像将产生错误的检测结果,因此对于长时间的目标检测来说,背景的光照必然是随时间起伏变化的,必须采用自适应的背景更新方法。
简单的自适应背景更新算法如下式所示:
其中
(i)表示前景图像,Tb表示目标与背景的分割阈值,引入α决定背景更新速率。
也可采用单高斯分布背景模型或混合高斯分布背景模型来进行自适应背景更新。单高斯分布背景模型假设每个像素的亮度值服从高斯分布N(μ,σ2)噪声为白噪声。利用初始不含前景的连续N帧构造背景模型,然后采用IIR 滤波器来递推更新参数值μ和σ2使它能够适应缓慢的光照变化。这种背景模型具有较强的适用性。
初始化背景图像为
单高斯分布背景模型的更新即指各图像点高斯分布参数的更新。同样引入更新率α(定义同上),则高斯分布参数的更新可表示为
对于更为复杂的背景还可采用混合高斯分布背景模型来进行自适应背景更新。可对每个像素的亮度值用K个高斯分布的混合来建模,各高斯分布分别具有不同的权值和优先级,它们总是按照优先级从高到低的次序排序。混合高斯模型可以描述多模态背景,具有很好的自适应性。该算法的基本思想是:使用混合高斯分布模型来表征图像中每一个像素点的特征,当获得新的图像帧时,更新混合高斯分布模型,在检测前景点时,按照权值从高到低的次序将像素值与各高斯分布逐一匹配,若没有表示背景分布的高斯分布与像素值匹配,则判定该点为前景点,否则为背景点。而之所以能够把前景和背景分开,是基于一个前提条件:在一个长期观测的场景中,背景占大多数时间,更多的数据是支持背景分布的。
综合上述讨论,算法设计可结合实际应用选择一种或多种方法来实现运动目标检测过程中的背景剔除。下面以简单算法为例介绍背景剔除算法的处理过程。
假设红外成像单元第k次在监视区域拍得图像记为,背景剔除步骤如下:
2)fork=2,3,…
(1)将(i)与(i)进行配准;
(3)对前景进行形态学滤波,利用连通域检测算法划分各运动区域得到目标;
(4)用下式更新背景:
其中
说明:
1)式中(i)为当前背景中像素i的值,(i)为当前图像中像素i的值,Bk+1(i)为更新后背景中像素i的值。
3)一般情况下,利用背景差法提取前景会受到噪声的影响,需对这些前景像素进行去噪处理,可采用数学形态学方法消除小型的、孤立的前景像素,并填补目标中小的孔洞。
图2 模板匹配示意图
4)配准方法使用模板匹配法,从背景中选取一个区域作为模板w(x,y),然后在当前图像f(x,y)中寻找最相似的图像区域,这样就可以通过模板匹配技术来完成两幅图像重合区域的对齐。如图2所示
w(x,y)和f(x,y)的相关函数可写为
式中的求和是对w(x,y)和f(x,y)相重叠的图像区域进行的。当(s,t)变化时,w(x,y)在图像f(x,y)中移动并给出ρ(s,t)的所有的值。而ρ(s,t)的最大值则表明了w(x,y)在f(x,y)中的最佳位置。实际上前后两帧图像不会偏移不会太大,因此s,t可以取得很小,且模板w(x,y)也可以取得小一点,减少运算量。
采用Viola方法进行目标识别,这是一种基于模式分类的方法,利用统计学习的方法从样本中自动学习目标模型的知识,把目标识别看作是一个模式分类的问题。该方法总体框架如图3所示[4~5]。
图3 Viola方法框架图
该方法使用Haar小波的矩形特征来表达目标,提取目标的外形信息和运动信息,形成丰富的特征集,然后使用Ada-Boost算法从这些特征集中选择很好分类的关键特征组合成强的分类器,并使用级联的思想减少检测的运行时间。
AdaBoost级联分类器的构成如4所示,因为在图像和视频中出现目标的区域相对背景很少,因此大部分被检测出来的子窗口前面几级的分类器就被否定,不必通过整个分类器,节省了时间。
图4中的各分类器都是强分类器,这是相对弱分类器来说的,一个强分类器由若干个弱分类器组成,而弱分类器是通过从特征集中选择一个特征训练得到的。每一个强分类器都是由AdaBoost算法训练得到。
图4 AdaBoost级联分类器结构
AdaBoost级联分类器训练过程如下:
1)由系统要求最小检测率和最大误检率推断级联分类器需由多少个强分类器组成;
2)确定训练中的正负样本数量,假设正样本p个,负样本q个;
3)fort=1:n
(1)训练一个强训练器Ht(x);
(2)组合前t个强分类器H1(x),…,Ht(x),对人体样本集进行验证,淘汰被错误判断的目标样本(漏判),并修改目标样本p的值;
(3)组合前t个强分类器H1(x),…,Ht(x),对非真目标样本集进行验证,淘汰被正确判断的非真目标样本,并重新获取非目标样本,以补充非目标真样本集。使其数量重新达到q个。在重新获取非真目标样本过程中,也是组合前t个强分类器对候选非真目标样本进行验证,只有被误判的候选非真目标样本才能被加入到非真目标样本中。
4)保存训练结果。
上述用于训练的正负样本可以从图像或视频中得到,通常需要上万个样本用于训练。对于可见光图像来说,各种角度的目标样本比较好找一些,甚至于都能找到一些训练好了的分类器。对于红外图像来说,样本相对比较难找,需要自己拍摄得到,当系统对这些图像特征进行了训练之后,能对符合要求的目标进行识别。
目标跟踪是指对拍摄的图像序列进行分析,确定每帧图像中目标位置[6~7]。
目标跟踪是目标检测和识别过程的延续,在相机连续拍摄的图像序列中,每一帧都进行目标的检测、识别和目标位置确定,即可实现对目标的连续跟踪[4],跟踪的处理流程如图5所示。
图5 目标连续跟踪流程图
在视场中如果只有一个运动目标,那么采取上述目标检测、目标识别和目标定位过程可以实现对运动目标的连续跟踪。实际情况中可能有多个运动目标,如同时多目标进入视场,另外运动的目标还可能被树木、建筑物等短暂的遮挡,在这样的条件下要连续跟踪某个锁定的目标,需要解决目标稳定跟踪和快速处理的难题。
为解决稳定跟踪问题,在所有真目标识别出来后,需要进行目标配对处理,即将当前帧检测的目标与前一帧已跟踪目标进行配对,确定当前帧内每个目标来自于上一帧哪个目标。目标的配对过程可以采用联合概率目标识别方法,建立目标链,利用多目标、多帧图像信息,提高配对准确率。
在准确实现目标配对后,即可更新锁定目标在当前帧的位置,并进行下一帧目标位置预测。目标位置预测目的是当跟踪目标被短暂遮挡期间,实现对目标的持续跟踪,另外采用轨迹预测,在预测位置附近检测目标,也可以减少下一帧所需要处理图像区域的大小,提高处理速度。
运动轨迹的预测可采用平方预测器,假设目标运动轨迹点坐标表示为函数f(k),取连续三帧,则平方预测公式为
上式中(k+1)即为目标轨迹预测点。
也可采用基于卡尔曼滤波的区域匹配跟踪算法来确定运动目标的运动轨迹。该算法的关键为:检测所得的前景目标区域和跟踪的动态运动目标区域之间建立对应关系。基其主要设计思想为:首先,从输入图像中检测分割运动目标区域,并提取区域特征值,然后建立目标链表;其次,利用卡尔曼滤波对目标链表中的需要跟踪区域的运动趋势进行位置预测,以缩小目标区域搜索匹配的范围,从而加速目标区域匹配的速度;然后,在预测位置范围内对被跟踪的目标区域进行匹配搜索,以建立目标的关联关系,并且用最佳匹配的运动区域信息更新目标链表中相应的目标区域信息,同时对卡尔曼运动区域预测模型进行更新。
基于卡尔曼滤波区域跟踪可分为五个模块:
1)目标特征提取:从输入图像中检测运动目标区域,通过一个矩形框对运动区域进行标定,并提取每个运动区域的中心位置和区域大小信息。
2)建立目标库:建立了一个目标库,用于存放被跟踪目标区域特征参数。
3)卡尔曼运动区域预测模型:基于卡尔曼滤波的系统模型,定义状态向量,预测下一帧 运动目标区域可能出现的位置。
4)目标区域匹配搜索:在预测位置范围内进行目标区域匹配搜索。
5)模型更新:更新卡尔曼运动区域预测模型。采用上述跟踪处理流程和处理方法,可以实现对红外运动目标的快速有效稳定跟踪。
对系统的识别概率影响的其它因素比较多,比如由于自然景观的红外背景辐射及系统内部电子噪声影响,红外图像具有高亮度、低对比度特点,即图像呈现灰白、模糊不清;另外,由于探测器经常不可避免地存在坏元,且各像元的输出存在较大的非均匀性,导致红外图像质量进一步下降。在进行红外图像处理之前,首先需要进行探测器坏元自动替换和像元单点/两点非均匀性校正来提高图像质量。其次,为提高图像信噪比,采用图像滤波技术,滤除随机噪声,同时也可保留图像细节。一个优秀的红外识别系统,是系统硬件和软件算法优化组合的产物,优化的软件算法可以最大程度地发挥系统硬件的能力[10]。
[1]李俊山,杨威,张雄美.红外图像处理、分析与融合[M].北京:科学出版社,2009.
[2]刘文哲.光学相关红外目标识别算法研究[J].仪器仪表学报,2011,32(4):850-855.
[3]刘洋.基于红外热成像多人体识别的智能监控系统[J].PLC&FA,2011(5):73-75.
[4]郭永彩,胡瑞光,高潮.基于图像运动区域的红外多行人跟踪[J].激光与红外,2009,39(8):891-894.
[5]陈方涵.基于多小波变换的红外目标探测与识别[J].光子学报,2011,40(2):295-298.
[6]杨建国.小波分析及其工程应用[M].北京:机械工业出版社,2005.
[7]程正兴.小波分析算法与应用[M].西安:西安交通大学出版社,1998.
[8]唐琳,蔡德荣,黄猛.一种基于遗传算法的图像分割算法[J].计算机与数字工程,2008,36(7).
[9]王学伟,李珂,王世立.红外成像系统建模仿真方法研究[J].计算机与数字工程,2012,40(6).
[10]钟华.多小波理论及其在边缘检测方面的应用[J].南昌:江西师范大学,2005.