杨 开,李少毅,张 凯,钮赛赛
(1.西北工业大学 航天学院·西安·710072;2.上海航天控制技术研究所·上海·201109)
各类人工干扰和目标机动,造成了空空导弹的目标与干扰、背景特性的相似性较大、稳定性较差,目标特征的完整性和显著性遭到了破坏[1];当载机连续投射干扰而形成多目标情况时,目标特性和干扰、背景杂波特性均不突出,或出现目标特性被干扰大面积遮挡的情况。这些情况造成现代战场的态势日益复杂,对空中目标识别技术提出了更高的要求,抗干扰目标识别问题已成为当前红外成像制导武器所面临的重要问题之一[2]。
红外成像制导空空导弹的抗干扰目标识别,主要有基于模板匹配、基于目标特征提取及基于统计模式识别这三种方法。基于模板匹配的目标识别算法运算量大、精度低,研究进展比较缓慢;基于特征提取的目标识别方法要求对原图像进行比较细致的分割,而将目标从图像中提取出来需要大量时间;基于统计模式的传统识别算法为采用几何形状为识别特征的识别方法,容易受到环境和背景变化的影响。通常采用基于特征融合匹配的统计模式识别方法,如文献[3]中提出的改进的联合概率数据关联算法。但是,在特征完整性、显著性和连续性遭到破坏的情况下,算法无法准确提取目标的图像特征,构造特征准确性和连续性发生破坏,难以连续准确识别目标[4]。为此,Gilles Labonte等人[5]利用人工神经网络进行了目标与干扰特征的分类,从而实现了抗干扰目标识别。该方法具有较高的准确性,但需要大量参数,学习时间较长,且对硬件性能要求较高[6]。
本文提出将朴素贝叶斯分类器应用于抗干扰目标识别的方法。该方法建立在贝叶斯理论和贝叶斯网络的基础上,将图像中所有待分类区域都视为潜在目标,在对空战对抗仿真图像集进行特征挖掘后,采用实验拟合方法构建了典型特征的概率密度函数模型,并将其作为抗干扰识别的先验信息,结合贝叶斯分类器理论,计算每个潜在目标的后验概率,从而实现了飞机目标与干扰的抗干扰目标识别。
图像处理常用的特征包括纹理特征、运动特征和形状特征,其中纹理特征包括最高灰度、平均灰度、能量等;运动特征包括速度、轨迹变化率等;形状特征包括长宽比、周长、面积、重心等。由于不同目标的红外图像会表现出不同的特征,因而可以选取一些特征来表征一类目标,从而进行目标的识别分类[7-10]。
定义用来表征某一类目标的一组特征A={X1,X2,X3,…,Xn}为特征矢量,其中X1,X2,X3,…,Xn分别表示某一特征。在对样本进行处理之前,先进行样本特征值的归一化处理
(1)
式(1)中:max(x*)表示在所有样本中,特征Xi的最大值。
对于目标和干扰两类样本,均选取n个特征组成特征矢量A={X1,X2,X3,…,Xn}。其中,X1,X2,X3,…,Xn被称为实例的属性变量,且为连续型随机变量,fXi(xi)为Xi的概率密度;类变量Y为取m个值(y1,y2,y3,…,ym)的离散随机变量,且fY(yj)=P(Y=yj)。对于某一个特征Xi,贝叶斯公式为
(2)
式(2)中,fXi|Y(xi|yj)为Y=yj时Xi的条件密度,fY|Xi(yj|xi)为Xi=xi时Y的条件概率。
对于特征矢量A={X1,X2,X3,…,Xn},贝叶斯公式为
fY|X1,X2,X3,…,Xn(yj|x1,x2,x3,…,xn)=
(3)
假设n个特征相互独立,则有
fY|X1,X2,X3,…,Xn(yj|x1,x2,x3,…,xn)=
(4)
式(4)中,fX1|Y(x1|yj),fX2|Y(x2|yj),…,fXn|Y(xn|yj)为X1,X2,…,Xn的概率密度函数。
(5)
式(5)中,fY(yj)为类参数估计,其表达式如下
(6)
式(6)中,N(Yj)为属于Yj类的样本个数,N为总的样本个数。
为进行朴素贝叶斯分类器的训练,需要全方位、多角度的庞大目标、干扰图像库。空空导弹实际挂飞、靶试图像稀少,真实空战对抗图像难以获取,本文采用空战对抗样本库描述战机与导弹的对抗态势,通过先进红外建模与仿真技术产生逼近实际空战对抗环境的不同弹道数据:选取投射距离6000m,干扰投放数目12枚,弹间隔0.5s,进入角(导弹发射时弹体与目标飞机机轴的夹角)以15°为间隔从0°到360°的弹道提取导引头图像序列,分别进行目标和干扰区域的标注,以此作为正、负样本构造图1、图2数据集,如图1、图2所示。
图1 目标样本标注示意图Fig.1 Labeling of target samples diagram
图2 干扰样本标注示意图Fig.2 Labeling of flare samples diagram
基于本文数据集,分别进行正、负样本图像的特征提取,每一个样本Ai对应一组特征矢量Ai={X1,X2,X3,…,Xn},形成以特征矢量为形式的正、负样本库S+={A1,A2,A3,…,AP}及S-={A1,A2,A3,…,AQ}。基于该样本库,本文采用实验拟合方法得到特征概率密度函数fX1(x),fX2(x),fX3(x),…,fXn(x)。
参照数字图像处理中灰度直方图的概念,对于样本库中属于同一类别的样本,按照某一特征取值的大小,统计其所出现的频率,以归一化后的特征值为横坐标,以该特征值在样本中出现的频率为纵坐标,定义其为该特征的特征直方图[11]。该图能够反映该特征的概率分布。采用统计数学中的概率分布概念来描述特征直方图,设f(i,j)代表某一特征的取值。做出归一化处理后,f(i,j)将被限定在[0,1]。对于一个样本库而言,每一个样本的某一特征取得的[0,1]区间内的值是随机的,也就是说,f(i,j)是一个随机变量。假定对每一瞬间,f(i,j)是连续的随机变量,那么就可以用概率密度函数pf(f(i,j))来表示特征值为f(i,j)的样本在样本库中所出现的概率。
通过对某一特征的特征直方图进行拟合可得到该特征的概率密度函数。以飞机目标的长宽比特征为例,其具体实现步骤如下:
(1)对特征Xi的样本数据进行统计分析,如表1所示。由此可得到该特征的特征直方图,如图3(a)所示;
表1 特征值频率分布统计表
(2)通过曲线拟合该直方图,尽量使曲线下的面积与条形图的面积相等,得到符合该直方图走向的折线图,如图3(b)所示;
(3)对该曲线进行幂函数、指数函数、多级正态分布等函数逼近,如图3(c)所示,得到的图中实线的函数表达式即为fXi(x)的表达式。
(a)特征直方图
(b)特征分布曲线
(c)概率密度函数曲线图3 特征概率分布实验拟合Fig.3 The characteristics of probability distribution experiment fitting
采用上述实验拟合方法得到的特征概率密度函数即为数据集训练结果,表示样本特征的先验信息,它的准确性直接影响着朴素贝叶斯分类器的性能。
图4给出了本文算法的框架图。上方的分支表示朴素贝叶斯分类器的构建过程:通过进行训练集图像的预处理和特征提取,并对所提特征的特征直方图进行拟合而得到特征概率密度函数,以其作为输入来构造朴素贝叶斯分类器;下方的分支表示朴素贝叶斯的应用,同样对测试集图像进行预处理和特征提取,将得到的每一个待分类样本的特征矢量输入贝叶斯分类器,即可完成分类识别。
图4 算法框架示意图Fig.4 Algorithm frame schematic diagram
本文处理的对象为数据集中的灰度图像,而最终贝叶斯分类器的输入为每个待分类样本的特征概率密度函数。为最大程度地保留待分类样本的信息,从而准确提取待分类样本的特征矢量,需对图像进行滤波、分割等预处理。
对于存在人工干扰的红外图像而言,红外诱饵的辐射特性较为明显,其为一个高亮度区域;飞机目标的尾喷、尾焰及机头为高亮度区域,且各高亮度区域的亮度等级差异较大,故简单的灰度阈值分割难以达到理想的效果[12]。本文采用K-means 聚类算法进行图像的分割处理。
K-means[4]是一种应用十分广泛的聚类算法,以距离作为相似性的评价指标。其基本思想是按照距离将样本聚成不同的簇,两个点的距离越近,其相似度就越大,以得到紧凑且独立的簇并将其作为聚类目标。K-means聚类图像算法将红外图像灰度值相近的像素聚成一类,再为每一类像素按照某种规则重新赋值,以实现图像中目标候选区域的生成。
聚类个数的选择对候选区域的生成结果有很大影响,若聚类个数过少,目标机身容易与背景聚为一类,造成目标分裂。聚类个数足够大时,提取结果才有效保留了机身,而可获得比较完整的目标。本文选取的聚类个数为3,并使初始聚类中心均匀分布在图像中,结果如图5所示。
(a)原图
(b)聚类分割结果图图5 原图(a)和聚类分割结果图(b)Fig.5 The original images(a)and the segmentation images(b)
特征提取的过程是对图像分割后形成的每个区域计算一组表征其可鉴别的特征量,以用于目标的分类识别[13-15]。本文的选取使得飞机目标与干扰具有最大相异性的特征。通过分析比较,选取如下5个特征:
(1)长宽比:目标最小外接矩形的水平长度与垂直长度之比;
(2)周长:目标边界长度,对应物理因素为轮廓信息,其计算公式为
P=∑f(x,y)
(7)
式(7)中,f(x,y)为二值像中点(x,y)的邻域有1有0的像素。该邻域可以为四邻域,也可以为八邻域。
(3)能量:原始图像目标区域内像素点相对灰度累加和,其中相对灰度为该像素点成像灰度与图像背景灰度之差,即有
E=∑fT(x,y)-GBkg
(8)
式(8)中,fT(x,y)为目标区域的像素点灰度,GBkg为背景估值。
(4)最高灰度:原始图像目标区域内成像灰度最高的点的灰度值与图像背景灰度之差,即有
GMax=fmax(x,y)-GBkg
(9)
式(9)中,fmax(x,y)为目标区域最高灰度。
(5)圆形度:目标与周长相同的圆面积比值,目标形状规则程度的度量。其对应的物理因素为轮廓信息,计算公式为
(10)
式(10)中,P是目标的周长,A是目标的面积。
图6为基于朴素贝叶斯分类器的空中红外目标识别算法流程,其算法步骤如下所示:
(1)设A={x1,x2,x3,…,xn}为一个待分类项,其中每个x为X的一个特征属性。在本文算法中,x1,x2,x3,…,xn分别为该待分类区域的长宽比、周长、能量、最高灰度及圆形度这5个特征的取值。
(2)类别集合Y={y1,y2,…,ym}。在本文算法中,类别集合Y={0,1}。其中,0表示干扰,1表示飞机目标。
(3)分别计算P(y1|x),P(y2|x),…,P(ym|x),即通过2.2中的拟合方法,得到3.2中5个特征的概率密度函数,如公式(11)~(15)所示。
(11)
(12)
(13)
(14)
(15)
(4)根据朴素贝叶斯分类器思想[16],如果P(yk|x)=max{P(y1|x),…,P(ym|x)},则x∈yk。在本文识别分类算法中,若P(y1|x)>P(y2|x),则A={x1,x2,x3,…,xn}为干扰,否则为飞机目标,从而可完成分类识别。
图6 朴素贝叶斯分类器的算法流程图Fig.6 Naive Bayes Classifier algorithm flow diagram
本文采用的图像为基于实验室仿真平台得到的16位空中红外目标仿真图像,分辨率为128×128像素。为验证朴素贝叶斯分类器在红外空中目标抗干扰识别中的可行性与有效性,需在全程弹道内进行测试,故选取具有代表性的3000m、5000m和8000m投射干扰的弹道图像作为测试图像。
本节采用基于朴素贝叶斯分类器的空中红外目标识别方法进行多种态势下的飞机目标抗干扰识别。固定红外诱饵弹的投射个数为10枚,弹间隔为0.8s,进入角分别为10°、30°、45°、60°、90°,选取干扰投射距离为8000m、5000m、3000m的红外空战仿真图像进行测试,部分图像如图7所示(注:方法结果图中,将飞机目标用红色矩形框标注,红外干扰弹用绿色矩形框进行标注)。统计公式(16)所示的识别正确率,其结果见表2。
(a)10°、8000m、0.8s
(b)10°、8000m、0.8s
(c)10°、5000m、0.8s
(d)10°、5000m、0.8s
(e)10°、3000m、0.8s
(f)10°、3000m、0.8s
(16)
式(16)中,Nright表示正确识别飞机目标和干扰的图像数,Ntotal表示测试图像的总数。
表2基于朴素贝叶斯分类器的空中红外目标识别算法测试结果
Tab.2The test result of air infrared target recognition algorithm based on the Naive Bayes Classifier
统计项目10°30°45°60°90°8km0.8sNtotal764773757769749Nright535573583610647Pright70.0%74.1%77.0%79.3%86.4%5km0.8sNtotal609583574577552Nright453459470488507Pright74.5%78.7%81.9%84.6%91.8%3km0.8sNtotal390378361374348Nright306313307326332Pright78.5%82.8%85.1%87.2%95.4%
分析表2和图7可知,在已测试的弹道图像数据集下,该方法的平均识别正确率达到了81.82%。同时,分类识别正确率随着进入角的增大而增大。这是由于随着进入角的增大,干扰与飞机目标分离较快,飞机目标的特征受到较短时间的破坏,符合飞机目标与干扰的空间位置关系的变化规律;在投射弹间隔固定的前提下,分类识别正确率随着投射距离的减小而增大。这是由于在远距情况下,飞机目标仅为几个像素,且没有形状及纹理信息;在中距弹道,飞机目标逐渐能够显示出轮廓,形状特征较为明显;在近距时,飞机目标能够形成清晰图像,形状特征及纹理特征较为明显,这符合飞机目标与干扰的红外成像规律。
对于图像中存在假目标及目标被遮挡的情况,如图8(a)、图8(b)所示,显然基于特征融合匹配的统计模式识别方法已失去抗干扰识别能力,而本文方法仍然能够正确识别飞机目标和干扰。
(a)假目标
(b)干扰遮挡目标图8 基于朴素贝叶斯分类器的空中红外目标识别算法测试图Fig.8 The test images of air infrared target recognition algorithm based on the Naive Bayes Classifier
本文针对红外成像制导空空导弹面临的抗干扰目标识别问题,采用朴素贝叶斯分类器进行了空中红外目标识别。选取空战对抗中远距、中距和近距弹道红外仿真图像进行了测试,并统计了其分类识别正确率。实验结果表明,该方法在已测态势下的平均识别正确率达到了81.82%,且能够解决假目标、目标遮挡等基于特征融合匹配的统计模式识别方法无法应对的难题,验证了该方法的可行性和有效性。但是,由于在样本的选取过程中,缺少了飞机目标与干扰粘连的样本,造成了对全弹道图像序列的识别正确率整体较低的问题。下一步工作需要扩充样本库,得到更为准确的特征概率密度函数,从而进一步提高识别的正确率。