基于压缩感知的SAR图像目标识别

2012-09-30 01:38张顺生
火控雷达技术 2012年4期
关键词:训练样本识别率类别

方 庆 张顺生 段 昶

(电子科技大学 成都 611731)

1 引言

当前合成孔径雷达(Synthetic Aperture Radar,SAR)图像解译系统的发展远滞后于信息源的获取能力,SAR图像自动目标识别作为SAR图像解译和分析的重要组成部分,具有重要的民用和军事价值,日益成为国内外图像处理和模式识别领域的研究热点。压缩感知(Compressed Sensing,CS)理论是近年来提出的一种信号表示和压缩方法,其关键是信号的稀疏表示问题[1,2],由于其有效地改善了信号的采样和压缩能力,目前在无线通信、雷达成像、医学图像等领域受到高度关注。

近年来,压缩感知理论被逐渐引入到模式识别的各个领域,特别是在人脸识别领域的成功应用,取得了良好的识别效果[3,4]。与信号压缩应用中可以由多种标准基任意构造稀疏表示的稀疏基不同,人脸识别应用时需由训练样本构造稀疏基,测试样本表示为稀疏基的线性组合。当假设任意亮度和表情变化的人脸图像取决于一个低维的人脸子空间时,利用压缩感知的重构算法,可以从稀疏表示的结果中精确恢复出人脸图像的表示,根据各类训练样本的重构图像与测试样本之间的距离度量实现对目标的有效识别。基于这种基本思路,压缩感知理论又被进一步引入到人脸表情识别[5]和三维人脸识别[6]等领域。

本文主要研究将压缩感知理论应用于SAR图像目标识别,以获得对SAR目标更优的识别性能。但是值得注意是,通常SAR图像反应了图像像素与散射系数之间的对应关系,不像普通的光学图像能较完整地反应目标的整体形状,而且SAR图像对成像的方位角较敏感,相同目标在不同方位角下的成像结果区别很大,因此,SAR图像难以由训练样本的稀疏线性表示精确重构,所以,通过重构图像与测试样本之间的距离度量无法实现对目标的正确识别。

为解决上述问题,本文将压缩感知应用于SAR图像目标识别时,将精简传统压缩感知识别算法中的样本重构和距离度量步骤,从稀疏表示时系数向量的分布特性角度,直接考察稀疏表示中测试样本的真实类别相对于其它类别之间的可区分能力,根据系数向量的分布特点设计分类算法,实现对目标的有效识别。

2 样本的稀疏表示与求解

压缩感知理论的一个重要研究内容是稀疏基的构造问题,稀疏基的选择对信号表示的稀疏性有直接影响。在信号压缩应用中,稀疏基可以选择多种标准基(如 Fourier、Wavelet、Curvelet和Gabor基)构造。但是在目标识别应用中,稀疏基需由训练样本构成,测试样本表示为稀疏基的线性组合。理想情况下,当可利用的训练样本数量充足时,可以将测试样本仅仅表示为与该测试样本同类型的训练样本的线性组合,因此,测试样本基于全体训练样本的线性组合实际上只依赖于部分训练样本,满足压缩感知中对信号稀疏性的要求。通过求解最优化问题得到稀疏表示的系数向量,基于该系数向量可以实现对测试样本的有效识别。

模式识别的基本问题是利用已知类别的训练样本将测试样本标记为正确的类别。由第i类目标的ni个训练样本组成矩阵的列向量集Ai=[vi,vi,…,vi,n1]∈Rm×ni,在 SAR 图像目标识别中,矩阵的列向量v∈Rm(m=w×h)由SAR图像(大小为w×h)的列向量收尾相接而成,因此Ai的列向量是第i类SAR图像训练样本。

当第i类目标具有足够多的训练样本,即Ai=[vi,1,vi,2,…,vi,ni]∈Rm×ni时,任意同类别的测试样本y∈Rm可以近似表示为该类训练样本的线性组合:

其中 αi,j∈ R,j=1,2,…,ni是线性表示的系数。

当测试样本的类别i未知时,定义所有k类n个训练样本集组成矩阵A,即:

因此测试样本y在全体训练样本下的线性表示为:

其中 x0= [0,…,0,αi,1,αi,2,…,αi,ni,0,…,0]T∈ Rn是系数向量。理想情况下,x0中只有与测试样本同类的第i类训练样本系数可能非0,其它类系数都为0。

由于稀疏线性表示的系数向量x0含有未知目标类别的信息,因此,通过求解公式y=Ax可实现对目标的识别。在SAR图像目标识别中,公式y=Ax通常是欠定的,没有唯一解,不能通过求逆的方法直接求解。该问题通常可转化为l0范数下的最优化问题:

公式(5)的求解是一个NP难题,难以直接求解。近年来对压缩感知和稀疏表示的研究[7,8]表明:当系数向量x0足够稀疏时,l0范数的最优化问题等价于l1范数的最优化问题:

实际应用中考虑到噪声以及模型误差等因素的影响,引入误差容限ε,公式(6)的求解可以转化为如下形式的最小l1范数问题:

通过求解该凸优化问题可以获得稀疏表示的近似系数向量。

这种测试样本基于全体训练样本的稀疏表示有三个特点:a.训练样本系数值的大小反应了测试样本与该训练样本的相似性程度,系数值越大相似性越高,反之亦然;b.测试样本的类别不再依赖于单个或小部分训练样本,而是由所有训练样本系数的相对大小共同决定,避免了单个训练样本最终决定测试样本类别的偶然性;c.当训练样本的种类或数量越多时,越容易取得更稀疏的样本表示结果,也越有利于实现对样本的正确识别。这些特点为后续识别算法的设计提供了指导,有利于本文方法取得更好的识别率和鲁棒性。

3 基于压缩感知的识别算法

对于给定的测试样本y和训练样本集合,基于公式(7)的求解获得稀疏表示的系数向量。理想情况下系数向量的非0系数应该集中于测试样本所属类上,只要提取出非0系数在中的位置就可以获得测试样本y的类别。但是,实际应用中受成像方位角、相干斑噪声和模型误差等因素影响,使得许多相对较小的非0系数分散到其它多个类上,但是,总体上测试样本y所属类中仍然集中了多数相对较大的非0系数,由此可见,稀疏表示的系数向量本身对测试样本类别具有可区分能力。因此,本文设计的分类算法首先计算每一类训练样本的系数之和,然后将测试样本归类到样本系数之和最大的类别。

其中,ri(y)=sum[δi()]是向量 δi()的系数之和。下面总结了本文基于压缩感知的SAR图像目标识别流程。其中l1范数的最优化问题通过梯度投影法(Gradient Projection for Sparse Reconstruction,GPSR)求解[9]。

步骤1输入:k类训练样本组成的矩阵A=[A1,A2,…,Ak]∈Rm×n,任一测试样本 y∈Rm。

步骤2解最小l1范数问题:

4 实验结果与分析

4.1 实验数据及其切片形式

本文所用的研究数据是MSTAR计划录取的实测SAR地面静止军用目标数据。包括3大类:BMP2(装甲车)、BMP70(装甲车)、T72(主战坦克),成像分辨率是0.3m×0.3m,方位角覆盖范围是0~360°,图像大小为128×128。实验使用该计划推荐的训练样本是目标在俯视角为17°时的成像数据,测试样本是目标在俯视角为15°时的成像数据。表1是本实验中训练样本和测试样本的类别及其对应的图像数量。

SAR图像背景杂波和相干斑噪声干扰,以及目标的平移和目标散射中心的不均匀分布都会影响识别性能。为了克服这些影响获得利于识别的训练样本矩阵A和待测样本y,本文将对SAR图像进行必要的预处理,预处理步骤依次主要包括:基于马尔可夫随机场(Markov Random Field,MRF)的目标分割[10]、形态学滤波和聚类[11]、图像增强和归一化处理。最后,以目标中心点为参考裁剪出直接用于识别的目标切片图像,目标切片图像的大小为50×50像素。

表1 训练样本、测试样本类别和数量

4.2 稀疏系数分布

根据第2节的分析可知,当测试样本的稀疏表示求解准确时,将得到具有可区分能力的系数向量,即系数向量的非0系数将主要集中于测试样本所属类别的训练样本上。本文通过实验考察测试样本的总体系数分布和个别系数分布,从这两个方面研究系数向量的这种分布特性。

测试样本的总体系数分布可通过所有单独类的总体系数分布来考察。假设(y1,y2,…,yN)是某一类的所有 N 个测试样本,(,…)是其对应的N 个系数向量,定义S(y1,y2,…,yN)∈Rn为同一类中所有测试样本的系数向量的绝对值之和,(y1,y2,…,yN)∈Rn为 S(y1,y2,…,yN)的归一化向量,则可通过(y1,y2,…,yN)来考察测试样本的总体系数分布,即:

图1表明当测试样本的类别分别为 BMP2、BTR70和T72时的总体系数分布情况。由图可以看出,测试样本在相同类别训练样本上的系数分布数值更大,密度更集中,从总体上直观地反应出本文方法可以实现对目标的有效识别。

图2是在三类目标中任意抽取的单个测试样本的系数分布。图2(a)是预处理后分割出的图像切片,图2(b)是图像切片基于训练样本的系数分布。可以看出单个测试样本时,系数向量的分布同样集中于与之类别相同的训练样本上,因此,将测试样本归类为样本系数之和最大的类别将有利于实现对目标的正确识别。另外,注意到系数分布图内的图像切片对应于系数值最大的训练样本,可以看出该训练样本与测试样本在目标形状和散射分布上都很相似,这说明系数向量中的系数值大小反应了测试样本与训练样本之间的相似程度。

图1 测试样本的总体系数分布

图2 单个测试样本的系数分布

4.3 识别性能与比较

最后,将通过识别率来考察本文方法的识别性能。识别率是测试样本的正确识别数和总识别数的比值,是衡量识别算法的最重要指标。表2给出了本文方法基于表1实验数据的识别率情况,可以看出本文方法对三类典型目标均取得了很高的识别率,其中对T72的识别率最高达到98.63%。

表2 各类目标识别率(%)

将本文基于压缩感知的识别方法得到的识别率与其它几种典型方法相比较,比较结果如表3所示。其中文献[12]给出了一种支持向量机分类方法,该方法没有经过特征提取,以30°为方位单元,在每个方位单元内对图像样本用支持向量机完成分类。文献[13]给出了一种基于非负矩阵分解的SAR图像目标识别,该方法对分割后的目标图像运用非负矩阵分解获得特征向量,再依据Fisher线性判别构成分类器实现对目标的识别。文献[14]提出了一种基于AdaBoost算法的SAR图像目标识别方法,该方法首先对SAR图像目标进行规则化调整和分割,然后组合目标的多种特征形成特征向量,最后利用AdaBoost算法实现目标识别。由表3可见,本文方法得到的平均识别率明显高于其他几种识别方法得到的识别率。

表3 几种识别方法的识别率比较(%)

5 结论

本文提出了一种基于压缩感知的SAR图像目标识别方法,该方法利用压缩感知理论将测试样本表示为训练样本的线性组合,通过求解最优化问题得到了具有可区分能力的近似稀疏系数,分析了该稀疏系数在训练样本上的分布特性,从理论和实验两方面研究了该识别方法的原理和可行性。实验结果表明,该方法可以实现对目标的有效识别,能明显提高对目标的正确识别率。值得注意的是,SAR图像目标识别系统仍存在许多难以预料的扩展工作条件,在后续的研究中将考虑把本文方法推广到更复杂的环境之中。

[1]Donoho D L.Compressed sensing[J].IEEE Trans.on Information Theory,2006,52(4):1289-1306.

[2]Candes E J,Wakin M B.An introduction to compressive sampling[J].IEEE Signal Processing Magazine,2008,25(2):21-30.

[3]John W,Allen Y Y,Arvind G,et al.Robust face recognition via sparse representation[J].IEEE Trans.on Pattern Analysis and Machine Intelligence,2009,30(2):210-227.

[4]John W,Yi M,Julien M,et al.Sparse representation for computer vision and pattern recognition[J].Proceedings of The IEEE,2010,98(6):1031-1044.

[5]Cotter S F.Sparse representation for accurate classification of corrupted and occluded facial expressions[C]//IEEE International Conference on Acoustics Speech and Signal Processing.New York,USA,2010:838-841.

[6]Zhang C,Zhang Y N,Lin Z G,et al.An efficiently 3D face recognizing method using rangeimage and sparse representation[C]//IEEE International Conference on Computational Intelligence and Software Engineering,Wuhan,China,2010:1-4

[7]Donoho D L,Elad M,Temlyakov V N.Stable recovery of sparse overcomplete representations in the presence of noise[J].IEEE Trans.on Information Theory,2006,52(1):6-18.

[8]Candes E,Romberg J,Tao T.Robust uncertainty principles:exact signal reconstruction from highly incomplete frequency information[J]. IEEE Trans.on Information Theory,2006,52(2):489-509.

[9]Figueiredo M T,Nowak R D,Stephen J W.Gradient projection for sparse reconstruction:application to compressed sensing and other inverse problems[J].IEEE Journal of Selected Topics in Signal Processing,2007,1(4):586-597.

[10]贾亚飞,赵凤军,禹卫东等.基于扩散方程和MRF的SAR图像分割[J].电子与信息学报,2011,33(2):363-368.

[11]Gonzalez R C,Woods R E.Digital image processing[M].Second edition,Beijing:Publishing House of Electronics Industry,2002.

[12]Zhao Q and Principe J C.Support vector machines for SAR automatic target recognition[J].IEEE Trans.on Aerospace and Electronic Systems,2001,37(2):643-654.

[13]龙泓琳,皮亦鸣,曹宗杰.基于非负矩阵分解的SAR图像目标识别[J].电子学报,2010,38(6):1425-1429.

[14]Guo W,Qi Q W,Jiang L L,et al.A new method of SAR image target recognition based on AdaBoost algorithm[C]//IEEE International Conference on Geoscience and Remote Sensing Symposium,Boston,USA,2008:1194-1197.

猜你喜欢
训练样本识别率类别
论陶瓷刻划花艺术类别与特征
一起去图书馆吧
人工智能
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
档案数字化过程中OCR技术的应用分析
科技文档中数学表达式的结构分析与识别
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究
人工智能现状和发展
选相纸 打照片