基于协同编码分类器的SAR目标识别方法

2019-06-25 11:34王鑑航张广宇
中国电子科学研究院学报 2019年3期
关键词:训练样本识别率分类器

王鑑航,张广宇,李 艳

(1.吉林交通职业技术学院,长春 130012;2.长春理工大学,长春 130022)

0 引 言

合成孔径雷达(Synthetic Aperture Radar,SAR)可以在全天候的条件下连续工作,从而为情报侦察提供了有效的手段。SAR自动目标识别(Automatic Target Recognition,ATR)作为SAR图像解译[1-2]的一项重要研究内容,在近20年里得到了广泛研究。

具体的SAR目标识别方法主要关注特征提取和分类器设计两项技术。特征提取是为了降低原始SAR数据的维度,从而方便后续的决策。常用于SAR目标识别的特征有主成分分析(Principal Component Analysis,PCA)特征[3],线性鉴别分析(Linear Discriminant Analysis,LDA)特征[3],目标区域[4],目标轮廓[5],散射中心[6-9]等。分类器设计旨在对原始SAR图像或提取的特征进行决策从而判定目标类别。随着模式识别技术的进步,大量分类器在SAR目标识别中得以应用,如K近邻分类器(K-Nearest Neighbor,KNN)[3]、支持向量机(Support Vector Machine,SVM)[10]、稀疏表示分类器(Sparse Representation-based Classification,SRC[11-13],卷积神经网络(Convolutional Neural Network,CNN)[14]等。Mishra将PCA和LDA应用于SAR图像特征提取,并通过KNN分类器进行目标识别[3]。文献[5]首先提取SAR目标轮廓的椭圆傅里叶描述子,进而采用SVM分类器进行目标识别。文献[7]提出一种属性散射中心匹配算法并将其应用于SAR目标识别。文献[10]和[11]分别将SVM和SRC应用于SAR目标识别,证明了它们的有效性。不同的分类器的适用范围和分类性能都不尽相同。因此,为了提高识别性能,需要针对SAR目标识别这一特定应用选择更为有效、稳健的分类器。

本文将协同编码分类器(Collaborative Representation-based Classification,CRC)[15]应用于SAR目标识别。它的基本思想是采用各类训练样本组成的全局字典最优重构测试样本,进而根据各类的重构误差判定目标类别。文献[15]首次提出协同编码分类器并将其应用于人脸识别,取得了较好的效果。其结果还证明了在各类别训练样本有限的条件下,采用协同编码的策略相比稀疏表示具有更强的稳健性。对于SAR目标识别,受限于数据获取能力,各个类别的训练样本数量十分有限,因此采用协同编码表示更为合适。为了对提出方法进行科学测试,采用MSTAR(Moving and Stationary Target Acquisition and Recognition)数据集进行了验证实验并通过与其它分类器的对比验证了提出方法的优越性。

1 稀疏表示分类器

稀疏表示本质上是一种线性表示理论。与一般的线性表示不同的是,稀疏表示要求线性表示系数具有稀疏性,即仅有少量的系数非零。假设C类目标构建的全局字典为A=[A1,A2,…,AC]∈Rd×N,其中d为每一个原子(即从训练样本中提取的特征矢量)的维度,Ai∈Rd×Ni(i=1,2,…,C)为来自第i类目标的Ni个原子。对于当前的测试样本y∈Rd,采用下式进行稀疏表示:

(1)

公式(1)中,α代表稀疏表示系数矢量,ε为重构误差。上述问题由于涉及到0范数优化,因此难以直接求解。根据压缩感知理论的研究成果,可以采用1最小化算法[12],正交匹配追踪算法(Orthogonal Matching Pursuit,OMP)[11]以及贝叶斯压缩感知方法(Bayesian Compressive Sensing,BCS)[13]等算法获取问题(1)的近似解。

(2)

2 协同编码分类器

稀疏表示分类强调了稀疏性对于目标识别的作用,但忽略了不同类别互补性。当字典中各个类别的训练样本的数量有限时,采用稀疏表示难以实现对测试样本高精度的描述,此时基于稀疏表示的分类结果往往发生错误。协同编码表示认为,不同类别样本的共同使用可以为测试样本提供更为准确的描述。由此,CRC采用最小正则化均方误差的方式求解全局字典的上的协同编码系数[15]。

(3)

公式(3)中,λ为正则化系数。相比稀疏表示系数,协同编码的求解更为简单,公式(3)的解析解如下:

*I)-1ATy

(4)

公式(4)中,I为单位矩阵。根据求解的协同表示系数,采用公式(2)相同的方法,计算各个类别的重构误差并基于最小的协同表示误差判断目标类别。相比稀疏表示分类器,协同表示的策略可以更好的表征测试样本。此外,公式(3)中的2最小化是一种凸优化算法,相比公式(1)中的0优化求解更为简易,因此具有更高的效率。

本文将协同编码分类应用于SAR识别,其具体实施如图1所示。为了降低原始SAR数据的维度,采用PCA[6]进行特征提取。利用训练样本的PCA特征构建全局字典,然后基于全局字典对测试样本的PCA特征进行协同编码表示,并根据重构误差判定其类别。

图1 本文识别方法的流程

3 实验与分析

3.1 实验数据集

为了验证本文方法的识别性能,在MSTAR数据集上进行了目标识别实验。该数据集采集由美国先进计划研究局和空军实验室(DARPA/AFRL)公布的X波段下10类地面静止目标的实测SAR图像,图像分辨率为0.3 m×0.3 m,是目前国际上评价SAR目标识别方法的重要数据集。图2显示了10类目标的光学图像。表1列出了本文使用的训练样本和测试样本。实验中采用俯仰角17°下的10类目标图像作为训练样本,俯仰角15°下的10类目标图像作为待识别的测试图像。

3.2 实验结果

为了充分验证本文算法的有效性,将本文的CRC与几类经典的SAR目标识别分类器进行对比实验,具体包括:基于K近邻分类器的算法(记为KNN)[3],基于SVM的算法(记为SVM)[10]和基于稀疏表示分类的算法(记为SRC)[11]。为保证对比的一致性,这些分类器与CRC一样都是对提取的PCA特征矢量进行分类。各类方法均基于MATLAB 2016运行,硬件平台为3.4 GHz主频Intel i7处理器以及8 G内存的台式机。

图2 10类目标的光学图像

3.2.110类目标识别结果

首先基于表1中的所有训练样本和测试样本对10类目标的测试样本进行分类,本文方法的识别结果如表2所示。可以看出,本文提出的CRC方法对10类目标的平均识别率达到96.84%,充分说明了其有效性。表3对比了CRC算法与其它几类SAR目标识别方法对10类目标的平均识别率以及效率。本文方法具有最高的识别率,表明了提出方法在标准操作条件下的高性能。通过对比CRC与SRC方法,可以看出CRC采用的协同编码策略相比稀疏表示方法有效提升了目标识别性能。对比各类方法在相同硬件平台下的识别单幅MSTAR图像的时间消耗,提出方法具有较高的效率。如公式(4)所示,CRC的求解具有闭式解,因此求解效率高。

表1 本文使用的训练和测试样本

表2 10类目标的识别结果统计

表3 各类方法在对10类目标的识别性能

3.2.2不同特征维度下的识别性能

分类器的性能与提取的特征息息相关。为了进一步测试CRC方法的识别稳健性,本文在多个特征维度下对10类目标进行了识别实验。图3显示了不同识别算法随着PCA特征维度变化时的性能曲线。各类算法在给定的特征维度内均保持了较为接近的识别性能。对比而言,本文提出的CRC方法在各个维度下均具有最高的平均识别率,证明了其优越性。

图3 不同识别算法在不同特征维度下的识别性能

3.2.3型号差异下的识别性能

型号差异在军事目标中较为常见。例如,某一类型的坦克可以通过局部结构的调整转变为另一种型号。这种型号差异会对目标识别性能造成一定的影响。为了测试CRC方法在型号差异下的识别性能,利用表1中部分训练和测试样本进行识别实验,如表4所示。其中,BMP2和T72两类目标的训练样本和测试样本存在型号差异。表5列出了各类方法在型号差异下的识别性能。相比表3中标准操作条件下的平均识别率,各类方法在型号差异条件下的性能均出现了不同程度的下降。对比而言,本文提出的CRC方法在型号差异下取得了最高的识别性能,体现了它对于型号变化的有效性。协同编码对于存在型号差异的测试样本具有更强的表示能力,从而提高了目标识别性能。

表4 型号差异下的训练和测试样本

表5 本文方法与其它方法在型号差异下的性能对比

3.2.4俯仰角差异下的识别性能

俯仰角差异会导致获取的SAR图像发生较大的变化,此时目标识别的性能往往出现较为严重的下降。表6给出了本实验所用的训练集和测试集,训练样本和测试样本存在较大的俯仰角差异。各类算法的识别性能如表7所示。当俯仰角变化较小时(从17°到30°),各类算法仍然可以较高的识别率。当俯仰角改变较大时(从17°到45°),各类算法的识别性能都出现了剧烈的下降。对比来说,本文提出的CRC方法在30°和45°俯仰角下均保持了最高的平均识别率,由此证明了其对于俯仰角变化具有较强的稳健性。

表6 不同俯仰角下的训练样本与测试样本

3.2.5少量训练样本下识别性能

受限于SAR数据获取能力,实际过程中可用的训练样本相对于大量的待识别样本十分有限[16-17]。因此,识别算法在少量训练样本下的稳定性非常关键。为了测试CRC方法在少量训练样本下的稳健性,本文分别取各类原始训练样本的1/2,1/3/,1/4,1/5和1/6组成训练集,进而测试不同方法的识别性能。各类方法的性能对比如图4所示,可以看出,随着训练样本的减少,各类算法的识别性能都出现了较为明显的下降。对比而言,CRC方法受训练样本减少的影响最小,在各个规模的训练集上均保持了最高的平均识别率。因此,CRC采用的协同编码策略有效提升了识别算法在少量训练样本下的识别性能。

表7 不同算法在较大俯仰角差异下的识别性能

图4 不同识别算法在少量训练样本下的识别性能

4 结 语

本文提出了基于协同编码分类的SAR目标识别方法。相比于传统的稀疏表示,协同编码的策略可以综合利用各类的训练样本实现对测试样本更高精度的表示从而提升少量训练样本条件下对测试样本的表示能力。将CRC应用于SAR目标识别并在MSTAR目标数据进行了实验验证,结果表明:本文方法在对10类MSTAR目标的识别率达到96.84%,表明了其在标准操作条件下的良好性能;通过测试各类识别方法在多个特征维度、型号差异、俯仰角差异以及少量训练样本等条件下的识别性能,进一步显示CRC方法对于扩展操作条件的稳健性。这些均说明了本文方法的优越性,证明其在SAR目标识别方面具有较大的应用潜力。

猜你喜欢
训练样本识别率分类器
基于朴素Bayes组合的简易集成分类器①
人工智能
基于特征选择的SVM选择性集成学习方法
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
听力正常青年人的低通滤波言语测试研究*
提升高速公路MTC二次抓拍车牌识别率方案研究
基于差异性测度的遥感自适应分类器选择
档案数字化过程中OCR技术的应用分析
基于小波神经网络的网络流量预测研究
宽带光谱成像系统最优训练样本选择方法研究