一种飞机目标的遥感识别方法

2017-04-10 11:53殷文斌王成波乔彦友
测绘通报 2017年3期
关键词:级联识别率分类器

殷文斌,王成波,袁 翠,乔彦友

(1. 中国科学院遥感与数字地球研究所,北京 100094; 2. 中国科学院大学,北京 100049)

一种飞机目标的遥感识别方法

殷文斌1,2,王成波1,袁 翠1,2,乔彦友1

(1. 中国科学院遥感与数字地球研究所,北京 100094; 2. 中国科学院大学,北京 100049)

高空间分辨率遥感影像通常具有数据量大、背景复杂及地物占比较少等特点。如果直接将RCNN模型应用于高空间分辨率遥感影像目标识别,计算量大且效率低。级联AdaBoost算法识别率高、速度快,但又会产生较多的虚假目标。本文结合RCNN模型和级联AdaBoost算法,提出了一种由粗到精的飞机目标识别方法。首先使用基于HOG特征的级联AdaBoost算法快速提取飞机目标候选区域,然后利用基于卷积神经网络特征的SVM对飞机目标候选区域进行精细识别。试验表明,本文提出的方法在保证准确率的同时,还有效提高了计算效率。

AdaBoost;RCNN;飞机识别;高空间分辨率遥感影像

高空间分辨率遥感影像具有丰富的空间信息、地物纹理信息和清晰的几何结构,可用于目标的精确识别。遥感识别中的目标主要有飞机、舰船、油罐、树木等人为和自然要素。飞机作为一种重要战略目标,基于高空间分辨率遥感影像的识别在军事和民用领域都具有重要意义。

国内外学者对飞机目标遥感识别开展了广泛的研究,提出了多种飞机识别方法。Zhu等通过提取Hu矩和仿射不变矩等特征,筛选出7个特征参数结合SVM完成飞机识别,弥补了单一特征描述信息能力不足的缺点[1]。Liu等利用一种由粗到精的层次化策略,在粗匹配过程中使用图像的边缘信息得到候选目标,接着利用形状特征完成对候选目标的精匹配[2]。蔡栋等通过提取飞机骨架的几何特征和网络测度等参数,采用聚类方法,自动识别飞机[3]。上述方法都是基于人工设计特征,虽然借鉴大量的先验知识并经过巧妙设计后,在特定情况下取得了很好的效果,但这些特征无法表征目标中复杂的中层和高层结构信息,泛化能力较弱[4]。

卷积神经网络能自适应地提取目标地物的高层语义特征,广泛应用于图像分类与目标识别等领域[5- 6]。Girshick等将卷积神经网络运用于目标检测中,提出了RCNN模型[7],奠定了使用卷积神经网络进行目标检测的基础。该模型运用与类别无关的Selective Search[8]算法在每幅图像上产生大量候选区域,并对所有候选区域分别使用卷积神经网络提取特征,计算量大且效率低。级联AdaBoost分类器能够快速排除大量非目标区域,速度快且识别率高,但会产生一些虚假目标。本文结合RCNN模型和级联AdaBoost算法,提出一种由粗到精的飞机识别算法。首先利用基于HOG特征的级联AdaBoost算法进行粗识别,快速剔除大量非飞机目标区域;然后对余下的疑似飞机目标区域,利用卷积神经网络提取特征,并将特征输入SVM进行精细识别。在遥感影像数据集上的试验结果表明,该方法可以有效解决飞机目标遥感识别问题,在保证准确率和识别率的同时,显著提高了算法效率。

1 相关理论

1.1 级联AdaBoost算法

AdaBoost算法是Freund等在Boosting算法基础上提出的自适应算法,其核心思想是对同一个训练样本集训练不同的弱分类器,然后以一定的权重将这些弱分类器连接起来,构成一个强分类器[9]。训练AdaBoost分类器时,首先为每个样本设置相同的权重,训练出初始的弱分类器;然后加大分类错误样本的权重,降低分类正确样本的权重,使分类错误的样本更加突出,从而得到一个新的权重分布;在新的分布下,重新训练出一个弱分类器。重复N次以上步骤,得到N个弱分类器,按一定的权重将这N个弱分类器组合起来,得到最终的强分类器。

为了提高AdaBoost算法的计算效率,Viola等提出了一种级联结构的AdaBoost算法,即在对候选区域进行判别时,只有被前面一级的分类器判决为目标的区域才被送入后面的分类器继续处理,反之则被认为是非目标区域直接拒绝[10]。级联AdaBoost分类器的输出是被每一级分类器都判决为目标的区域。图1为级联AdaBoost分类器的结构示意图。

图1 级联AdaBoost分类器结构

1.2 卷积神经网络(CNN)

CNN是一种卷积层和降采样层交替出现的多层感知机,通过从原始图像中提取、组合特征,从而识别视觉模式。CNN通过局部感受野、权值共享和降采样3种技术来识别图像的位移、缩放和扭曲不变性。局部感受野可以提取局部、初级的视觉特征;权值共享确保网络具有更少的参数;降采样降低特征的分辨率,实现对位移、缩放和旋转不变性[11- 12]。

(1)

(2)

2 研究方法

本文提出的方法流程如图2所示。首先,利用基于HOG特征的级联AdaBoost分类器快速排除大量的非目标区域,得到少量的候选目标区域;然后对每个候选区域,利用CNN提取特征,将特征输入到SVM分类器进行精细识别。粗识别减少了需要计算CNN特征的候选区域数量,从而提高了算法效率。

图2 算法流程

2.1 基于级联AdaBoost的粗识别

遥感目标识别算法不仅要尽可能多地识别出目标地物,还要能够快速完成识别任务。与自然图像相比,高空间分辨遥感影像数据量大,背景复杂,且待识别的目标通常只占很少比例。SelectiveSearch算法在每幅图像上提取大约2000个候选区域,但这些区域中只有很小一部分包含目标,并且大量候选区域与目标差异很大,使用简单特征就能排除。而RCNN模型需要对每个候选区域运用CNN提取特征,因而计算量大、效率低。本文选用基于HOG的级联AdaBoost分类器,通过多尺度滑动窗口策略进行遥感影像粗识别。级联AdaBoost分类器按照分类器先易后难的原则串联起来,与目标差异较大的背景区域被下级分类器直接拒绝,只有与目标相似区域才会进入到上级复杂分类器中进行识别,因此级联AdaBoost在保证高识别率的同时能够快速排除大量非目标区域。

2.2 基于CNN特征的SVM精细识别

经过级联AdaBoost粗识别之后,每幅影像产生的候选区域数量与SelectiveSearch相比,降低了一个数量级,从而减少了CNN计算量。本文选用AlexNet[13]网络提取候选区域特征,结合SVM分类器剔除虚假目标。

在2012年的ILSVRC(ImageNetLargeScaleVisualRecognitionChallenge)图像分类比赛中,Krizhevsky等提出的AlexNet首次将深度学习应用于大规模图像分类,并取得了很好的分类效果。AlexNet是一个8层的卷积神经网络,包含5个卷积层、3个全联结层,其中第1、3、5卷积层后面各有一个降采样层,最后一层采用softmax进行分类,网络结构如图3所示。该模型采用ReLU(Rectifiedlinearunits)来取代传统的sigmoid和tanh函数作为神经元的非线性激活函数,并采用Dropout方法来防止过拟合。

图3 AlexNet网络结构[14]

近年来的众多研究表明,在大规模自然影像数据集(如ImageNet等)上训练好的卷积神经网络模型,可以作为一个通用的特征提取器,即使不经过微调,也可以用于高分辨率遥感影像特征提取[14- 15]。本文利用ImageNet上训练好的AlexNet网络分别提取pool5、fc6、fc7第3层特征,并将特征分别输入到SVM分类器中进行精细识别。

2.3 评价指标

准确率和识别率是评价目标识别算法性能的常用指标。准确率是正确识别出的目标数与被判定为目标的总数的比率,衡量的是查准率,用式(3)表示;识别率是指正确识别出的目标数与真实的目标总数的比率,衡量的是查全率,用式(4)表示。

(3)

(4)

式中,PR表示准确率;RR表示识别率;TP表示正确识别的目标数量;FP表示把非目标错误判断为目标的数量;FN表示真实目标被错误判断为非目标的数量。

3 试验与结果

3.1 试验数据

为评价本文方法的有效性,分别运用本文方法与传统RCNN模型对相同的遥感数据集进行对比分析。试验数据来自GoogleEarth,共计400幅影像,1294架飞机。影像约在300×300像素到700×700像素之间,分辨率优于0.6m。这些飞机具有不同的颜色、形状、大小和成像角度,并处于不同的背景中,且每幅影像上飞机数量不等。试验数据分为训练集(150幅,488架飞机)、验证集(50幅,186架飞机)和测试集(200幅,620架飞机),分别用于算法训练、参数优化和结果评价。

3.2 分类器训练

将训练集中的488个人工标记的飞机目标区域分别旋转90°、180°、270°,共计1952个飞机样本作为正样本;负样本选择机场中的非飞机区域,共计15 000个。正负样本统一缩放成32×32像素,组成训练样本集。训练级联AdaBoost分类器时,每一级的目标检测率设置为0.996,目标误报率为0.5,级数为15。

级联AdaBoost分类器输出的候选区域与目标具有很大的相似性,通常包含部分目标,如果仅使用不包含目标的背景区域作为负样本训练SVM分类器,分类器性能较差,不能很好地剔除虚假目标。本文应用RCNN模型中的SVM分类器训练策略,在负样本中增加大量与人工标记目标区域重叠度小于图0.3的区域,采用在ImageNet上训练好的AlexNet提取pool5、fc6和fc7特征分别训练SVM分类器。

3.3 结果与性能

表1给出了本文方法与RCNN模型在每幅影像上需要计算CNN特征的候选区域数量。表2给出了本文方法与RCNN模型在测试集上的比较结果。该结果表明:相比RCNN模型,本文方法的准确率和识别率提高了约1%,算法效率提高了约10倍。这主要是由于级联AdaBoost能够迅速提出大量非目标区域,从而减少了需要CNN提取特征的区域数量。同时,从表2中还可以得出,AlexNetpool5层的特征比fc6和fc7层特征更能有效地描述飞机特征。图4给出了AdaBoostRCNN(pool5)部分影像的识别结果,黑色方框表示人工标记的飞机区域,白色方框为识别结果。

表1 候选区域数量比较

表2 算法性能比较

图4 识别效果

4 结 语

高分辨率遥感影像目标识别是遥感领域的研究热点之一。本文提出了一种基于级联AdaBoost和RCNN模型的高分辨率影像飞机目标识别算法,在研究数据集上取得了较高的准确率和识别率。该方法与RCNN相比,具有更好的性能和更高的效率,是高空间分辨率遥感影像飞机目标识别的有效解决方案之一。

[1] ZHU X, MA C. The Study of Combined Invariants Optimization Method on Aircraft Recognition[C]∥2011 Symposium on Photonics and Optoelectronics (SOPO). Wuhan: IEEE,2011.

[2] LIU G, SUN X, FU K, et al.Aircraft Recognition in High- Resolution Satellite Images Using Coarse- to- Fine Shape Prior[J]. IEEE Geoscience and Remote Sensing Letters,2013,10(3):573- 577.

[3] 蔡栋, 陈焱明, 魏巍. 基于骨架特征的多光谱遥感影像飞机目标识别方法研究[J]. 测绘通报, 2014(2):50- 54.

[4] 许夙晖, 慕晓冬, 赵鹏,等. 利用多尺度特征与深度网络对遥感影像进行场景分类[J]. 测绘学报, 2016, 45(7):834- 840.

[5] DONAHUE J, JIA Y, VINYALS O, et al. DeCAF: A Deep Convolutional Activation Feature for Generic Visual Recognition[C]∥Proceedings of the 31st International Conference on Machine Learning (ICML- 14).Beijing: JMLR Workshop and Conference Proceedings, 2014.

[6] SCHMIDHUBER J.Deep Learning in Neural Networks: An Overview[J]. Neural Networks, 2014,61:85- 117.

[7] GIRSHICK R, DONAHUE J, DARRELL T, et al. Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation[C]∥2014 IEEE Conference on Computer Vision and Pattern Recognition(CVPR). Columbus: IEEE, 2014.

[8] UIJLINGS JR, SANDE KE, GEVERS T, et al. Selective Search for Object Recognition[J]. International Journal of Computer Vision, 2013,104(2):154- 171.

[9] FREUND Y, SCHAPIRE RE. A Decision- theoretic Generalization of On- line Learning and an Application to Boosting [J]. Journal of Computer and System Sciences,1999,55(7):119- 139.

[10] VIOLA P, JONES M. Robust Real- time Face Detection[J]. International Journal of Computer Vision,2004,57(2):137- 154.

[11] 赵志宏, 杨绍普, 马增强. 基于卷积神经网络LeNet- 5的车牌字符识别研究[J]. 系统仿真学报, 2010,22(3):638- 641.

[12] 蔡娟, 蔡坚勇, 廖晓东,等. 基于卷积神经网络的手势识别初探[J]. 计算机系统应用, 2015, 24(4):113- 117.

[13] KRIZHEVSKY A, SUTSKEVER I, HINTON G E.Imagenet Classification with Deep Convolutional Neural Networks[J]. Advances in Neural Information Processing Systems,2012,25:1097- 1105.

[14] HU F, XIA GS, HU J, et al. Transferring Deep Convolutional Neural Networks for the Scene Classification of High- resolution Remote Sensing Imagery[J]. Remote Sensing,2015,7(11):14680- 14707.

[15] PENATTI OAB, NOGUEIRA K, SANTOS JAD. Do Deep Features Generalize from Everyday Objects to Remote Sensing and Aerial Scenes Domains? [C]∥2015 IEEE Conference on Computer Vision and Pattern Recognition Workshops (CVPRW). Boston: IEEE,2015.

A Method of Aircraft Recognition in Remote Sensing Images

YIN Wenbin1,2,WANG Chengbo1,YUAN Cui1,2,QIAO Yanyou1

(1. Institute of Remote Sensing and Digital Earth,Chinese Academy of Sciences, Beijing 100094,China; 2. University of Chinese Academyof Sciences, Beijing 100049,China)

High resolution remote sensing images often has the characteristics of huge data amount, complex background and low ground objects proportion. It is inefficient to use RCNN model for object recognition in high resolution remote sensing images directly. The cascade AdaBoost has the advantages of high recall rate and fast calculating speed, while it is likely to detect more false targets. In this article, a coarse to fine aircraft recognition method is proposed by combining RCNN model with cascade AdaBoost. Firstly, a HOG based cascade AdaBoost is applied to extract the candidate aircraft regions quickly. Then we classify the candidate regions with the support vector machine (SVM) classifier using features computed from convolutional neural networks. The results show that this method can ensure the accuracy and improve the computational efficiency.

AdaBoost; RCNN; aircraft recognition; high resolution remote sensing images

2016- 07- 17;

2017- 01- 17 作者简介: 殷文斌(1991—),男,硕士,主要从事遥感目标识别研究。E- mail:yinwb@radi.ac.cn 通信作者: 王成波。E- mail:wangcb@radi.ac.cn

殷文斌,王成波,袁翠,等.一种飞机目标的遥感识别方法[J].测绘通报,2017(3):34- 37.

10.13474/j.cnki.11- 2246.2017.0079.

P237

A

0494- 0911(2017)03- 0034- 04

猜你喜欢
级联识别率分类器
铀浓缩厂级联系统核安全分析
基于朴素Bayes组合的简易集成分类器①
基于特征选择的SVM选择性集成学习方法
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
听力正常青年人的低通滤波言语测试研究*
富集中间组分同位素的级联
—— “T”级联
提升高速公路MTC二次抓拍车牌识别率方案研究
基于差异性测度的遥感自适应分类器选择
档案数字化过程中OCR技术的应用分析
基于层次化分类器的遥感图像飞机目标检测