晁安娜,刘 坤
(上海海事大学 信息工程学院,上海 201306)
基于卷积神经网络的遥感图像飞机目标识别*
晁安娜,刘 坤
(上海海事大学 信息工程学院,上海201306)
遥感图像的识别技术一直被广泛运用于民用和军事领域。针对采集到的遥感飞机图像存在大量干扰,如遮挡、噪声、视角变化等因素,提出一种改进的基于卷积神经网络的遥感图像目标识别算法。在复杂环境下,运用卷积神经网络对飞机目标进行识别,避免了在特征提取过程中信息的丢失,提高了识别率。实验结果证明了该算法在遥感图像飞机目标识别中的可行性,能克服尺度变化及目标姿态变化等因素的影响。同时提出的算法较传统CNN、BP神经网络和支持向量机(SVM)方法具有更好的识别效果,鲁棒性更强。
卷积神经网络;深度学习;遥感图像;飞机识别
遥感图像飞机识别在民用和军事领域都具有重大意义。目前对飞机目标识别的方法有很多种,例如特征点和不变矩、模板匹配、特征融合等。传统的飞机目标识别算法通常采用模板匹配[1],它具有算法简单、计算量小的特点,但过程简单,提取图像中飞机的完整形状在现实环境中非常困难,且不能适用于飞机目标的尺度变换。目前飞机目标识别领域应用最广泛的方法是利用不变矩,具有代表性的不变量特征提取方法有Hu矩[2]、Zernike距[3]、小波距[4]等。现主要采用优化组合矩[5]对飞机目标进行识别,将提取的多维不变矩作为识别特征,再使用支持向量机(SVM)来识别飞机目标,可以克服单一特征描述信息能力不强的特点,但多特征融合困难,抗噪性较差。BP神经网络[6]具有良好的学习能力和泛化能力,但由于学习速率固定,学习步长及动量因子难以确定,使得网络收敛速度慢,纠错能力有限,甚至导致算法收敛于局部极小值。
由于实际采集到的遥感飞机图像较复杂,视角变化、噪声、云层遮挡等干扰因素会导致较高的误识率。本文提出一种基于卷积神经网络的遥感图像飞机识别算法,在传统CNN结构上加以改进,通过海地机场6类遥感飞机图像进行多组实验,仿真结果证明将卷积神经网络运用在飞机识别上不仅克服了遮挡、光照和视点变化等因素,提高了抗噪性,而且鲁棒性和识别精度都得到了提升。
1.1卷积神经网络简介
卷积神经网络(Convolutional Neural Networks,CNN)[7]是人工神经网络与深度学习的结合。传统意义上的多层神经网络只有输入层、隐藏层、输出层,且隐藏层较难确定。而卷积神经网络在原来多层神经网络的基础上,加入部分连接的卷积层与池化层,来模仿人脑对信号处理上的分级。
卷积神经网络通过局部感受野和权值共享减少训练参数和计算的复杂度,这种网络结构对旋转、尺度缩放或者其他形变具有稳定性,成为人脸检测与文字识别等领域的研究热点。CNN采用一种改进的基于梯度的反向传播算法,在减少权值数量的同时降低了网络结构的计算复杂度。该网络结构无需传统识别方法中繁杂的特征提取与重建,避免数据的丢失,图像可以直接输入网络。
1.2卷积神经网络模型结构
传统CNN模型LeNet为5层[8],本文采用的卷积神经网络较传统CNN在结构上的改进如下:为了避免初始参数饱和,缓解梯度消失,在每层卷积层和全连接层都采用修正线性单元(Rectified Linear Unit,ReLU)替代原来的Sigmoid函数;基于遥感飞机图像的特点,要更多地保留纹理信息而忽略背景信息,在池化层采用最大二均值池化替代均值池化和最大池化;为了增强泛化能力,提高网络的稀疏性和随机性,防止过拟合,在全连接层加入DropConnect[9],设置概率为0.6。
本文所采用的卷积神经网络共11层,包括5个卷积层、3个池化层、2个全连接层和1个Softmax层。卷积核大小分别为11, 5, 3, 3, 3;特征图个数分别为20, 40, 60, 80, 80;池化窗口为2×2。在全连接层加入概率为0.6的DropConnect,Softmax输出层包含224个节点。针对6类飞机的分类结果,设置输出神经元个数为6。本文所采用的卷积神经网络结构如图1所示。
图1 本文卷积神经网络结构
卷积过程:将一个可训练滤波器kj与一个输入图像(开始是输入图像,随后是卷积特征图)进行卷积,之后加上偏置bj,获得卷积层Cj。通常,卷积层的形式如下所示:
(1)
其中:j表示第j张特征图;l表示层数;k表示卷积核;f表示激励函数ReLU,f(x)=max(0,x);Mj表示输入特征图的一个选择;b表示偏置。
池化过程:选取池化域内中值依次最大的两个元素求和,池化的特征值为和的平均数。最大二均值池化的一般形式为:
(2)
在卷积神经网络的遥感飞机识别算法实现中,以其训练过程最为重要。网络的训练过程主要分为前向传播和后向传播两个阶段[10]。该网络的算法流程图如图2所示。
图2 卷积神经网络遥感飞机目标识别算法流程图
卷积神经网络进行遥感飞机目标识别的训练过程如下:
(1)建立一个飞机图像库(包括训练图像和测试图像),并对各类飞机图像进行预处理,如尺度缩放、旋转、仿射变换、加噪、运动模糊和遮挡等。
(2)初始化CNN网络结构和参数设置,设置训练集中各个模式下输出单元i到隐藏单元j的权值Vij,隐藏单元i到输出单元j的权值Wjk,输出单元阈值θk,隐藏单元阈值φj置成接近于0的随机值,精度控制参数ε和学习率α初始化为0.01α。
(3)定义层之间的相关矩阵,读取训练数据,即从样本集中选取样本(X,Xk),将X数据读取到网络中。
(4)训练网络,即计算输入点乘每层对应的权值矩阵,得出实际输出Yk:
Yk=Fn(…(F2(F1(xkW(1))W(2))…)W(n))
(3)
通过比较网络训练后的实际输出Yk与目标输出Ok的差值,计算第k个样本的输出误差值Ek,即:
(4)
(5)根据误差值,按极小化误差的方法反馈网络,依次计算各权值和阈值的调整量:
权值的调整量:
(5)
(6)
其中:L表示中间层的单元数;N表示输入层单元数;δk表示输出误差项,δk=(ok-yk)yk(1-yk)。
阈值的调整量:
(7)
(8)
(6)根据计算得到的调整量,依次调整权值和调整阈值:
调整权值:
Wjk(n+1)=Wjk(n)+ΔWjk(n)
(9)
Vij(n+1)=Vij(n)+ΔVij(n)
(10)
调整阈值:
θk(n+1)=θk(n)+Δθk(n)
(11)
φj(n+1)=φj(n)+Δφj(n)
(12)
(7)重复以上步骤,直至误差指标满足精度要求:E≤ε,其中E是总输出误差,定义为:
E=∑EK
(13)
(8)训练结束,保存达到精度要求的相关权值和阈值。
(9)读取处理过的测试图像,测试网络,输出各遥感飞机识别结果,并评定网络精度及稳定性。
实验以MATLAB仿真实现,本文所采用的飞机遥感图像来自于某些海地机场的IKONOS卫星图像。为了验证该算法的可行性和有效性,从中选取了海地机场的6类飞机目标各个角度的灰度图像进行实验,包括A-10攻击机、B-2轰炸机、B-52轰炸机、E-A预警机、F-15战斗机和F-16战斗机。样本图像中每种机型各角度图片有1 000幅,测试图像中每种机型各视角图片有100幅,每幅图像大小为256×256,图像像素值明显大于Mnist库(手写数据库)[11]。为了得到更好的识别结果,图像均经过二值化处理。图3为这6种类型的二值图像。
图3 海地机场6类飞机目标的二值图像
为了验证该算法的可行性,将每种飞机类型输入网络,迭代次数设置为20,将20次的平均误差作为测试结果。实验结果如表1所示。
表1 各类飞机目标的识别结果
由以上结果可知,将CNN运用在遥感飞机目标识别邻域具有较高的识别率,并且对于各种类型的飞机目标,识别结果较为稳定,证明了本文算法的可行性。
为了验证该算法的抗噪性,考虑到遥感飞机目标识别的实际应用环境。实际图像易受到视角变化、噪声干扰、云层遮挡等影响,故对图像进行了尺度缩放、旋转、仿射变换,还加入了不同等级的高斯白噪声、运动模糊和不同位置的遮挡。下面列出6组飞机图像经过一系列变换的仿真图(以A-10攻击机为例),如图4~图9所示,重复上述实验方法,得到实验结果如表2所示。
图4 尺度缩放0.5
图5 旋转30°
图6 仿射变换0.15
图7 加噪声 0.02
图8 运动模糊
图9 任意位置遮挡
飞机类型训练样本数测试样本数识别率/%A⁃10攻击机700070093.31B⁃2轰炸机700070097.58B⁃52轰炸机700070091.78E⁃A预警机700070096.54F⁃15战斗机700070095.98F⁃16战斗机700070092.53平均识别率/%94.62
从以上识别结果可以看出,在图像加入各种类型的变换及干扰后,识别率稍有下降。对于B-52轰炸机来说,其外形结构易受到环境的影响,故识别结果下降较大;而对于B-2轰炸机,其稳定的三角形状使得识别结果较为稳定。总的来说,整体的识别率还是维持在较高的水平上,可见该算法能克服视角变化、噪声干扰、云层遮挡等影响,抗噪性强。
为了验证算法的鲁棒性,在测试图像中加入非该类型飞机及其他类似图像作为干扰项,每种类型各增加300幅干扰图片。继续重复上述实验方法,得到实验结果如表3所示。
表3 干扰因素下各类飞机目标的识别结果
从表3可以看出,在测试图像中加入了干扰项后,各种遥感飞机类型的识别结果虽有所波动,但对识别率的影响很小,识别精度较稳定,鲁棒性强。
为了验证算法的识别效率及精度,在加入复杂环境及干扰因素的情况下,将该算法与传统CNN算法、BP结合D-S证据理论算法[12]及支持向量机(SVM)[13]的分类方法进行比较。其中BP结合D-S证据理论的多特征融合算法是基于Hu矩、仿射不变量等特征;采用SVM分类方法进行分类时,分别提取飞机目标的骨架约束的角点、几何矩不变量等特征,并加权融合所有特征。实验对比结果如表4 所示。
表4 其他算法与本文CNN算法的复杂度对比
为了简化描述并更直观地显示对比结果,用A、B、C、D、E、F分别代表A-10攻击机、B-2轰炸机、B-52轰炸机、E-A预警机、F-15战斗机和F-16战斗机,对比图如图10所示。
图10 本文算法与其他识别算法中每类飞机的正确识别率对比
从上述表1~表4及图10能够明显看出,本文算法较传统CNN在识别精度上有了较大的提高;同时较SVM方法避免了复杂的特征提取及信息的缺失;相对于传统的BP神经网络,不仅减少了权值的数量,降低了网络模型的复杂度,而且大大减少了识别时间,提高了识别精度。
本文提出了一种基于卷积神经网络的遥感图像飞机目标识别算法,对激励函数、池化模型和正则化模型进行了改进,提高了网络的稀疏性和随机性。该算法对遥感图像中飞机目标存在的尺度缩放、倾斜、仿射变化等其他形式的变形和噪声干扰、云层遮挡等复杂背景环境具有较高的抗噪性、鲁棒性及识别精度。
本文所提出的遥感图像识别算法具有良好的容错性、并行处理能力以及自学习能力,这些优势使其适用于复杂的飞机遥感图像的处理,在实际应用中有较大的研究价值。在后续研究实验中,会根据实际应用情况,增加识别的飞机目标类型数,拓宽在不同背景环境下的应用,同时对网络结构及算法进行进一步的改进,以提高算法的识别率和鲁棒性。
[1] AZZOUZ E E, NANDI A K. Automatic identification of digital modulation types[J]. Signal Processing, 1995, 47(1):55-69.
[2] HU M K. Visual pattern recognition by moment invariants[J]. IRE Transactions on Information Theory, 1962, 2(8):179-187.
[3] TEAGUE M R. Image analysis via the generaltheory of moments[J]. Journal of the Optical Society of America, 1980,70(8):920-930.
[4] Shen Dinggang, IP H H S. Discriminative wavelet shape descriptors for recognition of 2-D patterns[J]. Pattern Recognition, 1998, 32(2):151-165.
[5] Zhu Xuefeng, Ma Caiwen. The study of combined invariants optimization method on aircraft recognition[C]. 2011 Symposium on Photonics and Optoelectronics (SOPO),IEEE,2011:1-4.
[6] Fang Zixuan, Yao Guoqing, Zhang Yanan. Target recognition of aircraft based on moment invariants and BP neural network[C]. World Automation Congress, 2012:1-5.
[7] LAWRENCE S, GILES C L,TSOI A C, et al. Face recognition: a convolutional neural-network approach[J]. IEEE Transactions on Neural Networks, 1997, 8(1):98-113.
[8] 徐鹏,薄华.基于卷积神经网络的人脸表情识别[J].微型机与应用,2015,34(12):45-47.
[9] Wan Li, ZEILER M, Zhang Sixin, et al. Regularization of neural networks using dropconnect[C]. International Conference on Machine Learning, 2013,28(3): 1058-1066.
[10] 龚丁禧,曹长荣.基于卷积神经网络的植物叶片分类[J].计算机与现代化,2014 (4): 12-15.
[11] 许可.卷积神经网络在图像识别上的应用研究[D].杭州:浙江大学,2012.
[12] 杨福平,白振兴.BP神经网络和D-S证据理论的目标识别[J].火力与指挥控制,2006,31(10):88-90.
[13] 李平,魏仲慧,何昕,等.采用多形状特征融合的多视点目标识别[J].光学精密仪器,2014,22 (12):3368-3376.
2017-03-31)
晁安娜(1992-),女,硕士研究生,主要研究方向:智能信息处理与模式识别。
刘坤(1982-),女,博士,副教授,主要研究方向:多尺度集合分析理论、稀疏表示以及压缩感知等图像处理技术。
Aircraft target recognition in remote sensing image based on CNN
Chao Anna, Liu Kun
(College of Information and Engineering, Shanghai Maritime University, Shanghai 201306, China)
Remote sensing image recognition has been widely used in civil and military fields. In view of plenty of interference factors in remote-sensing aircraft, such as shade, noise, the changing of perspective, etc, an improved target recognition algorithm in remote sensing image based on convolution neural network is proposed. Convolution neural network is adopted to recognize aircraft target in complex environment to avoid information loss in the process of feature extraction, which improves recognition rate. Simulation results show that the feasibility of aircraft target recognition algorithm in remoting sensing image and the scale and posture changes of target can be overcome. Meanwhile, the proposed algorithm has higher recognition effect and stronger robustness than traditional CNN and BP neural network and support vector machine (SVM) methods.
convolution neural network; deep learning; remote sensing image; aircraft recognition
TP391.9
A
10.19358/j.issn.1674- 7720.2017.22.018
晁安娜,刘坤.基于卷积神经网络的遥感图像飞机目标识别J.微型机与应用,2017,36(22):66-69,73.
航空科学基金(2013ZC15005)