许益乔,杨 虹,张占月,张 刚
(1.航天工程大学,北京 101416; 2.北京遥感信息研究所,北京 100192;3.北京跟踪与通信技术研究所, 北京 100094)
逆合成孔径雷达(ISAR)是一种全天时、全天候、远距离、高分辨的二维成像设备,在民用以及军事领域中占有重要的地位。ISAR通过发射大宽带信号对目标进行高分辨成像,可以精确地描述目标的结构特性以及散射中心分布,与传统的雷达散射截面积(RCS)、高分辨距离像(HRRP)、微多普勒谱图(MD)等相比,能够提供更加丰富的目标结构信息。因此,利用二维ISAR像进行空间目标识别一直是空间态势感知领域的研究热点。
现阶段,利用空间目标二维ISAR像进行空间目标识别主要依靠人工提取特征,然后使用分类器实现分类。其中,文献[15]探索了二维傅里叶变换与极坐标映射技术(FT-PM)在空中目标ISAR像分类中的应用;文献[16]提出利用Trace变换提取空中目标ISAR像的小维度高判别性特征进行分类;文献[13]将尺度不变特征变换(SIFT)和显着特征组合在一起,对雷达图像进行分类;文献[17]利用多流行正则化低秩近似(MLA)方法获取SAR图像的低维表示,以实现对SAR目标的分类识别。尽管传统方法能够实现空间目标识别,但是过程复杂,耗费大量的时间与精力,且时效性差。为了实现空间目标识别的自动化,最近,深度学习(DL)在计算机视觉领域引起了人们的广泛关注。与手动提取特征方法相比,深度学习算法凭借多层的网络结构,具有自动学习深层模态特征、获取较高分类准确率等优势。例如,文献[23]设计了一个包含2层卷积层、2层全连接层的CNN网络架构。该模型能在不同场景下从非货船目标和海杂波中提取货船目标,取得了很好的分类结果。此外,文献[24]提出一种全卷积神经网络(FCNN),当利用该网络对MSTAR数据中的10类目标进行分类时,识别率达到99.13%。但受空间目标过境时间短、成像过程复杂、以及标注需要专业人员等限制,空间ISAR像数据缺乏,导致现有的深度学习工具直接应用于空间目标ISAR图像领域会出现训练困难、难以实施等现象。
面对上述问题,迁移学习(TL)提供了一种新的解决思路。它将已学到的知识迁移到仅有少量目标数据的分类任务中,以解决不同相关领域的问题。鉴于此,本文首次提出了小样本集条件下基于迁移学习模型的空间目标ISAR像识别方法,首先通过角度旋转、方位向距离向尺度变换、斑点噪声注入等方式对空间目标ISAR像训练数据进行增强,使训练集涵盖更多空间分布情况,提升模型泛化性;然后利用迁移学习,将预先预训练好的AlexNet模型在该数据集上进行重新训练,完成网络权值的微调,解决深度神经网络模型在小样本情况下的训练过拟合问题;最后研究4种迁移配置下AlexNet迁移学习模型的分类性能,并与传统分类方法进行对比,进一步验证本文所提方法的有效性。
通常在迁移AlexNet预训练模型时有以下2种策略:一是直接将AlexNet模型作为一个固定的特征提取器,即删除AlexNet模型的最后一个全连接层,将AlexNet模型中的其余部分作为空间目标ISAR像数据集的固定特征提取器,利用所提特征训练一个分类器从而实现模型迁移;二是对AlexNet预训练模型进行权值微调,在替换掉AlexNet模型中的最后一个全连接层(FCL)后,将空间目标ISAR像数据集作为新的输入,通过反向传播方式对AlexNet模型的权值进行微调,从而实现模型迁移。
对于第1种迁移策略,只有当新数据集与训练AlexNet的原始数据集具有十分相似的特征时,该迁移策略才较为合适。但是AlexNet的预训练是在ImageNet上进行的,主要为光学图像,与雷达图像具有较大区别,且大部分训练目标与空间目标具有十分不同的特征。因此在空间目标ISAR像的分类问题上,并不适合使用该策略来迁移AlexNet预训练模型。
因此本文选取第2种权值微调策略对AlexNet预训练模型进行迁移。本文所提出的基于迁移学习的AlexNet网络模型的算法流程如图1所示,其中CL1~CL5为卷积层,FCL6~FCL8是全连接层。模型的图像输入大小为227×227,输出为空间目标类别。
在对AlexNet模型进行迁移学习时使用微调AlexNet预训练模型的策略,即修改AlexNet的FCL8的输出,由输出1000维修改为5维。修改的FCL8的参数如表1所示。
图1 本文整体算法流程图
表1 替换AlexNet的最后一个FCL
表1中,Softmax层使用的激活函数为softmax。softmax函数是二分类Logistic回归模型在多分类问题上的扩展,有多少个分类softmax函数的输出层,则拥有多少个单元。在softmax函数作用下每个神经单元都会计算出当前样本属于本类的概率。其表达式为:
(1)
式(1)中:,,,…,表示权重;,,,…,表示偏置;表示神经元的输出;表示类别数,本文中=5。
为更好改善网络识别性能,对AlexNet预训练模型的深、浅层权值设置不同的学习迁移模型训练,即将AlexNet的浅、深层结构的学习率分别设置为10和10。划分AlexNet预训练模型深浅层有以下4种方式:迁移配置1,[(CL1,CL2,CL3,CL4,CL5,FCL6,FCL7),()];迁移配置2,[(CL1,CL2,CL3,CL4,CL5,FCL6),(FCL7)];迁移配置3,[(CL1,CL2,CL3,CL4,CL5),(FCL6,FCL7)];迁移配置4,[(CL1,CL2,CL3,CL4),(CL5,FCL6,FCL7)]。以迁移配置4为例进行说明,其中(CL1,CL2,CL3,CL4)表示将AlexNet预训练模型的CL1,CL2,CL3,CL4作为浅层,初始权值与AlexNet预训练模型的权值保持一致,选取学习率为10;(CL5,FCL6,FCL7)表示将AlexNet预训练模型的CL5,FCL6,FCL7作为深层,初始权值与AlexNet预训练模型的权值保持一致,选取学习率为10。其他迁移设置依此类推,4种迁移配置方式如图2所示。
图2 4种迁移配置方式示意图
空间目标ISAR像是空间目标的高能散射中心在二维平面上的分布。ISAR成像系统根据空间目标的电磁散射特性,将空间目标中的组成部分(如太阳能帆板、天线、本体等部位)映射到一个二维的图像投影平面(IPP)上,从而获得空间目标的ISAR像,ISAR的成像示意图如图3。通过图3的成像模型,利用空间目标的三维模型,生成5类空间目标,部分样例如图4所示。
图3 空间目标ISAR像获取示意图
图4 5类空间目标的三维模型及其ISAR像
为了确定选用何种数据增强方式,接下来首先分析影响空间目标ISAR像的各种因素。
2.3.1 图像投影平面(IPP)的影响
IPP决定了空间目标在ISAR图像中的呈现形式。IPP的确定取决于相干处理间隔(CPI)内雷达视线(RLOS)方向和空间目标相对于雷达的转动矢量方向。因此受目标运动状态影响,实际成像过程中存在多种IPP,导致空间目标ISAR像的空间分布以及空间指向出现可变性。图5展示了2种不同IPP及其对应的ISAR像。
图5 2种不同IPP及其对应的ISAR像
2.3.2 方位向分辨率的影响
Δ=2
Δ=2
(2)
图6 具有不同方位分辨率Δy的2张ISAR像
2.3.3 采样率的影响
线性调频信号是雷达系统中经常使用的信号。当雷达系统对接收到来自目标的线性调频信号进行ISAR成像处理时,首先需要利用A/D转换器对信号进行采样,然后再对信号进行匹配滤波,平动补偿以及方位向上的快速傅里叶变换。其中,A/D采样率是影响ISAR像的重要因素,因为决定了距离像在匹配滤波后的网格间距2,从而导致ISAR像在距离向上的空间分布具有可变性。图7展示了2种不同采样率对应的ISAR像。
2.3.4 其他因素的影响
由于目标的RCS对方位角的依赖性较强,使得自遮挡、非线性散射机制以及调制引起的载频变化等因素将进一步增强ISAR像的可变性。此外,不完全地平移运动补偿(TMC)引起的ISAR像散焦与模糊也会影响ISAR像的空间分布。
通过上述分析,最终对ISAR像采用的数据增强方式主要包括:角度旋转、方位向与距离向上的尺度变换以及斑点噪声注入。具体为:① 旋转,从-90°开始,每次旋转20°,旋转区间为[-90°,90°];② 方位向尺度变换,按一定的比例因子对空间目标沿方位向进行缩放,比例因子的取值依次为0.3,0.7,1.1,…,3.9;③ 距离向尺度变换,按一定的比例因子对空间目标沿距离向进行缩放,比例因子的取值依次为0.3,0.7,1.1,…,3.9;④ 噪声注入,分别给方位向尺度变换与距离向尺度变化后的图像注入斑点噪声,噪声服从均值为0方差为0.1的高斯分布。数据增强的结果如图8所示。
图7 2种不同采样率对应的ISAR像
图8 ISAR像数据增强结果
在进行数据增强操作后,每个原始训练图像会产生总共1+5×10 = 51张新图像。在本文任务中,测试集占总数据量的30%,剩余数据中训练集占70%,验证集占30%。由于每类空间目标有265张ISAR像,因此随机选择130张用于训练,56张用于验证、79张用于测试。那么在数据增强之后,每种空间目标的训练数据集中总共有6 630张ISAR图像。因此,由5类空间目标所组成的新训练集中,共有5×130×51 = 33 150张ISAR像。
空间目标ISAR像的识别属于多分类问题,故采用训练准确率(training accuracy)以及交叉熵损失(training loss)来评估AlexNet迁移学习模型的训练效果。下面分别给出其定义:
(3)
为了减少训练过程中的交叉熵损失,提高训练准确度,有必要为AlexNet迁移学习模型选择合适的优化器(optimizer)。鉴于Adam优化器集成了AdaGard与RMSProp的主要优点,不仅如RMSProp算法那样基于一阶矩均值计算权值的适应性学习率,还充分利用了梯度的二阶矩均值,使模型训练具有更快的收敛速度。因此,论文采用Adam优化器进行AlexNet迁移学习模型的加速训练。
图9给出了4种迁移配置下的训练结果。
图9 4种迁移配置下AlexNet迁移学习模型的训练结果图
如图9所示,4种迁移配置下AlexNet迁移学习模型均达到了较好的训练效果,训练准确率和验证准确率随着训练时间的增加而不断提高,并最终收敛到一个较高水平。其中,第1种迁移配置下的最终训练准确率与验证准确率分别为98.50%、95.36%;第2种迁移配置下的最终训练准确率与验证准确率分别为99.50%、97.14%;第3种迁移配置下的最终训练准确率与验证准确率分别为98.50%、95.71%;第4种迁移配置下的最终训练准确率与验证准确率分别为99.50%、95.36%。相应地,训练数据和验证数据的交叉熵损失随着训练时间的增加而不断减小,最终趋近一个较小值。其中,第1种迁移配置下的最终交叉熵损失与验证交叉熵损失为0.256 7%、0.021 7%;第2种迁移配置下的最终交叉熵损失与验证交叉熵损失为0.012 0%、0.164 4%;第3种迁移配置下的最终交叉熵损失与验证交叉熵损失为0.024 5%、0.179 7%;第4种迁移配置下的最终交叉熵损失与验证交叉熵损失为0.021 8%、0.139 8%。
本节基于训练好的AlexNet迁移学习模型,对4种配置下的模型分类性能进行了对比分析。同时研究了数据增强对AlexNet迁移学习模型分类性能的影响。最后将模型的分类性能与其他迁移方式及传统方法进行了对比。
3.2.1 迁移配置对分类性能的影响
为了确定不同迁移配置下模型分类性能的差异,本节利用3.1节中训练得到的4种AlexNet迁移学习模型,对测试数据进行分类。图10给出了4种模型在对测试数据进行分类时得到的混淆矩阵,相应的分类准确率如表2所示。
图10 4种迁移配置下AlexNet迁移学习模型的测试结果
表2 4种迁移配置下AlexNet迁移学习模型的 测试准确率Table 2 Test accuracy of ATLM under four TL settings
图10(a)~图10(d)中,横坐标表示预测值,纵坐标表示真实值,斜对角线上的值表示正确分类结果。如图10与表2所示,4种配置下的AlexNet迁移学习模型均具有较高的分类性能,平均分类准确率达到了94.87%。为避免实验过程中训练数据与测试数据的随机选取给空间目标分类效果造成影响,接下来按原始比例重新随机划分数据集,并对4种迁移配置下的模型进行重新训练、测试。5次检验结果在表3中给出。
表3 4种配置下的AlexNet迁移学习模型在5次试验中的测试准确率(%)
表3中给出了4种迁移配置下AlexNet迁移学习模型在5次试验中的测试准确率,4种迁移配置下AlexNet迁移学习模型在5次试验中均表现出了较好的分类性能。迁移配置1到迁移配置4的平均测试准确率分别为93.32%、94.94%、93.98%、95.19%。4种迁移配置在5次试验中的平均测试准确率达到了94.36%,验证了本文方法的有效性。其中第4种配置下AlexNet迁移学习模型的平均分类准确率相对最高为95.19%,第1种迁移配置下AlexNet迁移学习模型的平均分类准确率相对最低为93.32%。最高平均分类准确率与最低平均分类准确率相差1.87%。说明在数据增强条件下,4种不同配置对AlexNet迁移学习模型的分类性能影响较小。
3.2.2 数据增强对分类性能的影响
为了确定数据增强对AlexNet迁移学习模型分类性能的影响,本文利用未增强数据对4种不同配置下的AlexNet迁移学习模型进行重新训练,5次测试结果如表4所示。其中,训练数据650张、验证数据280张、测试数据395张。结果如图11所示。
表4 数据未增强时4种配置下的AlexNet迁移学习模型在5次检验中的测试准确率(%)
图11 数据增强与数据未增强条件下AlexNet迁移学习模型的分类效果
表4中给出了数据未增强时4种配置下AlexNet迁移学习模型在5次试验中的测试准确率,未采用数据增强时,4种配置下模型的平均分类准确率相较表3有所降低。配置1到配置4的平均测试准确率分别为92.20%、91.44%、90.78%、89.82%。4种配置在5次试验中的平均测试准确率为91.06%。其中第1种配置下AlexNet迁移学习模型的平均分类准确率相对最高为92.20%;第2、3、4种配置下模型的平均分类准确率依次降低,分别为91.44%、90.78%及89.82%。说明数据未增强时,迁移模型权值调整越小、模型的分类性能越好。
由图11所示,数据增强有效提高了AlexNet迁移学习模型的分类性能。其中4种配置条件下对应的平均分类准确率分别提升了1.12%、3.50%、3.20%、5.37%。平均分类准确率的提升均值为3.30%。说明本文针对空间目标ISAR像的数据增强方式,可以提升AlexNet迁移学习模型的泛化性,在一定程度上避免模型出现过拟合现象。
3.2.3 与其他迁移方式及分类方法进行对比
如2.1节中所述,迁移方式还包括将AlexNet预训练模型作为特征提取器(后文统一称特征提取器AlexNet),直接提取空间目标的深层特征,然后利用所提特征训练一个分类器从而实现模型迁移。为对比2种迁移方式的分类性能,本节利用特征提取器AlexNet提取空间目标ISAR像的特征,并采用支持向量机(SVM)对所提特征进行分类。表5给出了此种迁移方式下的5次交叉检验分类准确率。
表5 特征提取方式下的5次交叉检验分类准确率(%)
如表5所示,特征提取方式下的平均分类准确率为85.11%。低于本文所采用权值微调迁移方式下的分类准确率(数据增强条件下4种迁移配置的平均分类准确率分别为93.32%、94.94%、93.98%、95.19%;数据不增强条件下4种迁移配置的平均分类准确率分别为92.20%、91.44%、90.78%、89.82%)。该结果说明权值微调的迁移方式更适合于空间目标ISAR像的分类。
为了进一步证明权值微调的迁移方式所得到的迁移模型具有更好的分类性能,将3.2.1节中训练得到的AlexNet迁移学习模型也作为特征提取器,提取空间目标ISAR像的特征,并利用SVM分类器对所提特征进行分类。表6给出了此方式下的5次交叉检验分类结果。
表6 AlexNet迁移学习模型作为特征提取器方式下的5次交叉检验分类准确率(%)
由表6可知,相比于特征提取器AlexNet所提特征,4种配置下AlexNet迁移学习模型所提特征具有更好的目标表现力。此方式下,迁移配置1到迁移配置4的平均分类准确率分别为94.18%、95.39%、94.33%、95.80%。相比于表5中的85.11%,平均分类准确率分别高出9.07%、10.28%、9.22%、10.69%。从而验证了权值微调的迁移方式所得到的迁移模型具有更好的分类性能。
与传统手动提取特征的目标分类方法相比,本文基于迁移学习的分类方法无需手动提取特征,节约了大量人力物力,且时效性强。为了进一步检验本文分类方法相比于传统分类方法的分类性能,本文将传统方法的分类结果与本文方法的分类结果进行了对比。传统方法主要包括FT-PM、Trace(Radon)、ITTI+SIFT和MLA等,选用配置4下的AlexNet迁移学习模型(TLM)。表7给出了传统方法与本文方法在进行5类空间目标ISAR像分类后的结果。图12给出了直方图。
由表7与图12可知,相比于传统方法,AlexNet迁移学习模型具有更好的分类性能,总的分类准确率比次优方法高出8.86%。同时,本文方法无需手动提取特征,可以对空间目标ISAR像进行自动识别,因而更适用于实际中的空间目标分类任务。
表7 本文方法与传统方法的分类结果(%)
图12 本文方法与传统方法分类结果直方图
本文提出了一种基于数据增强与迁移学习的空间目标ISAR像识别新方法。该方法通过数据增强操作使空间目标ISAR像的训练集涵盖更多的空间分布情况。并以预训练好的AlexNet深度网络模型为基础,采用权值微调策略实现模型迁移,从而解决了小样本集下利用ISAR像进行空间目标快速自主识别难的问题。仿真算例表明:
1) 该方法可以实现小样本数据条件下空间目标ISAR像的快速自主识别,具有较高的分类准确率。
2) 数据增强操作可以有效提高AlexNet迁移学习模型的分类性能,一定程度上避免拟合现象。
3) 采用权值微调迁移策略训练得到的模型对空间目标ISAR像的分类性能,要高于直接将预训练好的AlexNet深度网络模型作为特征提取器的分类方式。
4) 与传统手动特征提取方法相比,AlexNet迁移学习模型无需手动提取特征,且具有更好的分类性能。