张伟涛,王 敏,郭 交
(1.西安电子科技大学电子工程学院,陕西西安 710071;2.西北农林科技大学机械与电子工程学院,陕西杨凌 712100)
农作物分类在农业遥感监测中起着重要的作用,是进一步监测农作物生长及产量的前提。因此,农作物分类对于指导农业生产、合理分配农业资源、保障国家粮食安全具有重要意义。
随着遥感技术及其理论的不断进步和发展,已广泛应用于农作物普查、生长监测、产量预测和灾害评估等农业领域。偏振合成孔径雷达(Polarimatric Synthetic Aperture Radar,PolSAR)作为微波遥感系统中一种主动遥感技术,具有其他遥感技术无法比拟的优势,其工作条件不受天气和气候限制。近年来,农作物分类研究大多采用单时相PolSAR 数据,然而,由于不同农作物间相同的长势状况,单一时相的PolSAR 图像很难识别出不同的农作物类别,尤其是在播种时期。因此,有必要采集多时相PolSAR 数据用于农作物分类,从而提高分类精度。
由于对多时相全极化PolSAR 数据进行极化特征分解后的数据直接分类会出现所谓的“维数灾难”问题,因此,对多时相数据极化分解后的特征进行降维成为一项重要的工作。主成分分析法(Principle Component Analysis,PCA)和局部线性嵌入法(Locally Linear Embedded,LLE)是解决“维数灾难”问题常用的特征压缩方法。PCA 是一个线性的数据处理方法,但实际工程中大多数问题都是非线性的;LLE 可以自动从高维数据中提取非线性的低维特征,但对异常值非常敏感。近年来,随着深度学习的发展,出现了一些成熟的神经网络结构(如自编码器、稀疏自编码器),在特征压缩和图像分类方面都具有良好的性能。然而,稀疏自编码器的稀疏性在提取有效分类特征时并没有得到充分的利用,并且常见的传统卷积神经网络(Convolutional Neural Networks,CNN)和支持向量机(Supper Vector Machine,SVM)分类器在分类时也不能获取到压缩特征的多尺度信息。基于上述缺点,农作物分类性能不能达到实际应用水平。
为了利用多时相PolSAR 数据对农作物进行分类并且解决“维数灾难”的问题,首先采用了一种非负性约束稀疏自编码器(Sparse Auto-Encoder with Non-negativity Constraints,NC-SAE)网络进行特征降维,提取有效的极化特征信息。然后,构建了一个多尺度特征分类网络(Multi-scale Feature Classification Network,MSFCN)实现农作物的分类识别,大幅提高了农作物的分类精度。
全极化合成孔径雷达用于接收目标的后向散射信号,以HH、HV、VH 和VV 这4 种组合方式测量幅值和相位,其中H 为水平模式,V 为垂直模式。采集的每个像素的散射信息用一个2×2 的复矩阵表示,这些复数关系到入射电场和散射电场:
式中:为垂直发射和水平接收的极化散射因子,同理可定义式中其他参数。
通过对散射矩阵矢量化可以得到目标特征向量,由于PolSAR 数据是复对称数据,符合后向散射互易定理,可以将近似等于,因此,偏振散射矩阵可以重写为Lexicographic 散射向量:
式中:上标*为复数的共轭。
NC-SAE 是在自编码器的基础上发展而来,是数据表征的无监督学习算法,其目的是使输出值尽可能接近输入值。单层自编码器网络的基本结构由3 部分组成:编码器、激活层、解码器。自编码器网络采用最速下降法进行网络训练,最终实现目标函数的最小化,其目标函数为输入与输出之间的重构误差,表示如下:
式中:为训练样本数;()为第个样本的输入数据;()为第个样本的重构输出。
NC-SAE 是在自编码器的目标函数上增加2 个约束项进行实现。第一个约束项为稀疏约束:
该约束使网络训练过程具有较快的收敛速度。稀疏约束项的目的是通过限制隐藏层的激活神经元个数来增加网络的稀疏性,通常使用KL(Kullback-Leibler)散度函数表示。
可以看出:当(稀疏参数)和ˉ(平均激活值)趋于相等时,趋于0;当两者相差越大时,较大。第2 个约束项为非负性约束,其有利于避免网络训练过程中的过拟合现象,计算式如下:
式中:为权值;为层数。
综上所述,NC-SAE 的目标函数表示如下:
式中:为非负性约束项的系数;为稀疏约束项的系数。
采用最速下降法更新式(8)目标函数中的权重和偏置,计算式如下:
式中:为迭代次数;为学习率。
采用误差反向传播算法计算式(9)中的偏导数。在解码过程时,目标函数对权值的偏导数为
式中:(·)为(·)的偏导数。
(·)是一个sigmoid 函 数,一般选 取logsig 函数,如下所示:
此时,式(10)可表示为
然后,对编码过程的偏导数求解如下:
编码过程和解码过程目标函数对偏置的导数计算如下:
提出的MSFCN 的网络结构如图1 所示,其主要包括3 个部分:多尺度特征提取、特征融合、分类。首先,利用卷积层中多个不同大小的卷积核提取不同尺度的特征信息;然后,将获取的不同尺度的特征信息使用concat 层进行融合作为分类层的输入数据;最后,采用softmax 层进行分类。因此,MSFCN不仅利用卷积层中的不同卷积核提取多尺度特征信息,而且可以捕捉到特征图之间的细微差别。
图1 多尺度特征分类网络结构Fig.1 Architecture of MSFCN
使用的实验数据由欧洲航天局提供,主要用于评估所提方法的分类性能。实验区域位于加拿大萨斯克切温省东南部的Indian Head 小镇,是一个约为14 km×19 km 的矩形区域。该区域共包含14 种不同类型的农作物和一个“非农作物”类别,“非农作物”类别可能是城镇、道路或天然植被区等非农作物地物。实验区域各农作物数据的具体信息见表1。
表1 研究区农作物类型及其信息统计Tab.1 Information statistics of crops in the study area
实验所用的PolSAR 数据是利用欧空局发射的Radarsar-2 卫星采集的真实数据,通过模拟还未发射的Sentinel-1 系统参数而生成的仿真数据。数据采集时间分别是2009 年4 月21 日、5 月15 日、6 月8日、7 月2 日、7 月26 日、8 月19 日和9 月12 日,这7 个时间段的PolSAR 数据几乎涵盖了实验区域所有农作物的从播种到收割的整个生长周期。对单个时相的PolSAR 数据使用极化特征分解方法进行特征分解,可以获得36 维特征。因此,7 个时相的Pol-SAR 数据一共可以获得252 维特征信息。
为了对分类结果进行精确的评估与分析,使用整体分类精度(Overall Accuracy,OA)和Kappa 系数进行结果对比。其中,整体分类精度OA 表示正确分类的样本数与样本总数之比,具体计算式如下:
式中:为分类正确的样本数;为所有样本的总数。
Kappa 系数:常见计算分类精度的算法,来源于一致性检验,用于评价分类算法的分类性能,它是衡量预测输出与地面真实值一致性的标准,有效避免了因某一类目标地物分类精度高而导致整体分类精度高,进而误以为模型分类效果好的情况。整体分类精度仅涉及正确预测的样本数,与之不同的是,Kappa 系数考虑了位于混淆矩阵非对角线上的各种缺失和误分类样本,其计算式如下:
式中:为整体分类精度;为待分类目标的样本总数;为待分类目标的类别数;为分类算法的混淆矩阵;Z为混淆矩阵第行所有列的值之和;为混淆矩阵第列所有行的值之和。
本文对提出的特征降维方法、分类网络与传统的降维方法和分类方法进行了比较分析。首先利用所提的NC-SAE 以及传统的LLE、PCA、S-SAE等特征降维方法,对极化分解后的252 维特征进行降维,从而获得9 维特征;然后将降维后的9 维特征分别输入SVM、CNN 和MSFCN 分类器进行分类,每个分类器的训练样本选择总样本的1%。
不同分类器的分类结果和误差如图2 所示。对于CNN 和MSFCN 分类网络,其输入样本尺寸也会影响农作物的分类性能,因此,对不同输入样本大小下的分类结果也进行了比较,整个实验结果见表2。
结合图2 和表2 中的分类结果,得出如下结论:
表2 不同方法的分类精度统计Tab.2 Classification accuracy of different methods
图2 不同分类器的分类结果和误差Fig.2 Classification results by different classifiers
1)与传统的LLE、PCA 降维方法相比,使用NC-SAE 和S-SAE 降维方法获取的特征信息进行分类的农作物总体分类精度提高了6% 以上,虽然NC-SAE 和S-SAE 的分类精度几乎相同,但是这2个自编码器的网络结构不同。提出的NC-SAE 是一个单层网络,而S-SAE 是将3个自编码器依次连接而成的三层网络,因此,NC-SAE 的计算复杂度更低。
2)比较不同分类器的分类性能,由图2 可以清楚地看出MSFCN 的分类效果比其他分类网络更好。同时,由表2 可以得出,MSFCN 网络的整体分类精度OA 比SVM 和CNN 分别高21%和12%。
3)CNN 和MSFCN 网络的输入大小对分类性能也有一定的影响,增大输入大小可以显著提高农作物的分类精度。通过实验证明,建议在实际应用中选择中等大小尺寸35×35。
4)分析农作物分类的整个实验过程,通过对比表2 中的结果可以得出,所提出的NC-SAE 与MSFCN 结合的方法可以获得最好的分类性能。
本文构建了一种新的MSFCN 用于完成对多时相PolSAR 数据的分类。为了解决维数灾难问题,提出了一种改进的自编码器NC-SAE,用于对多时相PolSAR 数据的极化散射特征降维。与此同时,利用欧空局提供的Sentinel-1 系统模拟多时相PolSAR 数据和实验区域的地面真实值对所提方法进行分类性能评估。与传统的分类方法SVM 和CNN 相比,最终分类结果表明:对于多时相PolSAR 数据的农作物分类,所提方法MSFCN 网络的分类性能最优。
此外,对于提出的多时相PolSAR 数据农作物分类方法,还可以进行进一步的研究。首先,对于NC-SAE 的超参数,直接使用S-SAE 方法的经验值,但不一定是NC-SAE 方法在特征降维时的最优值,因此,NC-SAE 最优值的选取值得后续继续研究;其次,使用了2 个阶段(特征压缩和作物分类)实现对多时相农作物数据的分类,对此也可以进行优化,研究出更简便的方法,即使用一个独立网络实现多时相PolSAR 数据的农作物分类,将进一步简化分类过程,减少计算量。