包德高,王启龙,黄红日
(辽宁省水利水电勘测设计研究院有限责任公司,辽宁 沈阳 110000)
辽河口湿地站是国家陆地生态系统定位观测研究站网的重要站点,也是辽宁省唯一的湿地生态站,对国际重要湿地辽河口湿地保护与生态修复具有重要的理论与数据支撑作用,其中最主要的一项研究就是湿地的分类研究,湿地分类是湿地研究的基础,是湿地遥感解译工作的关键技术。
辽河口湿地位于渤海辽东湾的顶部、辽河三角洲中心区域,总面积约为50000hm2,生态类型丰富,文章将辽河口湿地分为浅海水域、草本沼泽、淤泥质沙滩、库塘、河流、稻田和灌丛沼泽等7类。
文章在提取多种极化特征的基础上,研究面向辽河口湿地地物类型的最佳极化特征矢量组合,并在此基础上实现该区域的极化SAR影像湿地分类,技术路线如图1所示。
图1 技术路线
文章以RADARSAT-2全极化单视复影像为原始数据,成像时间为2018年7月28日,光束模式为FQ21,波束模式为右视,影像大小为5738像素×3788像素,方位×距离分辨率为5.2m×7.6m。
部分特征对湿地地物的区分程度相似,且不同特征可以表征相同的散射特性,为了研究单一特征对各湿地地物的区分度,文章利用三维散点图、H/A/α平面散点图进行极化特性分析。
为了分析各类湿地地物对各极化分解下的散射机理的散射特性的不同,文章采用三维空间进行分析表达。图2以Pauli分解[1]为例。
T11分量中各地物分布分散,草本沼泽在该极化特征中系数最大,具有明显的集群分布;稻田、河流离群值较多,稻田的功率均值分布要比河流的大,但都没有呈现明显的集群分布;其余地物均呈现出明显的集群分布,其中灌丛沼泽与淤泥质沙滩、库塘与河流、河流与浅海水域系数较为接近,集群存在部分的交叉现象,浅海水域的系数最小,存在明显的集群现象,由此可以看出,草本沼泽和浅海水域与其他地物的集群重叠度较低,较易区分。
T22分量中草本沼泽、稻田、河流、库塘的系数与集群分布情况与T11分量相接近。灌丛沼泽的系数较大,集群也较为明显,但集群与稻田等地物有部分重叠;淤泥质沙滩、浅海水域的系数较小,呈现出明显的集群现象且相互分开,但因浅海水域的系数数量级处于10-3级,所以不予区分,可以看出,草本沼泽和淤泥质沙滩与其他地物的集群重叠度较低,较易区分。
T33分量中灌丛沼泽的系数最大,但离群值较多,且与草本沼泽的集群部分重叠;稻田与河流的系数分布分散,没有集群;淤泥质沙滩、库塘与浅海水域的系数较小,具有明显的集群现象且相互分开,但因浅海水域的系数数量级处于10-4级,所以不予区分,由此可以看出,淤泥质沙滩和库塘与其他地物的集群重叠度较低,较易区分。
利用相同的方式依次分析Pauli、Freeman、MCSM、NNED和Yamaguchi分解中各特征关于7类地物的三维散点图。不同的地物在不同的特征中的均值不同,集群分布也不同。一般情况下,草本沼泽和灌丛沼泽在各特征中均值均较大,而库塘、河流和浅海水域的均值均较小,因此浅海水域的系数最小。
H/A/α分解是一种非相干分解方法,包含的信息十分丰富,应用非常广泛。图2为各类样本在H/α、H/A和A/α二维平面的空间分布图。从图2中可以看出,草本沼泽、稻田、灌丛沼泽与浅海水域、淤泥质沙滩、库塘、河流处于不同的分布范围,呈现出明显的区别;在H/α平面、A/α平面和H/A平面中,草本沼泽和灌丛沼泽与其他地物可区分度较高,不存在明显或大面积的遮挡,其余地物相互间的遮挡现象严重,有的甚至是完全被掩盖。因此,只有草本沼泽和灌丛沼泽可以在H/α平面、A/α平面和H/A平面中区分开来。
图2 Pauli分解三维散点图
文章提及的极化分解方法中存在不同特征表征相同的意义,如OddFr、OddMCSM、OddNNED、OddYa和T11均表示表面散射。并且通过极化特性分析可知,不同特征对湿地地物的区分程度相近,如草本沼泽在DblMCSM和T22均区分度较高,且不同特征可以表征相同的散射特性,如DblMCSM和T22,从而造成信息冗余。因此,为了提高湿地分类精度,需要对各特征进行处理,文章通过相关性分析和PCA降维等方法,得到最佳特征矢量组合,使其包含最能表征湿地地物散射特性的特征,从而更易区分各湿地地物。
文章通过相关性分析,对高相关性特征进行PCA降维,得到第一主成分和第二主成分,再结合低相关性特征,确定最佳特征矢量组合,使其包含最能表征湿地地物散射特性的特征,从而更易区分各湿地地物。
将OddFr、OddNNED、OddMCSM、OddYa、DblFr、DblNNED、DblYa、VolFr、VolNNED、VolYa和T33经PCA降维[2]后的第一主成分和第二主成分与DblMCSM、VolMCSM、T11、T22、H、A和α 七个低相关性的特征作为最佳特征矢量组合,具体见表1。
表1 最佳特征矢量组合表
利用最佳特征矢量组合进行分类,不但能够减少分类过程中的数据冗余,降低计算量,提高分类效率,而且可以准确表征地物,提高分类精度。
文章通过湿地分类体系、以往资料与实地调查相结合,以此为标准对文章所得的分类结果进行评价,并采用基于最佳特征矢量组合的Wishart距离的最大似然分类法、使用全部特征的基于RBF的SVM分类法以及基于联合熵[3]的SVM分类算法作为对照组,用分类方法、使用特征数量以及特征选择方法的不同多方面验证分类结果的有效性,其分类结果见表2。
表2 精度对比表
从总精度和Kappa系数上看,基于最佳特征矢量组合的SVM算法总精度最高,其次是使用全部特征的基于RBF的SVM算法,基于联合熵的SVM算法次之,基于最佳特征矢量组合的Wishart算法最低。基于最佳特征矢量组合的SVM算法的总精度和Kappa系数分别为93.32%和91.56%。
图3 H/A/α分解散点图
4种分类算法对于研究区内湿地地物的分类结果不同。从用户精度上看,4种算法对浅海水域和草本沼泽的精度较高,均达到95%以上;除了基于最佳特征矢量组合的SVM算法,其余3种算法对淤泥质沙滩的精度均较低;基于最佳特征矢量组合的Wishart算法对于库塘和河流的精度远低于其余3种算法;4种算法对稻田精度较低;基于联合熵的SVM算法对灌丛沼泽的精度最低,基于最佳特征矢量组合的SVM算法的精度最高。
经过分析可知,相比较于只考虑特征数量的使用全部特征的SVM算法和基于联合熵的SVM算法的分类效果看,基于最佳特征矢量组合的SVM分类对除稻田的其余地物的分类精度分别提升1%以上,有的甚至提升5%以上,如在淤泥质沙滩的分类精度上,基于最佳特征矢量组合的SVM算法比使用全部特征的基于RBF的SVM算法提升8.55%。综上所述,最佳特征矢量组合对各地物分类精度起到了提高作用,而且在使用同一种分类器的情况下,使用全部特征的分类精度是下降的。
通过相关性分析和PCA方法,确定最佳特征矢量组合为MCSM分解的二面角散射、体散射;H/A/α分解的H、A、α;Pauli分解的T11、T22和经PCA降维之后得到前两个主成分。
最佳特征矢量组合比使用全部特征更能提高分类精度,且不会产生数据冗余。
从散射机理分析,浅海水域的主要散射机制是表面散射;草本沼泽的主要散射机制是表面散射和二面角散射;淤泥质沙滩的主要散射机制是二面角散射;库塘的主要散射机制是表面散射和二面角散射;河流的主要散射机制是表面散射和二面角散射;稻田和灌丛沼泽的主要散射机制是体散射。