尼格拉·吐尔逊 依力亚斯江·努尔麦麦提 王远弘
摘要:新疆土壤盐渍化分布广泛,选择我国南疆渭干河-库车河三角洲绿洲部分区域为研究区,利用全极化合成孔径雷达数据对土壤进行分类。在多次野外考察及试验的基础上,针对全极化合成孔径雷达影像提取地物物理性质的特征并准确分类的问题,提出一种综合H/A/α & Pauli极化特征分解和支持向量机(SVM)的分类策略,简称H/A/α & Pauli-SVM分类模型。该模型通过H/A/α、Pauli分解法分别提取全极化合成孔径雷达影像的7种参数作为最优极化特征,并将这些信息组合成1个特征向量,最后引入较高精度的SVM分类算法,选择训练样本和验证样本后对全极化合成孔径雷达影像进行监督分类和精度验证。结果显示,该方法相比于本研究采用的其他方法能够得到更理想的分类结果,分类后总体精度提高到了88.87%,κ系数提高到了0.86。
关键词:土壤;盐渍化;极化分解;SVM分类;H/A/α
中图分类号:S156.4+1;S127 文献标志码: A 文章编号:1002-1302(2019)22-0273-06
土壤盐渍化是易溶性盐分在土壤表层积累的现象或过程,是荒漠化和土地退化的主要类型之一[1],土壤盐渍化不仅造成资源的破坏、农业生产量的减少,而且还对生物圈和生态环境构成威胁,成为了世界范围内的环境问题[2]。据统计,全球约有8.31亿hm2土壤受到盐渍化的危害[3]。我国是盐渍化问题较严重的国家之一,盐渍土面积大、分布广[4]。其中,新疆是全国最大的盐渍土壤分布区[5],盐碱土种类多,被称为世界盐渍土的博物馆[6],干旱的气候条件造就了我国新疆为土壤盐渍化大区[7],为了加快对土壤盐渍化的动态监测及治理,了解盐渍地的性质、范围、地理分布、面积、动态变化和盐渍程度等方面的信息具有重要意义[8]。
当前,在区域范围内用遥感监测土壤盐渍化的应用已成为国内外学者研究的主要趋势[9],在遥感图像的各类应用中,光学影像的应用范围最广泛,各种影像解释技术在逐渐发展[10];然而其缺点也很明显:很难对不稳定天气条件下的图像进行解译,并且基本在白天成像,所以在时间上也有局限性[11]。近些年兴起的全极化合成孔径雷达(polarimetric synthetic aperture radar,POLSAR)是一种多通道、多参数,可以24 h成像于各种气象条件的雷达系统。与传统单极化合成孔径雷达图像相比,POLSAR数据能够获得目标的全极化散射信息[12],并且将不同地物的散射特征最大程度地以矢量的形式表现出来,从而揭示地物的散射差别[13],因此POLSAR影像应用程度和领域在不断扩大,相应的各种图像解译技术也在快速发展[14]。
极化目标分解于1970年首先由Huynen提出[15],krogager、Cloude、Pottier等做了大量的基础性研究[16],使得目标分解迈向了实用,各种适用于POLSAR影像分类的算法在极化特征分解研究的基础上先后被提出,在众多算法中,特征提取算法得到的极化特征反映地物性质的能力以及利用极化特征作为分类参考时精度是否较高等是POLSAR影像分类领域待解决的问题。为了充分发掘POLSAR数据的极化特征并利用它提取盐渍化信息,本研究对研究区POLSAR数据进行3种极化分解,通过目视解译和野外考察并同时结合高光谱影像选择训练样本和验证样本,利用最大似然分类和支持向量机等监督分类方法提取研究区盐渍地信息,进行分类后处理得到分类总体精度和κ系数,并对分类结果进行分析。
1 研究区概况及数据
1.1 研究区概况
本研究区位于渭-库绿洲,渭-库绿洲是我国南疆塔里木盆地北缘、中天山南麓完整且相对闭合的山前冲洪积平原绿洲,地理坐标为83°06′30′~′83°31′40′′E、41°24′45′′~41°44′50′′N[17](图1),属于大陆性暖温带干旱气候,具有降水量少、蒸发量大、气候干燥等特点[18]。该研究区地下水位高,透水性差,随着土壤表层含盐量不断增加,导致地表反射率的增强和植被覆盖度的降低,形成重度、中轻度盐渍地[19]。
RADARSAT-2是1颗搭载C波段传感器的商业卫星,于2007年年末在哈萨克斯坦发射成功。表1为RADARSAT-2数据的主要参数, 该数据具有左右视功能和多种极化方式,用户使用更便捷[20]。本研究选用2014年7月4日Radarsat-2四极化(HH、HV、VV、VH)雷达数据作为研究数据,并以2014年9月14日Landsat8 OLI高光谱影像数据作为参考(图1),使得盐渍地目视解译、训练样本及验证样本的选择更有效。研究区图像通过遥感数据处理平台ENVI的SARscape模块进行预处理。
1.2 野外数据及分类体系
2014年7—8月对研究区进行野外实地考察和采样,根据野外调查结果及研究区的具体实地情况,将研究区地面覆盖类型大体分为5个大类:植被、水体、重度盐渍地、中轻度鹽渍地和裸露地,获取了111个训练样本数据和148个验证样本数据,每个地物类型至少有10个样地,每个样地至少有 1 175 像素,具体分类类别及地物特征描述如表2所示。
2 研究方法
本研究对全极化合成孔径雷达数据采用3种极化分解方法(Pauli分解、H/A/α分解、H/A/α & Pauli分解),结合最大似然、最小距离和SVM分类模型,进而实现该区域盐渍地信息的有效提取,本研究详细的技术路线图见图2。
2.1 特征值分解理论
2.1.1 Pauli分解 散射矩阵的相干分解方法是目标分解中一类重要的分解算法。该类方法的主要内容是把散射矩阵用基本散射矩阵之积或者之和的形式表示出来,这些基本散射矩阵能够和某种特定的散射机制相互联系[21]。Pauli基于极化散射矩阵S分解,不同的极化基矩阵被定义而进行极化特征的提取,每一个极化基矩阵代表的地物类型不相同[22]。基本的散射矩阵S可以用Pauli基表示为:
K表示Pauli分解得到的极化特征向量,Pauli基分解的第1项的物理意义为单次散射,第2项表示雷达与目标中心视线与二面角法平面重合的二面角散射,第3项与多次散射有关。
2.1.2 H/A/α分解 H/A/α分解是Ferro-Famil等提出和改进的基于特征矢量和特征值分解方法[23]。
2.2 分类方法
对POLSAR数据分类时获得较高的分类精度非常重要,传统遥感图像分类方法计算速度慢、分类精度低,然而支持向量机(support vector machine,SVM)是一种高效率机器学习算法,反映了结构风险最小化的原则,在遥感图像分类领域应用很广[25],泛化能力好于传统的分类方法[26],尤其是在小样本的时候,分类精度较高且稳定[27]。所以本研究采用SVM分类方法,利用H/A/α、Pauli、H/A/α & Pauli 3种分解方法所得到的目标散射特征进行土地类型分类和盐渍地信息的提取。分类过程包括:选择分类特征参数组合、目视判读选取有效的训练样本、进行分类处理、选择验证样本、进行分类后处理得到分类结果和相应的混淆矩阵。
最小距离法是根据训练样本数据计算出每一类的均值向量和标准差向量,以均值向量作为特征空间中心位置,再根据图像中每个像元到不同类型分类地物中心的距离[28],各像元到某一类别的中心距离最小,则该像元就与之归为一类。最大似然分类法在分类方法中得到的总体分类精度最高,制图精度和用户精度都能达到较高标准,漏分误差和错分误差较低,而且计算时间较短[29],因此也作为一个参照。本研究为了更好地进行精度的比对,将最小距离分类法与最大似然分类法作为参照。
3 结果与分析
3.1 全极化Radarsat-2数据极化分解
本研究对研究区Radarsat-2影像采用遥感数据处理平台ENVI软件SARscape开发模块进行多种目标极化分解和特征参数提取等处理,多种极化分解所产生的极化参数按照SARscape模块里面的表达方式描述。
H/A/α分解后,分别得到了散射角α、极化熵H、反熵A以及颜色波段红、绿、蓝等6个参数(图3、图4),可以看出反熵A和散射角α的图像噪声较大,地物物理特征不明显,不能够反映地物的信息。极化熵H,彩色波段红、绿、蓝图像的信息量则更丰富及清晰。Pauli分解后得到K1、K2、K3 3个参数(图5),相对于H/A/α分解,Pauli分解后3个参数能清晰地反映更多的地物极化信息,同时提高了图像对比度和对地物的识别能力。在以上9个参数中选择最优特征参数(H/A/α-H、H/A/α-红、H/A/α-绿、H/A/α-蓝、Pauli-K1、Pauli-K2、Pauli-K3)可以保留POLSAR图像的最大信息量而抑制POLSAR数据难以去除的斑点噪声,并在提高图像分类精度的同时节省图像分类需要的时间,从而提高速度和分类效率。根据H/A/α、Pauli分解后的参数特征,本研究选用H/A/α、Pauli 2种目标分解方法噪声较小的最佳特征信息组合成H/A/α & Pauli目标分解方法,进而充分挖掘和提取POLSAR图像中包含的丰富信息,充分发挥POLSAR数据信息丰富的优点。由图6可以看出,H/A/α & Pauli分解的RGB合成彩色图像比H/A/α分解图像更清晰,能更好地反映地物的真实信息。
3.2 基于目标极化分解POLSAR图像分类
本研究将实地野外考察和高光谱影像数据作为参考信息进行目视解译,选取符合条件的训练样本及验证样本(表2)。训练样本选择完之后均用同样的验证样本进行分类后处理,以方便科学地对不同的分类方法结果进行对比分析。图7、图8、图9为对3种不同的分解方法分别进行SVM方法、最大似然、最小距离分类的图像。
从分类结果(图9-a)可知,总体上盐渍地主要分布在研究区的南部、东部和东南部地区。盐渍地在绿洲以内呈现条带状分布,而在绿洲以外呈现片状分布,且重度盐渍地与中轻度盐渍地分布区域有很多交集。3种分类方法里中轻度盐渍地混分和错分成植被的现象较严重,原因是中轻度盐渍地有盐生植被红柳、盐穗木、盐节木、芦苇等覆盖,当植被覆盖度较大时容易被混分和错分为植被。由分类结果图7、图8、图9比较可以看出,采用H/A/α & Pauli分解分类后的3种分类结果都比较理想,H/A/α分解后3种不同方法分类结果较差,尤其是H/A/α-最小距离方法的重度和中轻度盐渍地误分现象比较严重,且“椒盐”现象比较明显,相对而言Pauli分解后采用的3种分类方法能使这种现象明显减少。本研究根据野外考察得到的验证样本数据,定量分析H/A/α & Pauli-SVM分类模式的效果,统计了12种分类模型分类总精度以及κ系数2个反映分类器效果的指标,这2个指标的数值越大,代表分类性能越好,具体精度评价见表3。
对未极化分解图像(四极化分量组合)分类时,采用最小距离与最大似然法得到的总体精度相差较小,分别为 75.78%、75.55%,κ系数分别为0.70、0.69,采用SVM分类时总体精度为76.36%,κ系数为0.70。H/A/α分解方法后进行的3种不同分类中,H/A/α-SVM的精度最高,相比于H/A/α-最小距离与H/A/α-最大似然,总体精度分别从76.39%、 77.49%提高到 81.04% ,κ系数分别由 0.69、0.71提高到0.75。Pauli分解分类方法中,Pauli-SVM的总体精度相比于Pauli-最小距离与Pauli-最大似然分別提高4.92%、2.72%,κ系数分别提高0.08、0.04。在H/A/α & Pauli分解分类方法中,H/A/α & Pauli-SVM分解的总体精度与κ系数最高,总体精度分别比H/A/α & Pauli最小距离与H/A/α & Pauli-最大似然高6.86%、1.21%,κ系数分别提高 0.08、0.01。在对3种不同分解方法进行最小距离分类时,H/A/α & Pauli-最小距离方法的总体精度比H/A/α- 最小距离、Pauli分解-最小距离高5.62%、1.79%,κ系数分别提高0.09、0.06。对于SVM分类法而言,H/A/α & Pauli-SVM的总体精度最高,相比H/A/α-SVM、Pauli-SVM方法总体精度从81.04%、85.14%提高到了88.87%,κ系数也从0.75、0.80提高到0.86。对于最大似然分类方法而言,H/A/α & Pauli-最大似然的总体精度最高,相比H/A/α-最大似然、Pauli-最大似然方法总体精度从77.49%、82.42%提高到了87.66%。
总而言之,就分解方法而言,H/A/α、Pauli分解法相比于未进行分解的四极化图像能够较好地提高精度,本研究提出的H/A/α & Pauli方法则更具有优势,是一种很好的分类特征的选择。在3种分类方法中,SVM分类法具有分类优势能够获得更高的精度,基于最大似然准则的分类方法与最小距离方法的推广性和泛化能力不足。通过试验结果对比和分析可知,极化分解后的分类精度比未分解(4个极化分量组合)时要高,组合不同目标分解后的最优特征分量能够显著地提高分类后精度。本研究提出的H/A/α & Pauli-SVM方法不仅降低了极化信息的冗余度,综合概括了POLSAR数据丰富的极化信息,并且能最大程度地减少POLSAR数据本身携带的斑点噪声。通过构建H/A/α & Pauli-SVM分类模型,斑点噪声较大的极化特征分量(如H/A/α-散射角、H/A/α-α)被剔除,较有效地克服了SAR图像的斑点噪声问题。
4 结论
本研究针对H/A/α与Pauli 2类分解方法各自的特点和近年来基于模型的分解研究进展,采用一种H/A/α & Pauli-SVM分类方法。该方法利用H/A/α分解获得噪声较小的散射熵H和彩色波段红、绿、蓝,同时加入Pauli分解得到的奇次散射、偶次散射、体散射等极化特征,最后利用SVM方法进行分类。结果表明,该方法最大程度地提取了目标地物极化信息,增加了图像的信息量和可判读程度。目标极化分解参数作为特征信息分类处理比起未进行分解的图像来说可以得到较好的效果。在相同训练样本的情况下,所得分类总体精度最高,相比H/A/α-SVM、Pauli-SVM方法总体精度从81.04%、85.14%提高到了88.87%,κ系数也从0.75、0.80提高到了0.86。但中轻度盐渍地混分和错分成植被的现象较严重,原因是中轻度盐渍地有盐生植被红柳、盐穗木、盐节木、芦苇等覆盖,容易被混分和错分为植被。本研究采用的H/A/α & Pauli-SVM分类方法利用全极化POLSAR数据,通过目标极化分解方法并用最优参数组合成为分类特征信息能够得到较理想的分类结果,证明该方法对提取盐渍化信息以及对土壤盐渍化监测具有优势和潜力。
参考文献:
[1]李红军. 公路建设在盐渍土路段路基填料改性技术研讨[J]. 中国西部科技,2007(11):22-23,25.
[2]翁永玲,戚浩平,方洪宾,等. 基于PLSR方法的青海茶卡-共和盆地土壤盐分高光谱遥感反演[J]. 土壤学报,2010,47(6):1255-1263.
[3]于沛玉. 盐胁迫下K+对珠美海棠幼苗生理特性的影响[D]. 天津:天津农学院,2014.
[4]李建国,濮励杰,朱 明,等. 土壤盐渍化研究现状及未来研究热点[J]. 地理学报,2012,67(9):1233-1245.
[5]樊自立,乔 木,徐海量,等. 合理开发利用地下水是新疆盐渍化耕地改良的重要途径[J]. 干旱区研究,2011,28(5):737-743.
[6]张琦珠. 新疆盐碱土的改良利用——第一讲:盐碱土的概念及新疆盐碱土的形成[J]. 新疆农垦科技,1983(1):58-60
[7]田长彦,周宏飞,刘国庆. 21世纪新疆土壤盐渍化调控与农业持续发展研究建议[J]. 干旱区地理,2000,23(2):177-181.
[8]关元秀,刘高焕,刘庆生,等. 黄河三角洲盐碱地遥感调查研究[J]. 遥感学报,2001,5(1):46-52.
[9]关元秀,刘高焕. 区域土壤盐渍化遥感监测研究综述[J]. 遥感技术与应用,2001,16(1):40-44.
[10]李 军. 光学遥感图像在舰船目标检测中的应用分析[J]. 舰船电子工程,2016,36(10):30-34,103.
[11]赵孟银. 遥感影像去云方法研究[D]. 天津:天津科技大学,2016.
[12]王云艳. 基于多层网络模型的全极化SAR图像分类[D]. 武汉:武汉大学,2015.
[13]曲永超. 基于极化目标分解的全极化Radarsat-2图像分类[D]. 南京:南京大学,2016.
[14]肖 艳. 面向对象的PolSAR影像分类研究[D]. 长春:吉林大学,2017.
[15]王春乐,禹卫东. Huynen类型目标分解方法的比较与分析[J]. 中国科学院大学学报,2011,28(3):402-409.
[16]丁维雷. 基于全极化雷达的目标识别方法研究[D]. 哈尔滨:哈尔滨工程大学,2013.
[17]王 娟,張 飞,于海洋,等. 基于LUCC的渭干河-库车河三角洲绿洲水文及生态特征[J]. 水土保持研究,2016,23(2):236-242.
[18]李 飞. 中国西北干旱区潜在植被的演替[D]. 兰州:西北师范大学,2009.
[19]白燕英. 基于多时相遥感影像的盐渍化农田表层土壤水分反演研究[D]. 呼和浩特:内蒙古农业大学,2014.
[20]陈思伟,代大海,李 盾,等. Radarsat-2的系统组成及技术革新分析[J]. 航天电子对抗,2008,24(1):33-36.
[21]黄晓东. 极化目标模型分解的不一致性研究[D]. 武汉:中国地质大学,2013.
[22]何 密,李永祯,王雪松,等. 基于Pauli基分解的极化校准算法[J]. 宇航学报,2011,32(12):2589-2595.
[23]Ferro-Famil L,Pottier E,Lee J S. Unsupervised classification of multifrequency and fully polarimetric SAR images based on the H/A/Alpha-wishart classifier[J]. IEEE Transactions on Geoscience and Remote Sensing,2017,39(11):2332-2342.
[24]朱海洲,贾银山. 基于支持向量机的遥感图像分类研究[J]. 科学技术与工程,2010,10(15):3659-3663.
[25]吴建宁,王 珏. 基于支持向量机的步态分类方法[J]. 测试技术学报,2006,20(4):299-303.
[26]赵传峰,姜汉桥,郭新华. 支持向量机在小样本预测中的应用[J]. 油气田地面工程,2009,28(2):21-23.
[27]陈超祥,陈华锋,叶时平. 高分辨率影像中基于纹理的建筑区信息提取[J]. 计算机工程,2011,37(21):126-130.
[28]金 杰,朱海岩,李子潇,等. ENVI遥感图像处理中几种监督分类方法的比较[J]. 水利科技与经济,2014,20(1):146-148,160.