应用Landsat-8卫星遥感图像的青海地区土壤分类研究

2020-03-21 06:01刘志勇黄宇飞刘佳欣金丽花徐嘉
航天器工程 2020年1期
关键词:高程灰度分类

刘志勇 黄宇飞 刘佳欣 金丽花 徐嘉

(1 北京空间飞行器总体设计部,北京 100094)(2 哈尔滨工程大学计算机科学与技术学院,哈尔滨 150001)

随着土地规划管理、精准农业等的快速发展,对土壤制图的精度与土壤分类提出了更高要求。遥感技术的迅速发展 和应用,为土壤分类提供了新的技术与数据支持。高光谱遥感的出现,加速了土壤分类的进程,在土壤属性的研究中展现出了巨大潜力[1]。目前,许多学者利用土壤反射光谱特征曲线研究土壤分类工作[1-3]。

目前,国外已经开展采用卫星数据和地形数据进行土壤资源调查和制图的研究。文献[4]以先进超高分辨率辐射计(Advanced Very High Resolution Radiometer,AVHRR)和数字高程模型(Digital Elevation Model,DEM)为数据源,采用普通克里金等方法对土壤性质进行了研究,并结合地形数据,评价了各种研究方法的优缺点;文献[5]基于AVHRR数据空间分辨率为500 m 和1000 m的图像,以DEM数据为辅助对匈牙利土壤进行分类研究,结果发现地形数据的加入对2种分辨率图像的土壤分类精度都有显著提高;文献[6]结合了遥感指数特征与地形特征实现了土壤类的分类。近年来,国内也有不少学者借助遥感图像进行土壤调查与分类。文献[7]利用美国陆地卫星(Landsat)专题绘图仪(TM)图像作为数据源,对我国植被覆盖率高的东南山区运用不同的分类方法进行土壤分类的研究,结果发现即使运用较好的分类方法,土壤的地形、质地等信息也会影响分类结果;文献[8-9]基于中分辨率成像光谱仪(Moderate Resolution Imaging Spectroradiometer,MODIS)的遥感数据和地形数据,探讨了遥感技术在受干旱地区的限制进行土壤调查时,对干旱区的土壤效果和适用性;我国其他学者也对土壤高光谱特反射性特性和反演模型进行了研究[10-12]。很多文献通过J-M距离将容易区分的亚类提取出来,进行分类,虽然分类结果很好,但是缺乏实用价值,土类级别的分类正确率在58%左右[6]。

相对于其他遥感图像, Landsat-8卫星具有预测分类准确度高、分辨率高以及波段的光谱范围大等优点。所以本文应用Landsat-8卫星遥感图像及高程图像,提出一种土壤分类方法,并首次提出2个基于遥感图像的纹理特征(熵与平滑度),通过随机森林方法实现了青海地区的土壤分类。

1 研究方法

本文采用Landsat-8卫星遥感图像,Landsat-8卫星由美国国家航空航天局于2013年2月发射,其数据包括可见光、短波红外、热红外等11个波段,空间分辨率为30 m,如表1所示。除遥感图像外,本文还用到了航天飞机雷达地形测绘任务(Shuttle Radar Topography Mission,SRTM)高程数据(平面精度±20 m,高程精度±16 m,空间分辨率30 m)。SRTM是美国航空航天局联合国防部国家测绘局于2002年完成的全球数字高程数据(DEM)。

土壤分类通过机器学习方法实现,首先提取特征,然后通过随机森林方法实现土壤分类,按3步实现:大气校正、特征提取和分类。

表1 Landsat-8图像的波段

1.1 大气校正

卫星传感器最终测得的地面目标的总辐射亮度并不是地表真实反射率的反映,其中包含了由大气吸收,尤其是散射作用造成的辐射量误差。大气校正就是消除这些由大气影响所造成的辐射误差,反演地物真实的表面反射率的过程。在大气校正图像的基础上,应用遥感图像进行研究,可以获得更准确的结果。

超立方体的快速视线大气分析(Fast Line-of-sight Atmospheric Analysis of Hypercub,FLAASH)是由波谱科学研究所(Spectral Sciences Inc.)在美国空军研究实验室(U.S. Air Force Research Laboratory)设计的大气校正算法。FLAASH适用于高光谱遥感数据和多光谱遥感数据。通过ENVI软件可实现遥感图像的FLAASH大气校正。

1.2 特征提取

土壤分类特征分成4类,基于变换的特征、遥感指数特征、图像纹理特征和地形特征。下面分别介绍每种特征的计算方法。

1)基于变换的特征

K-T变换分类特征提取。K-T变换是一种特殊的主成分分析(Principal Component Analysis,PCA),既可以对于遥感数据进行降噪,又可以使处理后的遥感影像实现数据压缩和图像增强的效果。将3幅Landsat-8的OLI影像分别进行K-T变换,变换后每幅遥感影像得到3个指数作为K-T变换分类特征,分别是亮度指数,绿度指数和湿度指数,其中亮度指数可以反映出地物总体反射效果,绿度指数反映出地表植被情况,而湿度指数反映出地表的水分条件。此外,所有波段的波段值PCA变换后的前3维也作为特征。

2)遥感指数特征

遥感指数特征包括3种特征:归一化植被指数(NDVI),水体指数(NDWI)和比率植被指数(RVI),其计算方法见文献[6]。

3)图像纹理特征

(1)平滑度

(1)

该特征是通过Landsat-8的可见光波段,即表1中的2~4波段计算出来的,主要过程是首先将这3个波段的平均值转化为灰度图像,计算得到图像灰度的归一化直方图P(zi);再基于式(1)得出平滑度U(z)。式(1)中其他符号意义如下:z为图像灰度值;i为灰度值序号(若图像最大灰度值为255,最小灰度值为0,设i=0,1,…255),则zi为第i个灰度值(由前面假设,zi=i),P(zi)是z的概率估值(灰度为z的像素个数占总像素的百分比)。平滑度特征为归一化直方图每个数值的平方和,当图像平滑时该值较大。

(2)熵

(2)

熵也是通过归一化直方图P(zi)计算,计算方法与平滑度特征相同。熵是直方图数值与其对数的乘积之和。平滑图像熵值较小,粗糙图像熵值较大。

4)地形特征

土壤成分与地形关系较大,因此计算了三种地形特征。地形特征是通过高程文件计算出来的,我们通过经纬度将遥感图像与高程图像关联起来,计算相应数据点的地形特征。

(1)高程

高程图像中像素点的灰度值即高程值。

(2)坡度

坡度即计算高程图像的一阶微分,坡度[13]表示了地表面在该点的倾斜度。

(3)

(3)曲率

曲率[14]即计算高程图像的二阶微分,将二阶偏微分之和作为曲率特征。

(4)

本文所提取的特征包括6维基于变换的特征、4维遥感指数特征、2维纹理特征及3维地形特征,特征总数为15维。

1.3 随机森林分类算法

根据上文提取的特征通过随机森林算法实现土壤分类。随机森林是由多个决策树构成的“森林”。随机森林模型具有两个非常重要的自定义参数:决策树的数量(k)和分割节点的随机变量的数量(m)。随机森林模型可以通过有放回抽样以及不同树演化过程中随机改变预测变量组合来增加决策树的多样性。每一个决策树可以通过原始数据集中的一个自助法取样子集进行生长,并且利用随机选择的m个预测变量中的最佳预测变量进行节点分割。

2 试验验证

2.1 试验数据集

由于土壤信息数据在全世界的迫切需要,特别是在气候变化的背景下,国际应用系统分析研究所(IIASA)及联合国粮农组织(FAO)等组织和机构共同建立了新一代世界土壤数据库(Harmonized World Soil Database,HWSD),该数据库提供了全世界范围内每处土壤的分类与成份信息,采用的土壤分类系统主要为FAO-90,HWSD数据存储在Access数据库中,可导出为Excel数据表。

中国土壤数据集[15]来源是世界土壤数据集,中国地区数据源为全国第二次土地调查由南京土壤所提供的1∶1 000 000土壤数据。HWSD没有提供地理栅格数据,中国土壤数据集提供了栅格数据,数据格式为img栅格格式,投影为WGS84。

待研究的样本是青海地区的3张图像,如表2和图1所示。所提数据点来源于HWSD中国土壤数据集,数据点总数为16 444个。

表2 青海地区图像信息

图1 青海地区图像Fig.1 Image of Qinghai area

该地区所包括的土壤类别有薄层土、栗钙土、石膏土、人为土、潜育土、黑钙土、始成土、黑土、红砂土、钙积土、盐土、粗骨土、膨转土和有机土等共14类,每个类下还包括一些亚类,共31个亚类。

2.2 试验结果与分析

1)测试方法与评价指标

每次用2张图像数据点训练分类模型,没训练过的图像的数据点进行测试,可验证针对未训练过的图像、分类模型是否有效。评价指标为分类正确率和一致性指数Kappa。

2)试验结果

土类是土壤高级分类的基本分类单元,它是根据土壤主要成土条件、成土过程和由此发生的土壤属性来划分的,同土类土壤应具有某些突出的、共同的发生属性与层段。亚类是根据成土过程对土类的进一步细化分类。

根据全国第2次土壤普查结果,确定了61个土类和231个亚类,本文按上述方法实现了青海地区土壤分类方法的测试,每张图像对土类的分类准确率与Kappa系数如图2所示,对亚类的分类准确率与Kappa系数如图3所示。

图2 土类的分类准确率与Kappa系数Fig.2 Classification accuracy and Kappa coefficients of soil

图3 亚类的分类准确率与Kappa系数Fig.3 Subclass classification accuracy and Kappa coefficients

3)结果分析

由图2、3可知,土类的分类平均准确率为0.629 7,Kappa系数0.523 0;亚类的分类平均准确率为0.517 7,Kappa系数为0.514 7;分类结果较好,分类一致性一般。土壤分类是较难的问题,文献[6]仅对土壤类进行了分类,其分类正确率为58%,虽然所分类的地区是不同的,不能进行直接对比,但仍可说明本文分类效果较好;而且一般文献的数据点数较少,仅几百个,本文提取的数据点为16 444个,也证明本文方法的有效性。

3 结束语

本文实现了一种基于机器学习方法的土壤分类算法,仿真试验结果表明,土壤分类准确率达到同类文献的水平,且经过大量数据点的验证,说明本文方法是有效的。

本文主要采用Landsat-8卫星图像进行土壤分类的研究,Landsat-8卫星图像的质量较高,图像像素缺失情况较少,土壤分类要求选择裸土较多时间的图像,对于同一位置Landsat-8卫星图像每个月都有一到两张图像可供研究,这对土壤分类的研究是比较有利的。本文研究主要采用可见光、近红外和短波红外波段,波长范围在0.4~2.5 μm之间,在今后的卫星载荷中,如若能够在这个区间内增加若干波段,对土壤分类的研究将会起到更大的作用。除此之外,土壤分类用到了高程数据,因此,可见光红外光谱仪与激光测距仪配合,是可以考虑的。

猜你喜欢
高程灰度分类
红树林宜林地滩面高程及潮水退干时间时长的测量方法
航空滤光片阵列多光谱图像条带灰度调整算法
采用改进导重法的拓扑结构灰度单元过滤技术
场景高程对任意构型双基SAR成像的影响
天津港智慧工作平台灰度发布系统和流程设计
8848.86m珠峰新高程
Arduino小车巡线程序的灰度阈值优化方案
基于二次曲面函数的高程拟合研究
按需分类
教你一招:数的分类