基于土壤反射光谱聚类分析的有机质预测模型

2017-09-03 10:56曹萌萌杨圣舒丁胜男刘焕军
中国农业信息 2017年10期
关键词:包络线草甸砂土

曹萌萌,杨圣舒,丁胜男,马 灿,肖 莹,刘焕军*

(东北农业大学 资源与环境学院,黑龙江哈尔滨 150030)

基于土壤反射光谱聚类分析的有机质预测模型

曹萌萌,杨圣舒,丁胜男,马 灿,肖 莹,刘焕军*

(东北农业大学 资源与环境学院,黑龙江哈尔滨 150030)

结合土壤图、Landsat8影像、DEM等,以松嫩平原典型土壤类型(黑土、黑钙土、草甸土、风砂土)的149个耕层(0~20 cm)土样的高光谱数据为研究对象,通过重采样、包络线消除法对数据进行处理,在此基础上对不同波段反射率与土壤有机质(SOM)含量进行相关性分析,以敏感波段作为输入量,采用K-均值聚类的方法对4种土壤进行聚类分析,建立聚类分析前后不同土壤类型的SOM多元逐步回归模型。结果表明:(1)K均值聚类法将土壤分成4类,其结果与实际采样结果大体类似;(2)土壤经过光谱分类后,预测模型精度较原来单一土类预测模型精度得到提高,R2的平均值由分类前的0.762提高到分类后的0.836,RMSE平均值由分类前的0.657降到分类后的0.504。该研究可应用于土壤光谱的分类、土壤有机质含量的速测、遥感反演、土地质量评价等工作。

重采样 包络线消除法 K-均值聚类 多元逐步回归

近年来,土壤分类研究得到了快速的发展,由最初的定性分析到如今的定量化分类[1],刘焕军等采用K-均值聚类和决策树进行分类模型的构建,结果表明表层土壤光谱特性的决策树模型可用于土壤分类[1],黄应丰通过对华南地区的土壤进行研究,采用主次元、模糊聚类分析后,将土壤分成平直型、缓斜型及陡坎型[2],王人潮等通过采用模糊数学方法,进而对土壤19个土壤剖面进行分类[3],康冉等通过对松嫩平原的土壤特征参数、光谱角度分析并结合聚类的方法,对松嫩平原土壤进行分类[4],戴达昌对中国的现行土壤类型进行研究,基于光谱反射率进行了光谱分类[5],目前已有很多学者从事土壤的分类研究,在土壤分类研究的基础上有很多学者也在进行土壤有机质反演模型的研究,武彦清等通过最小二乘法和多元逐步回归方法对松嫩平原建立土壤有机质高光谱预测模型,并具有很高的稳定性[6],刘焕军等利用多元统计回归方法,建立黑土有机质含量高光谱预测模型,并对模型的稳定性和预测能力进行检验,得出了归一化一阶微分模型为最优预测模型[7],吴炳方等基于统计分析方法研究了光谱分辨率对黑土有机质预测模型精度的影响,得到黑土有机质含量高,土壤有机质的光谱作用范围宽;黑土有机质光谱预测模型精度随光谱分辨率降低,呈现先增后减的趋势[8],该文在前人研究的基础上选择松嫩平原土壤作为研究目标,对土壤有机质预测模型进行研究。

东北地区是我国重要的商品粮基地,然而随着近年来土壤侵蚀、土壤盐渍化以及荒漠化等土壤退化问题的加重,对东北地区土壤退化进行实时、定量、动态宏观的监测是必要的。因此该文针对东北地区尤其是松嫩平原地区的土壤进行聚类以及不同土壤类型的SOM预测模型研究,旨在为区域土壤分类及土壤有机质含量的速测提供支持。

1 材料与方法

1.1 研究区概况

研究区为位于大、小兴安岭与长白山脉及松辽分水岭之间的松嫩平原黑龙江省部分的耕地范围,它属于中温带大陆性季风气候,雨热同季,光照充足,土壤类型从东北到西南依次有:草甸土、黑土、黑钙土、风砂土。该区耕地面积约占63.4%,土质肥沃,是我国重要的商品粮生产基地。作物一年一季,裸土时间长,晴天多,适于土壤遥感研究。

1.2 土样采集与处理

结合土壤图、春季裸土时期环境星、Landsat 8影像、Google Map、DEM,在松嫩平原土壤区(北安市、杜尔伯特蒙古自治县、林甸、依安、拜泉、等市县境内)采集0~20 cm耕层土样(选择该区典型土壤类型:黑土、黑钙土、草甸土、风砂土)共149个。如图1。

图1 研究区示意与土壤分布

表1 样本有机质统计量

利用GPS测定采样点经纬度坐标,在室内将土样风干、研磨、过2 mm筛,采用四分法将土样分成两份,分别供化学分析和光谱测试用。采用重铬酸钾容量法-外加热法分析有机质含量[9]。室内测定土样有机质含量如表1。对采集的土样有机质含量进行测定并进行反射光谱测试。

1.3 室内反射光谱测试

对处理加工过的土样进行光谱测试,采用ASD FieldSpec3地物光谱仪测量土壤样品的反射光谱数据。该光谱仪波长范围为350~2 500 nm,光谱测量在一个能控制光照条件的暗室内进行。光源为1 000W的卤素灯,采用的探头视场角为8°。光源照射方向与垂直方向夹角30°。探头到土样表面垂直距离为15 cm,把适量经处理的土壤样品倒入直径为12 cm,深1.8 cm的盛样皿中。用玻璃稍稍压实,使其表面尽量平整。每个土样采集10条光谱曲线,取其平均值作为该测量样本的光谱数据。

1.4 光谱数据的处理

利 用 遥 感 软 件 ENVI5.1的 Spectral Library Resampling功能对光谱数据以5 nm为间隔进行重采样,同时利用软件的Continuum Removed功能对重采样的数据进行包络线消除法处理,将反射率归一化到0~1之间,从而使光谱特征更加明显。数据进行去包络线消除法后对比图(图2)。

图2 去包络线消除法后对比

1.5 K-均值聚类

1.5.1 指标的标准化处理

在进行K-均值聚类前,需要对指标进行标准化处理,即将各个指标值按比例映射到相同的取值区间,从而能够平衡各个属性对距离的影响。映射区间为[0,1]。公式如下:

Zj(i)为第j个指标,第i个样本的标准化结果,Xj(i)第j个指标,第i个样本值,max[Xj(i)]和min[Xj(i)] 分别为第j个指标的最大值和最小值。

1.5.2 K-均值聚类

K-means算法是典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大[1]。采用SPSS来进行该算法的实现。

1.6 多元逐步回归

多元线性回归模型是指含有多个解释变量(即含有两个或两个以上的自变量)的线性回归模型,用于揭示变量与多个解释变量的线性关系[4],其数学模型为:

式中Y为被解释变量,Xj(j=1,2,3,…,k)为解释变量,βj(j=0,1,2,3,…,k)为未知参数,μ为随机误差项。该研究采用 SPSS进行多元逐步线性回归。

1.7 模型精度的检验

模型稳定性的判断指标用决定系数R2检验,预测精度评价指标用均方根误差(RMSE)判断越大[9]。其计算公式为:

式中yi和分别检验样本的观测值和预测值,为样本观测值的平均值,n为预测样本数,其中决定系数R2的值越接近于1则代表模型的稳定性越强。

RMSE的计算公式如下:

式中yi和分别为检验样本的观测值和预测值,n为预测样本数。RMSE值越小则代表模型精度越高、预测能力越强。

2 结果与分析

2.1 松嫩平原不同土壤反射光谱特征

将松嫩平原4种典型土壤的光谱反射率进行重采样及去包络线处理,为了更好地发现不同土壤类型的光谱特征,对每一种土壤光谱反射率及去包络线后的数据求取均值,代表每一个土壤类型的平均光谱特征,如图3。

由图3可知:在430~930 nm较其他土壤,黑土由于有机质含量较高,受其含量影响,黑土在这一波段的反射率较低,风砂土的反射率较高。在去包络线前后,4种土壤光谱反射曲线走势大致相同,去包络线后使数据的特征更加明显,在小于930 nm之前,数据更是表现出之前没有的特征,且在波长小于1 400 nm时,黑土曲线表现出下凸的趋势,风砂土则表现为上凸的情况。

2.2 K均值聚类

在土壤有机质含量与光谱数据的相关性分析的基础上,选出相关性最大的几个波段,并对其进行标准化处理,作为K均值聚类的输入量。利用SPSS软件进行标准化处理及聚类分析,结果如表2。

图3 土壤反射率光谱曲线与去包络线

表2 聚类分析结果

表3 分类前后不同土壤有机质含量预测多元线性逐步回归模型

表4 不同土壤有机质 多元逐步回归模型

图4 不同类型土壤反射光谱曲线

与实际的土壤类别对比后发现:第一类混有87.5%的风砂土和12.5%的草甸土,其中风砂土占比最大;第二类混有83.3%的草甸土、3.3%的风砂土和13.3%的黑钙土,其中草甸土占比较大;第三类混有76.8%的黑钙土、 13.4%的风砂土以及9.8%的草甸土,其中黑钙土占比最大;第四类的光谱特征有机质含量偏高,平均有机质含量达到6.87,其中25个样本均为黑土(即86%为黑土)混有部分黑钙土和草甸土。

根据聚类后的结果,以占比多的土壤类型命名该类别,绘制出4类土壤的光谱反射率曲线如图4。

2.3 多元逐步回归

以分类前后不同土壤不同波段去包络线处理后的土壤数据为自变量,以有机质含量为因变量,利用SPSS软件将全部变量的方差贡献值按大小进行排列,进行多元线性逐步回归分析,选入以及剔除自变量的概率参数为0.05和0.1,结果如表3。

由表3可知: 4种土壤类型的预测模型R2>0.494,风砂土单独建模精度高于其他土类,黑钙土单独建模精度低于其他土类。土壤类型的R2多集中于0.8附近,RMSE值<0.877,故模型的适用性较强。

整体看,土样经过分类以后,多数土壤的R2得到提高,RMSE值减小,其中黑土、草甸土以及风砂土的R2均得到提高,其模型精度高于单一土类建模,同时4类土壤R2的平均值由分类前的0.762提高到分类后的0.836,RMSE平均值由分类前的0.657到分类后的0.504。

分类后4种土壤的预测模型如表4。

3 讨论

在风砂土分类中加入了1个草甸土,风砂土单独建模时模型精度高于其他3种土类的模型精度,但当风砂土与部分的草甸土归为一类时,其模型精度又有所提高,这说明该采样点的表层草甸土的光谱反射率特征表现出风砂土的特征。草甸土分类中加入了部分风砂土和黑钙土,由于黑钙土与草甸土采样点相邻,这部分草甸土会兼具黑钙土和草甸土两种土壤的光谱反射率特征,因此草甸土的模型精度并未得到显著的提高,黑钙土与黑土的分类中,均混有少部分草甸土,说明表层草甸土的光谱反射率特征表现出相邻土样的反射率特征,证实了表层草甸土的“向邻性”。

4 结论

(1)松嫩平原的4种土壤反射率数据去包络线处理后均适用于多元逐步回归模型,其中单一风砂土的预测模型最好,预测精度可达到0.894,RMSE值为0.336。

(2)经过聚类分析后,4类土壤有机质预测模型的精度较单一土壤模型的预测精度均得到一定提高,因此可以认为对于土壤有机质含量进行预测时,先将其进行光谱分类是有必要的,故该方法可应用于土壤光谱分类,并且有利于土壤有机质含量的速测。

(3)聚类分析后草甸土预测模型精度并未得到显著提高,主要是由于黑钙土与草甸土采样点相邻,这部分草甸土会兼具黑钙土和草甸土两种土壤的光谱反射率特征,因此预测模型精度不高。

该研究的结果仅是基于土壤光谱反射率去包络线数据的K-均值聚类结果,并未基于土壤光谱特征参数进行聚类分析,因此从不同角度对土壤进行聚类分析从而提高聚类的精度还有待研究。

[1] 刘焕军,张小康,张新乐,等.面向土壤分类的高光谱反射特征参数模型.遥感学报.2017,21(1)105~114

[2] 黄应丰,刘腾辉.华南主要土壤类型的光谱特性与土壤分类.土壤学报.1995.32(1):58~68

[3] 王人潮,苏海萍,王深法.浙江省主要土壤光谱反射特性及其模糊分类在土壤分类中的应用研究.浙江大学学报(农业与生命科学版).1986

[4] 康冉,刘焕军.松嫩平原典型土壤有机质高光谱预测模型研究.哈尔滨:东北农业大学,2016

[5] 戴昌达.中国主要土壤光谱反射特性分类与数据处理的初步研究.遥感选A集.北京:科学出版社.1981,5~323

[6] 武彦清,张柏,刘焕军,等.松嫩平原土壤有机质含量高光谱反演研究.中国科学院研究生院学报.2011,187~194

[7] 刘焕军,张柏,张兴义,等.黑土有机质含量高光谱模型研究.土壤学报.2007,28~32

[8] 刘焕军,吴炳方.光谱分辨率对黑土有机质预测模型的影响.光谱学与光谱分析.2012,739~742

[9] 李胜男,曹萌萌,等.黑土典型区有机质高光谱预测模型.国土与自然资源研究.2016,(4)

猜你喜欢
包络线草甸砂土
青藏高原高寒草甸的空气动力学粗糙度特征
山地草甸
基于ISO 14692 标准的玻璃钢管道应力分析
水泥土换填法在粉质砂土路基施工中的应用研究
馒头草甸
饱和砂土地层输水管道施工降水方案设计
由椭圆张角为直角的弦所在直线形成的“包络”
不同低温温度下砂土物理力学特性试验研究
抛体的包络线方程的推导
龙之中华 龙之砂土——《蟠龙壶》创作谈