南 锋,朱洪芬,毕如田
(山西农业大学资源环境学院,山西太谷030801)
黄土高原煤矿区复垦农田土壤有机质含量的高光谱预测
南锋,朱洪芬,毕如田
(山西农业大学资源环境学院,山西太谷030801)
摘要:【目的】针对黄土高原丘陵地多、地形复杂、有机质含量低、采样困难以及因采煤活动引起大面积土地损毁等问题,在土地复垦与综合整治过程中,为快速定量监测与评估复垦农田土壤质量提供一种新的方法。【方法】以山西省襄垣县复垦农田土壤为研究对象,选取由北向南土地损毁中间条带状区域采集样品152个,进行室内土壤农化分析、光谱测定,运用 ParLes 3.1软件对光谱曲线进行多元散射校正(multipication scatter correction,MSC)、基线偏移(baseline offset correction,BOC)和Savitzky-Golay filter平滑去噪预处理。对土壤原始光谱反射率(raw spectral reflectance,R)作一阶微分(first order differential reflectance,D(R))和倒数的对数变换(inverse-lg reflectance ,lg(1/R)),分析3种不同变换形式的光谱数据与土壤有机质含量的相关性,相关系数通过P=0.01水平显著性检验来确定显著性波段的范围。基于全波段(400—2400 nm)和显著性波段利用偏最小二乘回归(partial least squares regression,PLSR)分析方法建立该区域土壤有机质含量高光谱预测模型,通过模型精度评价指标:决定系数(coefficient of determination,R2)、均方根误差(root mean square error,RMSE)和相对预测偏差(residual prediction deviation,PRD)确定最优模型。【结果】通过P=0.01水平显著性检验的波段范围为:R的400—1 800、1880—2 400 nm;D(R)的420—790、1 020—1 040、2 150—2 200 nm;lg(1/R)的 400—1 830、1 860—2 400 nm。光谱与有机质含量的相关系数绝对值最大的波段是R的800 nm;D(R)的600 nm;lg(1/R)的760 nm。进行D(R)变换,光谱曲线的吸收特征更加明显,相关系数在可见光(400—800 nm)波段范围内有所增加,其最大值由0.72提高到了0.82;基于显著性波段的PLSR建模效果优于全波段,其中lg(1/R)变换的预测精度为最佳,具有很好的预测能力,其校正模型的R2和RMSE分别为0.95、7.64,预测模型的R2、RMSE和RPD分别为0.85、3.00、2.56;基于全波段的R-PLSR 和lg(1/R)-PLSR模型具有较好的预测能力,其预测模型的R2、RMSE和RPD分别为0.79、3.64、2.10和0.79、3.53、2.17,而D(R)-PLSR模型只能进行粗略估测,其预测模型的R2、RMSE和RPD分别为0.61、5.43、1.41。综合分析全波段和显著性波段3种光谱数据的预测精度,发现基于显著性波段的R-PLSR、D(R)-PLSR、lg(1/R)-PLSR模型均取得了显著的预测效果。【结论】研究区土壤光谱反射率与土壤有机质含量具有高度的相关性,应用偏最小二乘回归分析方法可以很好地建立土壤有机质含量反演模型。
关键词:煤矿区;复垦农田;土壤有机质;高光谱;偏最小二乘回归
联系方式:南锋,Tel:0354-6286586;E-mail:nanfeng24@126.com。通信作者毕如田,Tel:0354-6288912;E-mail:birutian@163.com
【研究意义】土壤有机质是土壤中各种营养元素的重要来源,为植物提供所需养分,对土壤结构的形成、物理性状的改善具有重要作用,被称为植物的“养分银行”[1],其含量多少是土壤肥力的一个重要指标。传统的土壤化学分析方法,由于耗时、费力等问题已不能满足现代农业发展的需求,而高光谱遥感具有波段多、分辨率高等特点,可以快速、无损、低成本地定量反演土壤养分含量[2-4]。通过对煤矿区复垦农田土壤有机质高光谱遥感分析,可以动态监测与评估治理区域土壤质量的变化,为区域土地复垦、塌陷区治理提供依据。【前人研究进展】自20世纪60年代以来,国外针对土壤参数与土壤光谱特征关系及预测模型已有大量卓有成效的研究,肯定了利用土壤可见光-近红外光谱预测土壤有机质、黏土矿物、质地、水分、重金属含量等特性的能力[5-7]。国内研究始于20世纪80年代,利用可见光-近红外光谱在预测黑土、盐渍化土、荒漠土、红壤、潮土等有机质含量时取得了很好的效果,反演精度较高,但土壤有机质含量与土壤反射光谱之间存在的响应特性有所差异[8-13],这主要是由土壤类型[14]、数据来源、校准方法、测试环境、土壤发色团以及仪器本身所引起的[15-18]。可见光-近红外预测土壤有机质含量的机理是由于发色团和黑暗色胡敏酸的作用,在可见光区域具有大量吸收,在近红外区域很多吸收带都是O-H、C-H、N-H伸缩振动所产生的倍频或它们相互作用的合频吸收[17,19]。尽管可见光-近红外在预测土壤有机质含量研究取得了一定的进展,但是土壤受气候、母质、地形、生物等因素以及人类活动的影响,其土壤理化性质具有明显差异,不同土壤类型高光谱特性和反演模型的差异也很大,通常认为模型的建立依赖于研究区域和特有的数据[17,20-21],一个区域的反演模型很难应用到其他区域或不同尺度上。近年来,许多研究围绕全球[22]、国家[23-24]、区域[25]和局部[24]尺度,利用土壤光谱库预测土壤光谱特性开展了一些工作,截至目前,中国不同区域、不同土壤类型以及使用大样本的数据来解释土壤光谱预测能力尚需进一步探讨[26]。山西属于煤炭资源型省份,改革开放以来,为国家经济发展提供了重要的能源保障。然而,煤炭开采给生态环境本就脆弱的山西省留下了大面积的采煤塌陷区。所以,在区域土壤光谱库不可用或土壤在很大程度上受人类活动影响时,研究建立区域土壤光谱反演模型仍是积极的研究课题。【本研究切入点】土地复垦与生态重建过程中了解土壤肥力特征及其变化,对于评估退化土壤修复重建的质量非常重要。本文目标研究区域地处黄土高原生态脆弱带,区内煤矿分布众多,受煤矿开采等人为活动扰动下,引起了大面积土地损毁和破坏,对耕地土壤理化性质有直接影响[27-28],同时也会影响光谱的反射特性[29]。在土地复垦与综合整治过程中,尝试利用高光谱技术开展煤矿区农田土壤质量的定量监测与评估。【拟解决的关键问题】以山西省襄垣县煤矿区复垦土壤为研究对象,通过野外采集复垦农田土壤样本,室内测定土壤有机质含量和样品的高光谱测定,对不同变换形式的光谱数据与土壤有机质含量进行相关性分析,确定光谱响应敏感波段,基于全波段和显著性波段利用PLSR分析方法建立土壤有机质高光谱预测模型,以期对区域尺度土地复垦、塌陷区治理土壤肥力快速监测提供参考。
1.1 研究区概况
襄垣县位于山西省东南部,太行山西麓,上党盆地之北,地形西北高东南低,地貌属于半山丘陵区,其中,丘陵占57.5%,山区占31.9%,平川占10.6%,其行政区范围为东经 112°42′—113°14′,北纬 36°23′—36°44′,辖11个乡镇,328个行政村,1 088个自然村,海拔800—1 725 m,平均海拔1 000 m左右,全县东西长48 km,南北宽40 km,总面积为1 160 km2。该区属于大陆性温带季风气候,四季分明。土壤类型有褐土、潮土和石质土,主要以褐土为主,占89.88%。全县矿产资源丰富,已探明煤炭储量75.8亿t,可开采22亿t,受长期煤炭开采活动的影响,大量土地存在沉陷,水土流失严重(图1)。
图1 研究区地理位置及采样点分布Fig. 1 Geographical position and sample points distribution of study area
1.2 样本的采集与处理
研究区域土壤主要为原状表层土,土壤类型为褐土,质地类别为壤土,土壤pH范围为7.1—8.6,平均值为7.9;土壤有机质含量范围为5.04—50.90 g·kg-1,平均值为 14.47 g·kg-1;土壤容重范围为 0.90—1.32 g·cm-3,平均值为 1.09 g·cm-3。土壤孔隙度为 45%—60%,土壤疏密适中,通气好。土壤氧化铁含量为1.20 —9.90 mg·kg-1,平均为6.54 mg·kg-1,属3级水平。
已开采煤矿主要分布在西营、下良、善福、夏店、古韩、王桥和侯堡7个乡镇,通过近几十年煤矿开采等强人为因素扰动,呈现了由北向南中间条带状的土地损毁区域,2006—2013年通过土地平整、裂缝填充等土地整治工程对该区域受损农田进行全面治理。本研究在野外调研和相关资料分析基础上,采用随机和判断布点相结合的方式,对上述受损严重且通过复垦治理区域进行布点采样,对部分受损程度不同或复垦措施不同的复杂区域进行了加密采样。
样品采集于2014年4月,样品具体采集时采用“S”形布点法,使用螺旋取土钻取 5个点的土样混合作为一个样品。采集 0—20 cm耕层土壤样品 152个,每个样品约1 kg。采集好的土样混合均匀后,经过风干、磨碎,过2 mm孔筛,将每份土样分为两份,一份用于土壤光谱数据的采集,一份用于土壤农化分析测试。土壤有机质含量用重铬酸钾-外加热法测定[30]。
1.3 光谱测定
光谱测定采用美国ASD FieldSpec3地物光谱仪。光谱范围为350—2 500 nm,其中350—1 000 nm采样间隔为1.4 nm,1 000—2 500 nm采样间隔为2 nm,数据重采样间隔为1 nm。光谱测量在暗室内进行,光源功率为50 W的卤素灯,距土壤样品表面50 cm,光源天顶角15°,采用5°视场角探头,探头位于土壤样本表面垂直上方30 cm处。每次测试前进行白板标定,每个土样采集10条光谱曲线,进行拼接校正后,取其平均曲线作为土样实际反射光谱数据。
1.4 光谱数据预处理
去除噪声较大的350—399和2 451—2 500 nm边缘波段。在光谱采集时,不可避免地受到周围环境、仪器、样品及光的散射等因素的影响,导致原始光谱细节特征不明显,需要对光谱进行变换来增强特征。本文运用ParLes 3.1软件的Data Manipulations模块对光谱曲线进行多元散射校正(multipication scatter correction,MSC)、基线偏移(baseline offset correction, BOC)预处理,选用Savitzky-Golay filter进行平滑去噪[31]。
在土壤光谱反射率(raw spectral reflectance,R)基础上,进行一阶微分(first order differential reflectance,D(R))和倒数的对数(inverse-lg reflectance,lg(1/R))数学形式变换,可以有效减少光照、背景噪声的干扰,提高光谱灵敏度,更加容易分解混合特征信息。3种光谱指标数据直接由ViewSpec Pro软件计算获得。
1.5 数据分析方法
偏最小二乘回归法(partial least squares regression,PLSR)集主成分、典型相关分析和多元线性回归3种分析方法的优点,能够对数据降维,简化数据结构,综合筛选特征,提取反映数据变异的最大信息,具有很好的预测能力[32],特别是在处理各变量内部信息高度线性相关的数据,建模效果尤为显著[33]。本研究对有机质含量分别基于全波段和显著性波段建立预测模型。在对显著性波段建立模型时,先进行相关分析(correlation analysis,CA),通过P=0.01水平上显著性检验,对光谱数据降维,减少冗余信息,这样可以简化方程,保留大部分有用信息的同时提高了运算速度。建模过程采用留一法交叉验证(leave-one-out cross validation,LOO)来确定最佳因子的个数,模型的预测精度用预测值与实测值的决定系数(coefficient of determination,R2)、均方根误差(root mean square error,RMSE)和相对预测偏差(residual prediction deviation,RPD)来评价。建模及评价指标计算借助ParLes 3.1、Unscramber 9.7软件完成。
R2反映模型建立和预测的稳健性,R2越大,说明模型的稳健性越好、估算模型拟合程度越高。RMSE越小,模型预测能力越好。RPD是样本标准差与均方根误差RMSE的比值,用来解释模型的预测能力,RPD <1.4表明模型的预测能力很差,不能用于样本的预测;1.4<RPD<2.0表明模型是可以被接受的,可用来对样本进行粗略的预测;RPD>2.0表明模型是稳健的、准确的,模型具有很好的预测能力。因此,一个好的预测模型应该具有大的R2和RPD,小的RMSE,反之则模型预测能力较差。
2.1 土壤样本描述性统计分析
研究区土壤有机质含量变化范围为 5.04—50.90 g·kg-1,标准差为7.60 g·kg-1,平均值为16.47 g·kg-1,变异系数为46.13%,土壤有机质含量总体偏低(表1)。有机质的建模集和验证集的土壤样本的统计指标与总体样本比较一致。建模集和预测集的划分选用 K-S(Kennard-Stone)算法[34],在Matlab R2013a软件中编程计算出各个样本光谱空间的欧氏距离,92个样本用于建模,60个样本用于预测。
表1 土壤有机质含量统计特征Table 1 Statistical characteristics of soil organic matter content
2.2 土壤光谱曲线特征分析
按照全国第二次土壤普查养分分级标准,选取土壤有机质含量 6个等级的反射率平均值对应的光谱曲线,从图2[35]可以看出,具有以下特征:(1)不同有机质含量的土壤光谱曲线形态相似,总体呈现递增趋势;(2)土壤有机质含量与光谱反射率呈负相关,随着有机质含量的增加,土壤光谱反射率减小;(3)在可见光(400—800 nm)波段范围内,随着波长的增加,土壤光谱反射率呈明显上升趋势,在近红外(800—2 500 nm)波段范围内,光谱反射率的变化趋于平缓,光谱曲线差异较大,随着有机质含量的增加,光谱曲线的差异减小;(4)在1 400、1 900和2 200 nm波段附近存在明显的水分吸收谷,曲线的吸收深度、吸收宽度以及吸收面积均存在差异,1900 nm处吸收面积最为明显,一般认为1 400、1900 nm附近是因为水分吸收了该波段附近的电磁波,土壤样品中水分子的 O-H官能基在1 400 nm附近发生一级倍频处伸缩震动在1 900 nm附近发生一级倍频伸缩震动和转角震动,其吸收率反映了土壤水分的变化,2 200 nm附近是因为有机质中 O-H官能基的伸缩震动和转角震动的合频跃迁[7]。
图2 不同有机质含量反射率平均值光谱曲线Fig. 2 Mean reflectance of organic content for different levels
2.3 土壤有机质与光谱反射率相关性分析
运用全波段(400—2 400 nm)和3种光谱指标数据作相关性分析,绘制相关关系曲线(图 3),R与有机质含量呈负相关,整条曲线比较平滑,在可见光(400—800 nm)呈上升趋势,800 nm处达到最大值0.72,1 400、1 900和2 200 nm处有微弱的吸收峰;D (R)与有机质含量呈正负相关,相关系数波动较大,呈现多个峰值,600 nm处达到最大值0.82,相比原始光谱反射率的相关关系,在可见光波段范围相关性有所增强,一些隐含的特征信息被释放出来,而在近红外波段部分相关性明显减弱;lg(1/R)与有机质含量呈正相关,与R的相关关系绝对值的变化趋势基本一致,存在高度线性相关,相关系数在0.5以上。这说明对于不同的土壤属性,对光谱反射率进行不同的变换可以提高二者之间的相关关系。针对本研究区的土壤样本,R、lg(1/R)和土壤有机质含量在全波段都具有较高的相关性。
土壤有机质含量与R、D(R)和lg(1/R)的进行相关性分析,通过P=0.01水平上显著性检验的波段确定为显著性波段。显著波段为:R的400—1 800、1 880 — 2 400 nm;D(R)的420—790、1 020—1 040、2 150 —2 200 nm;lg(1/R)的400—1 830、1 860—2 400 nm。光谱与有机质含量的相关系数绝对值最大的波段是R 的800 nm;D(R)的600 nm;lg(1/R)的760 nm。
图3 土壤有机质含量与光谱数据相关性曲线Fig. 3 Soil organic matter content and spectral data correlation curve
2.4 土壤有机质PLSR预测模型的建立与评价
分别以土壤光谱全波段和显著性波段作为自变量,有机质含量作为因变量,建立R-PLSR、D(R)-PLSR、lg(1/R)-PLSR模型。由表2可以看出,对于全波段来说R-PLSR和lg(1/R)-PLSR模型具有较好的预测能力,可以对土壤有机质含量较为精确的评估,特别是lg(1/R)-PLSR模型的建模集和预测集的决定系数R2分别达到了0.95和0.79,说明原始光谱反射率经过倒数的对数变换处理后所得到模型具有很高的稳健性,预测精度更高。对于显著性波段来说,R、D(R)、lg(1/R)光谱构建的校正集模型和预测集模型的决定系数R2、相对预测偏差RPD较全波段建立的模型有明显的提高,均方根误差RMSE明显减小,说明在该研究区域显著性波段建立的PLSR模型优于全波段所建立的模型,而且lg(1/R)-PLSR模型优于R-PLSR模型,D(R)-PLSR模型次之。
对比全波段D(R)-PLSR模型与显著性波段D (R)-PLSR模型可以看出,尽管在可见光(400—800 nm)波段范围内一阶微分变换提高了光谱反射率与有机质含量的相关关系、在近红外(800—2 400 nm)波段范围光谱特征得到了增强,但是在近红外区通过显著性检验的波段较少,因此,显著性波段D(R)-PLSR模型可以很好地预测有机质含量,而全波段 D(R)-PLSR模型只可以粗略的估测。
表2 土壤有机质含量的偏最小二乘回归模型Table 2 Partial least squares regression model of soil organic content
由图4可以看出,显著性波段R、D(R)和lg (1/R)得到的回归方程对预测样本有机质含量的预测效果较好,具有比较好的解释能力。
图4 土壤有机质含量实测值与预测值散点图Fig. 4 Scatter plot between measured and predicted soil organic matters
本研究表明,土壤光谱反射率与土壤有机质含量之间有很好的相关性,最高达到0.72,校正集和预测集反演模型的决定系数最高分别达到 0.95、0.85,因此,利用土壤高光谱反演本研究区域的土壤有机质含量是可行的。本研究中模型精度高可能是研究区域小,土壤类型单一,环境因子干扰少,土壤理化性质差异小等原因。ROSSEL等[22]研究全球土壤光谱库时发现土壤有机质预测误差会随着研究区域尺度的扩大而增大,这与本研究结果一致。
土壤有机质含量与土壤光谱反射率呈显著负相关,有机质含量可以从土壤反射光谱中得到一定程度的反映,随着有机质含量的增加,土壤光谱反射率减小。在可见光区(400—800 nm),土壤各组分的分子产生电子吸收光谱,随着区域波长的增加,其对应的土壤吸收率降低,不同的土壤类型,因其所含矿物组分的差异,光谱变化的直线斜率也会有明显差别。在近红外区(800—2 500 nm),光谱反射率的变化趋于平缓,随着有机质含量的增加,光谱反射率的差异减小。进行不同的光谱变换处理,发现 D(R)变换使得隐蔽的光谱信息得到了增强,呈现多个峰值,但由于有机质含量与 D(R)光谱反射率的相关性在近红外(800—2 400 nm)区域较弱,基于全波段建立D(R)-PLSR模型预测效果较差,而基于显著性波段建立D (R)-PLSR模型取得了较好效果。这主要是因为有机质含量与光谱反射率的相关系数决定了土壤有机质对光谱波段响应的灵敏性,相关性越高,响应越灵敏,越容易确定敏感波段[11]。lg(1/R)与有机质含量呈正相关,与R的相关关系绝对值的变化趋势基本一致。
显著性波段的建模预测效果要优于全波段。这主要是因为研究区域原始土壤光谱反射率在全波段范围与有机质含量具有高度线性相关性,大部分波段与土壤光谱反射率显著相关,相关系数均在0.5以上,只有少数波段不相关。这也证实了偏最小二乘回归特别适用于自变量内部高度线性相关、利用有效数据建立模型,具有显著的预测能力[36]。基于显著性波段建立PLSR反演模型具有模型简单、变量少、运算快等特点,可以有效减少冗余信息的干扰,改善建模效果。
本文以黄土高原煤矿区,受人类活动影响严重的山西省襄垣县复垦农田土壤为对象,建立了土壤有机质PLSR反演模型,该模型是在土壤反射率与有机质存在高度线性相关情况下建立的,模型对其他区域的适用性还有待进一步验证。因此,在今后的工作中需进一步研究更大区域尺度光谱特性,建立区域土壤光谱库,为丰富国家尺度土壤光谱库提供数据支撑,也可尝试利用航空、航天遥感影像建立区域或更大尺度定量反演模型,为土壤质量的监测与评估提供参考。
4.1 进行D(R)变换后,一些隐含的特征信息被释放出来,呈现多个吸收峰,不同有机质含量光谱曲线特征得到增强,可见光波段范围内土壤有机质含量与光谱反射率相关性得到提高,相关系数最大值由0.72提高到了0.82。
4.2 基于显著性波段建立的 PLSR模型总体上优于全波段的PLSR模型。以lg(1/R)-PLSR模型预测精度最高,其RPD为2.56,R-PLSR和D(R)-PLSR模型次之。反演模型可以很好地估测该区域的土壤有机质含量。
4.3 基于全波段建立R-PLSR和lg(1/R)-PLSR模型具有较好的预测能力,可以对土壤有机质含量较为精确的评估,而 D(R)变换在近红外波段范围内土壤有机质含量与光谱反射率相关性明显减弱,有效的光谱信息丢失,预测能力明显下降,只能进行粗略估测。
References
[1] 程朋根, 吴剑, 李大军, 何挺. 土壤有机质高光谱遥感和地统计定量预测. 农业工程学报, 2009, 25(3): 142-147. CHENG P G, WU J, LI D J, HE T. Quantitative prediction of soil organic matter content using hyper spectral remote sensing and geo-statistics. Transactions of the CSAE, 2009, 25(3): 142-147. (in Chinese)
[2] 张娟娟, 田永超, 姚霞, 曹卫星, 马新明, 朱艳. 基于高光谱的土壤全氮含量估测. 自然资源学报, 2011, 26(5): 881-890. ZHANG J J, TIAN Y C, YAO X, CAO W X, MA X M, ZHU Y. Estimating soil total nitrogen content based on hyperspectral analysis technology. Journal of Natural Resources, 2011, 26(5): 881-890. (in Chinese)
[3] XIE H T, YANG X M, DRURY C F, YANG J Y, ZHANG X D. Predicting soil organic carbon and total nitrogen using mid- and nearinfrared spectra for Brookston clay loam soil in Southwestern Ontario, Canada. Canadian Journal of Soil Science, 2011, 91(1): 53-63.
[4] YANG H, KUANG B, MOUAZEN A M. Quantitative analysis of soil nitrogen and carbon at a farm scale using visible and near infrared spectroscopy coupled with wavelength reduction. European Journal of Soil Science, 2011, 63(3): 410-420.
[5] BO S, ROSSEL R A V, MOUAZEN A M, WETTERLIND J. Visible and near infrared spectroscopy in soil science. Advances in Agronomy,2010, 107: 163-215.
[6] ROSSEL R A V, WEBSTER R. Discrimination of Australian soil horizons and classes from their visible-near infrared spectra. European Journal of Soil Science, 2011, 62(4): 637-647.
[7] NOCITA M, STEVENS A, WESEMAEL B V, AITKENHEAD M,BACHMANN M, BARTHÈS B, BEN DOR E, BROWN D J,CLAIROTTE M A, CSORBA P, DARDENNE, DEMATTÊ J A M,GENOT V, GUERRERO C, KNADEL M, MONTANARELLA L,NOON C, RAMIREZ-LOPEZ L, ROBERTSON J, SAKAI H,SORIANO-DISLA J M, SHEPHERD K D, STENBERG B, TOWETT E K, VARGAS R, WETTERLIND J. Soil spectroscopy: an alternative to wet chemistry for soil monitoring. Advances in Agronomy, 2015,132: 139-159.
[8] LIU H J, ZHANG Y Z, ZHANG B. Novel hyperspectral reflectance models for estimating black-soil organic matter in Northeast China. Environmental Monitoring & Assessment, 2009, 154(1/4): 147-154.
[9] 刘焕军, 张新乐, 郑树峰, 汤娜, 胡言亮. 黑土有机质含量野外高光谱预测模型. 光谱学与光谱分析, 2010, 30(12): 3355-3358. LIU H J, ZHANG X L, ZHENG S F, TANG N, HU Y L. Black soil organic matter predicting model based on field hyperspectral reflectance. Spectroscopy and Spectral Analysis, 2010, 30(12):3355-3358. (in Chinese)
[10] 赖宁, 李新国, 梁东. 开都河流域下游绿洲盐渍化土壤高光谱特征.干旱区资源与环境, 2015, 29(2): 151-156. LAI N, LI X G, LIANG D. Spectral characteristics of salinized soil in the lower reaches of Kaidu river basin. Journal of Arid Land Resources and Environment, 2015, 29(2): 151-156. (in Chinese)
[11] 侯艳军, 塔西甫拉提·特依拜, 买买提·沙吾提, 张飞. 荒漠土壤有机质含量高光谱估算模型. 农业工程学报, 2014, 30(16): 113-120. HOU Y J, TASHPOLAT T, MAMAT S, ZHANG F. Estimation model of desert soil organic matter content using hyperspectral data. Transactions of the CSAE, 2014, 30(16): 113-120. (in Chinese)
[12] 刘磊, 沈润平, 丁国香. 基于高光谱的土壤有机质含量估算研究.光谱学与光谱分析, 2011, 31(3): 762-766. LIU L, SHEN R P, DING G X. Studies on the estimation of soil organic matter content based on hyper-spectrum. Spectroscopy and Spectral Analysis, 2011, 31(3): 762-766. (in Chinese)
[13] 廖钦洪, 顾晓鹤, 李存军, 陈立平, 黄文江, 杜世州, 付元元, 王纪华. 基于连续小波变换的潮土有机质含量高光谱估算. 农业工程学报, 2012, 28(23): 132-139. LIAO Q H, GU X H, LI C J, CHEN L P, HUANG W J, DU S Z, FU Y Y, WANG J H. Estimation of fluvo-aquic soil organic matter content from hyper-spectral reflectance based on continuous wavelet transformation. Transactions of the CSAE, 2012, 28(23): 132-139. (in Chinese)
[14] NOCITA M, STEVENS A, TOTH G, PANAGOS P, WESEMAEL B V,MONTANARELLA L. Prediction of soil organic carbon content by diffuse reflectance spectroscopy using a local partial least square regression approach. Soil Biology & Biochemistry, 2013, 68(1):337-347.
[15] GE Y, MORGAN C L S, GRUNWALD S, BROWN D J, SARKHOT D V. Comparison of soil reflectance spectra and calibration models obtained using multiple spectrometers. Geoderma, 2011, 161(3/4):202-211.
[16] GOMEZ C, ROSSEL R A V, MCBRATNEY A B. Soil organic carbon prediction by hyperspectral remote sensing and field vis-NIR spectroscopy: an Australian case study. Geoderma, 2008, 146(3/4):403-411.
[17] ROSSEL R A V, BEHRENS T. Using data mining to model and interpret soil diffuse reflectance spectra. Geoderma, 2010, 158(1/2):46-54.
[18] ROSSEL R A V, WALVOORT D J J, MCBRATNEY A B, JANIK L J,SKJEMSTAD J O. Visible, near infrared, mid infrared or combined diffuse reflectance spectroscopy for simultaneous assessment of various soil properties. Geoderma, 2006, 131(1/2): 59-75.
[19] CLARK R N, KING T V V, KLEJWA M, SWAYZE G A, VERGO N. High spectral resolution reflectance spectroscopy of minerals. Journal of Geophysical Research Solid Earth, 1990, 95(B8): 12653-12680.
[20] SANKEY J B, BROWN D J, BERNARD M L, LAWRENCE R L. Comparing local vs. global visible and near-infrared (visNIR) diffuse reflectance spectroscopy (DRS) calibrations for the prediction of soil clay, organic C and inorganic C. Geoderma, 2008, 148(2): 149-158.
[21] GUERRERO C, STENBERG B, WETTERLIND J, ROSSEL R A V,MAESTRE F T, MOUAZEN A M, ZORNOZA R., RUIZ-SINOGA J,KUANG B. Assessment of soil organic carbon at local scale with spiked NIR calibrations: effects of selection and extra-weighting on the spiking subset. European Journal of Soil Science, 2014, 65(2):248-263.
[22] ROSSEL R A V, BEHRENS T, BEN-DOR E, BROWN D J,DEMATTÊ J A M, SHEPHERD K D, SHI Z, STENBERG B,STEVENS A, ADAMCHUK V, AICHI H, BARTHÊS B G,BARTHOLOMEUS H M, BAYER A D, BERNOUX M, BOTTCHER K, BRODSKY´ L, DU C W, CHAPPELL A, FOUAD Y, GENOT V,GOMEZ C, GRUNWALD S, GUBLER A, GUERRERO C, HEDLEY C B, KNADEL M, MORRAS H J M, NOCITA M, RAMIREZLOPEZ L, ROUDIER P, RUFASTO CAMPOS E M, SANBORN P,SELLITTO V M, SUDDUTH K A, RAWLINS B G, WALTER C,WINOWIECKI L A, HONG S Y, JI W. A global spectral library to characterize the world's soil. Earth-Science Reviews, doi: 10.1016/ j.earscirev.2016.01.012.
[23] WETTERLIND J, STENBERG B. Near-infrared spectroscopy forwithin-field soil characterization: small local calibrations compared with national libraries spiked with local samples. European Journal of Soil Science, 2011, 61(6): 823-843.
[24] GOGÉ F, GOMEZ C, JOLIVET C, JOFFRE R. Which strategy is best to predict soil properties of a local site from a national Vis-NIR database? Geoderma, 2014, 213: 1-9.
[25] GUERRERO C, ZORNOZA R, GÓMEZ I, MATAIX-BENEYTO J. Spiking of NIR regional models using samples from target sites: effect of model size on prediction accuracy. Geoderma, 2010, 158(1/2):66-77.
[26] 史舟, 王乾龙, 彭杰, 纪文君, 刘焕军, 李曦, ROSSEL R A V. 中国主要土壤高光谱反射特性分类与有机质光谱预测模型. 中国科学: 地球科学, 2014, 44(5): 978-988. SHI Z, WANG Q L, PENG J, JI W J, LIU H J, LI X, ROSSEL R A V. Development of a national VNIR soil-spectral library for soil classification and prediction of organic matter concentrations. Science China: Earth Sciences, 2014, 44(5): 978-988. (in Chinese)
[27] 栗丽, 王曰鑫, 王卫斌. 采煤塌陷对黄土丘陵区坡耕地土壤理化性质的影响. 土壤通报, 2010, 41(5): 1237-1240. LI L, WANG Y X, WANG W B. Effects of mining subsidence on physical and chemical properties of soil in slope land in hilly-gully region of Loess Plateau. Chinese Journal of Soil Science, 2010, 41(5):1237-1240. (in Chinese)
[28] 焦晓燕, 王立革, 卢朝东, 郜春花, 董二伟, 刘鑫. 采煤塌陷地复垦方式对土壤理化特性影响研究. 水土保持学报, 2009, 23(4):123-125. JIAO X Y, WANG L G, LU C D, GAO C H, DONG E W, LIU X. Effects of two reclamation methodologies of coal mining subsidence on soil physical and chemical properties. Journal of Soil and Water Conservation, 2009, 23(4): 123-125. (in Chinese)
[29] 彭杰, 张杨珠, 周清, 庞新安, 伍维模. 土壤理化特性与土壤光谱特征关系的研究进展. 土壤通报, 2009, 40(5): 1204-1208. PENG J, ZHANG Y Z, ZHOU Q, PANG X A, WU W M. The progress on the relationship physics-chemistry properties with spectrum characteristic of the soil. Chinese Journal of Soil Science,2009, 40(5): 1204-1208. (in Chinese)
[30] 鲍士旦. 土壤农化分析. 3版. 北京: 中国农业出版社, 2013: 30-34. BAO S D. Soil Agricultural Chemistry Analysis. 3rd ed. Beijing:China Agriculture Press, 2013: 30-34. (in Chinese)
[31] BILGILI A V, ES H M V, AKBAS F, DURAK A, HIVELY W D. Visible-near infrared reflectance spectroscopy for assessment of soil properties in a semi-arid area of Turkey. Journal of Arid Environments,2010, 74(2): 229-238.
[32] SAVITZKY A, GOLAY M J E. Smoothing and differentiation of data by simplified least squares procedures. Analytical Chemistry, 1964,36(8): 1627-1639.
[33] 唐启义, 冯明光. DPS数据处理系统. 北京: 科学出版社, 2007:553-558. TAO Q Y, FENG M G. DPS Data Processing System. Beijing:Science Press, 2007: 553-558. (in Chinese)
[34] 韩云霞, 李民赞, 李道亮. 基于光谱学与遥感技术的矿区废弃地土壤特性参数分析. 吉林大学学报, 2009, 39(1): 254-257. HAN Y X, LI M Z, LI D L. Estimation of soil properties in mine wasteland based on spectroscopy and remote sensing. Journal of Jilin University, 2009, 39(1): 254-257. (in Chinese)
[35] LI S, JI W J, CHEN S C, PENG J, ZHOU Y, SHI Z. Potential of VIS-NIR-SWIR spectroscopy from the Chinese soil spectral library for assessment of nitrogen fertilization rates in the paddy-rice region,China. Remote Sensing, 2015, 7: 7029-7043.
[36] HU X Y. Application of visible/near-infrared spectra in modeling of soil total phosphorus. Pedosphere, 2013, 23(4): 417-421.
(责任编辑 杨鑫浩,岳梅)
Hyperspectral Prediction of Soil Organic Matter Content in the Reclamation Cropland of Coal Mining Areas in the Loess Plateau
NAN Feng, ZHU Hong-fen, BI Ru-tian
(College of Resources and Environment, Shanxi Agricultural University, Taigu 030801, Shanxi)
Abstract:【Objective】 In terms of the problems in the Loess Plateau, such as many hills, complex topography, low soil organic matter content (SOMC), sampling difficulties, large areas of land damage caused by mining activities and so on, the object ofthis study is to provide an alternative method for the rapidly quantitative monitoring and evaluation of the SOMC in the process of land reclamation and comprehensive renovation. 【Method】 Taking the cropland soil in the coal mining areas in Xiangyuan County,Shanxi Province was picked as research object, 152 soil samples were collected from the intermediate strip area of land destruction region in a north to south direction. The physical and chemical properties of the soil samples were analyzed. At the same time, the raw hyperspectral reflectance (R) of the soil samples was measured by the standard procedure with an ASD FieldSpec 3 instrument equipped with a high intensity contact probe under the laboratory conditions. The raw spectral reflectance (R) were pretreated by the smoothing or denoising methods of multiplication scatter correction (MSC), baseline offset correction (BOC) and Savitzky-Golay filter in the ParLes 3.1 software. And the raw spectral reflectance (R) was transformed into two types of spectra, which were first order differential reflectance (D (R)) and inverse-log reflectance (lg (1/R)), to analyze the correlation coefficients between the three spectra and their SOMC. Then the significant bands were extracted by the significant correlation coefficients (P=0.01) of the three spectra with the SOMC. Finally, based on the full bands (400-2 400 nm) and significant bands of the three spectra, the hyperspectral predicting models of the SOMC were established by the method of partial least squares regression (PLSR). The optimal models were determined by the assessing indices of predicting accuracies, including coefficient of determination (R2), root mean square error (RMSE), and residual prediction deviation (RPD). 【Result】 The spectra in the bands of 400-1 800 and 1 880-2 400 nm for the raw spectral reflectance (R), 420-790, 1 020-1 040, and 2 150-2 200 nm for D (R), and 400-1 830 and 1 860-2 400 nm for lg (1/R), were significantly correlated with SOMC (P=0.01). And the maximum correction coefficients between the three spectra and their SOMC were 800 nm of the raw spectral reflectance (R), 600 nm of D (R), and 760 nm of lg (1/R). After the transformation of D (R), there were prominent differences among the absorption peaks of the spectral curves in different soil samples, and their correlation coefficients were improved from the value of 0.72 to that of 0.82 in the range of visible bands (400-800 nm). The models of significant bands could obtain better predicting accuracies compared with that of full bands by the method of PLSR. Among the three spectra, the predicting accuracy of lg (1/R) was the best, and R2, RMSE of the calibration dataset were 0.95 and 7.64, while R2,RMSE, and RPD of the validation dataset were 0.85, 3.00, and 2.56, respectively. For the models of R-PLSR and lg (1/R)-PLSR of full bands, the predicting abilities were good. The R2, RMSE, and RPD of R-PLSR were 0.79, 3.64, and 2.10, respectively. And the coefficient of R2, RMSE and RPD of lg (1/R)-PLSR were 0.79, 3.53, and 2.17, respectively. However, for the model of D (R)-PLSR,the predicting SOMC were only roughly estimated, and the indices of the predicting accuracies were not satisfying. R2, RMSE and PRD of the D (R)-PLSR were 0.61, 5.43, and 1.41, respectively. Finally, by analyzing the predicting accuracies of the three spectra in both full bands and significant bands, it was found that the models of R-PLSR, D (R)-PLSR and lg (1/R)-PLSR in significant bands achieved desirable predicting effect.【Conclusion】 In the study area, soil spectral reflectance has a high correlation with SOMC, and PLSR is a good method to establish the predicting model of SOMC.
Key words:coal mining areas; reclamation cropland; soil organic matter content (SOMC); hyperspectral; partial least squares regression (PLSR)
收稿日期:2016-01-28;接受日期:2016-03-30
基金项目:国土资源部公益性行业科研专项(201411007)、山西农业大学科技创新基金项目(201307)