DEM分辨率对苏北地区耕地土壤有机碳制图精度的影响研究*

2022-09-14 09:14吴启航曹文琦陈婧妍刘绍贵于东升史学正邢世和张黎明
中国农业资源与区划 2022年7期
关键词:样点土壤有机苏北

毋 亭,吴启航,曹文琦,陈婧妍,刘绍贵,于东升,史学正,邢世和,张黎明

(1.福建农林大学资源与环境学院,福州 350002;2.土壤生态系统健康与调控福建省高校重点实验室,福建福州 350002;3.扬州市农业环境监测站,江苏扬州 225603;4.中国科学院南京土壤研究所土壤与农业可持续发展国家重点实验室,江苏南京 210008)

0 引言

土壤有机碳(Soil Organic Carbon,SOC)是全球碳库的重要组成部分,它的减少一方面会导致耕地质量急速下降从而威胁粮食安全,另一方面也会导致大气二氧化碳(CO2)浓度升高从而加剧全球气候变暖[1]。因此,土壤固碳既是保障国家粮食安全的有效手段,也是缓解气候变化的重要措施。高精度土壤有机碳制图是深刻理解土壤有机碳时空演变特征的基础,它对于实现精细化土壤碳固定具有重要作用[2]。一般认为,影响土壤有机碳制图精度的环境因子包括地形、气候、植被、土壤、成土母质、位置和时间[3]等,其中,地形因子能解释区域土壤有机碳方差的大部分[4],因而被超过80%的研究者作为主要制图因子[5,6]。

数字高程模型(Digital Elevation Model,DEM)是提取地形因子的源数据,它的分辨率大小影响区域地貌形态空间特征的表达程度[7],是土壤有机碳制图精度的重要影响因子[8]。有研究表明,高分辨率DEM是复杂地貌区改善土壤有机碳制图精度的最优选择[9],而低分辨率DEM就足以保障平坦地貌区土壤有机碳的制图精度[10,11]。然而,目前针对平坦地貌区的相关研究往往假设研究区内部地形地貌差异较小,而对土壤有机碳制图精度影响不大。但现实情况下该假设并不总是成立,平坦地势也存在局部地貌形态有较强变异的可能。当区域整体平坦而局部地形变异程度较大时,DEM分辨率的选择就会通过影响区域地貌形态空间差异的表达程度而对土壤有机碳制图精度产生影响。因此,在局部地形变异程度较大的平坦地貌区,选择适宜分辨率的DEM进行土壤有机碳制图是非常必要的。近10年来,随机森林算法广泛应用于平原[10]、高原[12,13]和戈壁[14]等多种形态地貌的土壤有机碳制图。该算法通过随机有放回抽样防止过拟合,利用多棵树求平均规避噪声与异常值,因而能够最小化模型本身对土壤有机碳制图精度的影响,避免非环境因子对定量化不同分辨率DEM下土壤有机碳制图精度的干扰。此外,该算法也能够高效处理高维大数据集,可较好地应对宏观尺度上数据量过大或者DEM衍生的地形因子过多等问题,被认为是定量化大区域土壤有机碳制图精度影响的有力工具[15]。

基于此,文章以江苏北部(简称“苏北地区”)耕地为案例区,基于2008年原农业部测土配方施肥项目采集的1 185个土壤表层(0~20 cm)样点数据,利用随机森林算法构建不同DEM分辨率下土壤有机碳含量同地形、土壤、植被、成土母质、气候和地理位置等环境变量的关系模型,预测研究区耕地土壤有机碳含量的空间分布特征,分析DEM分辨率对土壤有机碳制图精度的影响程度,并揭示其内在作用机理,结果可为我国局部地形复杂的平原地貌区农田土壤有机碳制图精度的提高提供理论依据。

1 数据与方法

1.1 研究区概况

江苏北部(简称“苏北”)地区(图1)位于北纬32°~35°20′与东经116°20′~121°20′之间,包含连云港、徐州、宿迁、淮安和盐城5个地级市。基于土地利用类型数据的统计结果表明,2008年研究区耕地面积约为2 865.8 km2,其中水田占耕地总面积的36.61%,旱地占耕地总面积的63.39%。研究区的土壤类型主要有8种,其中潮土与盐土面积最大,分别占耕地总面积的52.67%与24.31%;成土母质14种,主要以黄泛冲积物和河海相沉积物为主,分别占研究区耕地总面积的37.94%和20.12%。

图1 研究区地理位置及高程分布

苏北地区99.9%的耕地高程小于200 m,属于平原区;其中,连云港、宿迁、淮安和盐城境内高程普遍低于或等于全域均值,而徐州境内高程普遍高于全域均值。此外,通过分析30 m分辨率的DEM表明,研究区的高程、坡度、平面曲率和剖面曲率表面变异系数分别为57.9%、114.7%、714.1%和740.1%,这说明苏北地区耕地局部地形存在明显的差别。

1.2 数据来源

2008年苏北地区1∶10万土地利用现状图、年度植被指数(Normalized Difference Vegetation Index,ND‐VI)空间分布数据集,以及2006—2008年研究区逐年降水量与逐年均温空间插值数据集(1000 m分辨率),均来自中国科学院资源环境科学数据中心(http://www.resdc.cn/Default.aspx)。30 m分辨率的数字高程模型(Digital Elevation Model,DEM)提取于2015年发布的全球DEM数据,该数据由日本METI和美国NASA联合研制的先进星载热发射和反辐射计(ASTER)数据计算生成,是目前大区域尺度常用最精细的DEM。1∶5万土壤数据库来自全国第二次土壤普查,该数据库包含土壤类型、成土母质、有机质、全氮、全磷和全钾等土壤信息。2008年土壤表层(0~20 cm)样点数据源自于农业农村部江苏省测土配方项目。

1.3 环境变量的筛选

McBratney[3]于2003年提出土壤有机碳制图的一般性框架,并命名为“scorpan-SSPFe(soil spatial pre‐diction function with spatially auto-correlated errors)”,公式为:

式(1)中,S为土壤有机碳,它是土壤(s:s oil)、气候(c:c limate)、生物植被(o:o rganisms)、地形(r:r elief)、成土母质(p:p arent materials)、时间(a:a ge)和空间位置坐标(n:coordi n ate)的函数,e为空间自相关误差(spatially auto-correlatede rrors)。

基于此框架,该研究首先选择土壤类型、土地利用方式、多年平均年降雨量(2006-2008年逐年年降雨量的平均值)、多年平均年均温(2006—2008年逐年年均温的平均值)、归一化植被指数、高程、坡度、坡向、平面曲率、剖面曲率、地形位置指数、地形粗糙度、汇聚指数和成土母质14个环境变量作为构建随机森林预测模型的初始变量(表1)。然后,利用初始变量间的相关性系数(表2)去除冗余变量以减少模型计算量,具体评价过程为:地形位置指数与平面曲率,以及地形位置指数与剖面曲率的相关性均大于0.75,属于强相关,因此剔除地形位置指数;坡度与地形粗糙指数、剖面曲率与平面曲率的相关性分别为0.75和0.69,属于强与较强相关,根据4个变量与其他所有变量间的平均相关性大小,去除平均相关性相对较大的剖面曲率与地形粗糙指数。最终,有11个变量(表1非加粗变量)参与随机森林模型的构建与土壤有机碳含量的预测。

表1 影响土壤有机碳制图的环境变量

表2 环境变量相关系数矩阵

1.4 数据处理

1.4.1 训练集与验证集的构建为定量化苏北地区耕地土壤有机碳含量的预测精度,将研究区内1 182个土壤表层样点划分为相互独立的训练集与验证集两个集合。其中,验证集中包含118个样点,占研究区总样点数量的10%,该样点基于Biswas等提出的[16]成土母质单元分层随机采样方法从1 182个土壤样点中提取获得,式(2)。验证集覆盖研究区内的所有成土母质,因而对于整个苏北地区的环境特征具有一定代表性。其余1 064个样点组成训练集用于随机森林模型的构建。

式(2)中,Ni是分层重采样后成土母质i范围内包含的验证点数量,Mi是分层重采样前成土母质i范围内包含的总样点数量。分层重采样后各类成土母质所包含验证点的数量以及训练样点与验证样点的空间分布分别见表1与图2。

图2 训练样点集与验证样点集空间分布

1.4.2 多分辨率环境变量数据库的构建

基于ArcGIS10.2软件,分别以1×1、2×2、3×3、4×4、5×5、6×6、7×7、8×8、9×9和10×10单元格大小的窗口对30 m分辨率的DEM进行均值平滑,获得10个分辨率分别为30 m、60 m、90 m、120 m、150 m、180 m、210 m、240 m、270 m和300 m的DEM数据集,并提取各分辨率DEM下的相关地形因子。此外,也分别生成30 m、60 m、90 m、120 m、150 m、180 m、210 m、240 m、270 m和300 m的土壤类型、成土母质、归一化植被指数、多年平均年降雨量和多年平均年均温等因子的栅格数据集,构建多分辨率环境变量数据库。

表3 各成土母质范围内验证点数量

1.5 偏度与峰度系数

偏度SKEW,式(3)与峰度KURT,式(4)是描述数据整体分布形态特征的统计量,二者均需要与标准正态分布相比较[17]。偏度描述数据分布的对称性:偏度为0时,数据关于均值对称分布;偏度大于0时,数据分布形态与正态分布相比表现为右偏;偏度小于0时,数据分布形态与正态分布相比表现为左偏。峰度描述数据分布的陡缓程度:峰度为0时,数据分布形态与正态分布的陡缓程度相同;峰度大于0时,数据分布形态比正态分布更陡峭;峰度小于0时,数据分布比正态分布更平缓。

式(3)(4)中:n为土壤有机碳观测值数量,Xi为第i个土壤有机碳观测值,为土壤有机碳观测值的平均值,S为土壤有机碳观测值的标准差。

2 结果分析

2.1 苏北耕地区域土壤有机碳含量观测值的统计特征

苏北地区1 182个耕地表层样点的土壤有机碳含量介于4.41~23.78 g/kg,平均值和标准差分别为10.12 g/kg和2.58 g/kg,基本符合正态分布(图3)。此外,1 182个表层样点的土壤有机碳含量概率分布的偏度系数(Skewness)为0.68,与平均值(10.12 g/kg)、标准差(2.58 g/kg)的正态分布相比,中心值稍微向左偏移,表明该地区土壤有机碳含量小于均值的样点数量较多;峰度系数(Kurtosis)为3.38,与平均值和标准差的正态分布相比,具有较强峰度,表明该地区分布在平均值附近的样点数量较多。

图3 土壤有机碳含量观测值的频率分布直方图及其统计特征

2.2 不同分辨率DEM下土壤有机碳含量预测值差异分析

基于1 064个训练样点以及不同DEM分辨率下的11个环境变量数据集,分别构建随机森林模型,预测不同分辨率下的苏北地区耕地土壤有机碳含量,结果见图4。

图4 不同DEM分辨率下土壤有机碳含量预测

2.2.1 不同DEM分辨率下土壤有机碳含量预测值主要影响因子差异

因子重要性指数可以评估各环境变量对于土壤有机碳含量的重要性,某一环境变量的因子重要性越高代表该变量对土壤有机碳含量高低值的影响程度就越大,也表明该变量对土壤有机碳含量的预测越重要[18,19]。由图5可以看出,不同DEM分辨率下对土壤有机碳含量预测最重要的3个因子皆是多年平均年降雨量、多年平均年均温和高程,且三者重要性之和占比在42.89%~46.59%。气温与降水影响植被的生长、土壤凋落物的输入与分解速率、微生物的生存环境和土壤含水量等[20],与土壤有机碳的固定与分解过程密切相关,因此对苏北地区耕地土壤有机碳含量的高低有重要影响。高程影响区域水分条件、土壤表层风化速度与土壤温度等的空间分布[21],也是影响苏北地区耕地土壤有机碳含量空间差异的关键因子。气候与高程因子对苏北地区耕地土壤有机碳含量影响作用的主导地位说明:(1)通过增加土壤有机碳含量以减少温室气体排放这一措施,可以进一步保障粮食安全和农业可持续发展;(2)DEM分辨率能通过影响高程空间分布差异的表达程度,对该研究区土壤有机碳含量的预测产生重要影响。从图5还可以看出,当DEM分辨率在[150 m,180 m,210 m,240 m,270 m,300 m]区间变化时,因子重要性序列基本保持不变,说明各因子对土壤有机碳含量的相对影响作用在此分辨率区间趋于稳定。产生这一现象的原因主要有两个:(1)环境因子在各自特定的作用空间尺度通过相互作用对土壤有机碳含量产生影响[22]。当DEM分辨率大于主要影响因子的作用空间尺度时,主导因子的影响作用减弱且趋于稳定,从而导致全部因子的相互作用也趋于稳定。(2)当DEM分辨率大于等于150 m时,各影响因子的空间分布特征因“概化”作用损失的细节达到上限,空间分布差异在此分辨率范围内呈现稳定态势,因而各因子对土壤有机碳含量空间分布的影响作用也就趋于稳定。

图5 不同分辨率下各环境变量的重要性

该研究也基于土壤、气候、地形、植被与成土母质5种分类统计同类环境因子的重要性之和,作出各类因子的重要性随分辨率变化的趋势图(图6)。可以看出,不同DEM分辨率下5类因子的重要性皆为:地形>气候>植被>土壤>成土母质,这主要与各类因子作用空间尺度相对大小是固定的有关。例如:地形因子反映的是局部地形特征,作用空间尺度小且空间分布差异较大,因而对土壤有机碳空间分布差异的贡献就比较多;但成土母质的斑块覆盖空间范围相对比较广阔,作用空间尺度大且空间分布差异较小,因而对土壤有机碳空间分布差异的贡献就相对较少。此外,从图6还可以看出,不同分辨率下地形因子重要性占比均在42.04%~50.65%取值,说明地形因子对本地区土壤有机碳含量预测的影响始终占绝对主导地位,这也与Huang等[8]和Taghizadeh-Mehrjardi等[4]的研究结果相一致。

图6 各类因子总重要性随分辨率变化的特征

2.2.2 不同DEM分辨率下土壤有机碳含量预测值的精度差异

基于验证点集计算不同分辨率DEM下苏北地区耕地土壤有机碳含量预测值的均方根误差(图7)。可以看出,土壤有机碳含量的预测精度随分辨率的变化呈现不规律波动,在DEM分辨率为60 m时预测精度达到最高(均方根误差为2.21 g/kg),而在DEM分辨率为120 m和300 m时预测精度降为最低(均方根误差均为2.30 g/kg),预测精度的最高与最低值相差4.07%,这说明并不是DEM分辨率越高土壤有机碳的预测精度就越高,盲目追求最高分辨率DEM下的土壤有机碳制图不仅不会提高精度,还会增加大量劳力、物力与财力成本。因此,合理地选择适宜DEM分辨率在高精度土壤有机碳制图中是非常必要的。

图7 土壤有机碳含量预测精度随分辨率的变化特征

从图7也进一步看出,苏北地区耕地土壤有机碳预测精度随DEM分辨率的变化呈现二分式阶段性分布。以150 m为临界点,当DEM分辨率在30~150 m内增加时,均方根误差呈现“N”字形变化;此时,土壤有机碳含量预测精度与分辨率并无明显的线性关系;而当DEM分辨率在150~300 m内增加时,均方根误差整体表现为递增趋势,即土壤有机碳含量预测精度整体在降低,这是因为该范围内地形因子的影响力已相对减弱,地形、气候、植被、土壤与成土母质对土壤有机碳的作用强度趋于稳定,也导致不同DEM分辨率下这5类因子对土壤有机碳含量的综合影响力没有显著差异,它们影响力变化导致的预测误差可忽略不计。但值得注意的一点是,随着DEM分辨率的增加,地形空间变异因“概化”作用而缺乏细节的表达,进而通过预测模型的传递和累积,导致土壤有机碳含量的预测精度呈降低趋势。

2.2.3 不同DEM分辨率下土壤有机碳含量预测值的统计特征差异

不同DEM分辨率下苏北地区耕地土壤有机碳含量预测值皆在(图8a)6.78~15.7 g/kg,该研究采用自然断点法将该取值范围分成5级:6.78~8.78 g/kg、8.79~9.33 g/kg、9.34~10.01 g/kg、10.02~11.47 g/kg和11.48~15.7 g/kg,并分别统计不同分辨率下土壤有机碳含量预测值在5个值域范围内的取值比例(图8b)。

图8 不同分辨率下土壤有机碳含量预测数据集的统计特征

从图8a可以看出,不同DEM分辨率下苏北地区耕地土壤有机碳含量预测的最小值均大于样点处的观测最小值,而预测的最大值、平均值和变异系数则分别小于相应观测最大值、平均值和变异系数;其中,变异系数的差异最大,一般在69.82%~74.23%,而平均值的差异较小,一般在3.46%~8.40%,这说明无论DEM分辨率高还是低,基于随机森林算法的研究区土壤有机碳预测值离散度都小于观测值离散度,但预测值的变异程度却明显高于观测值。苏北地区耕地的整体环境特征空间差异大于样点处,也就是说训练空间的特征多样性小于预测空间;然而,随机森林预测模型是基于训练空间构建的,如若训练空间的环境特征仅是预测空间的一部分,那么预测模型在预测空间的普遍适用性就相对较弱,预测能力也会随之减小从而导致误差较大。在该研究中,训练样点的预测误差在1.04~1.11 g/kg,远小于预测空间的误差,训练样点所代表的区域环境空间特征由样点数量及其空间分布所决定,这也说明土壤样点的数量与其空间分布都是影响土壤有机碳预测精度的重要因素。

由图8a还可以看出,研究区土壤有机碳含量预测结果的最大值、最小值、平均值与变异系数随DEM分辨率的变化也呈二分式阶段性分布(图8a)。同样以150 m为分界,界线以左,4个统计特征值随DEM分辨率的增加呈现较明显的波动变化,而界线右边,4个统计特征值随DEM分辨率的增加呈现较为平缓的走向。当DEM分辨率大于150 m时,地形、土壤、植被、气候和成土母质5类因子的影响作用强度趋于稳定,从而导致土壤有机碳含量预测的最大值、最小值、平均值与变异系数等统计特征较为相似。

从苏北地区耕地土壤有机碳预测值在不同区间的分布来看(图8b),30 m分辨率的土壤有机碳含量预测值在不同区间的统计分布特征与其他分辨率的差异较大,在该分辨率下土壤有机碳含量预测值在8.79~9.33 g/kg分布最多,占整个区域面积的40%,而其余分辨率下预测值均是在9.34~10.01 g/kg分布最多,所占面积占整个区域面积的47%~53%;此外,30 m分辨率时,76%的区域土壤有机碳含量预测值在8.79~11.47 g/kg,而其他分辨率下,大约88%~91%的区域土壤有机碳含量预测值分布在此区间范围内。这主要是地形和气候因子单一或共同作用造成的,不同DEM分辨率下,地形和气候因子对苏北地区耕地土壤有机碳含量预测的影响作用均超过75%,在5类因子中占主导地位[23]。

2.2.4 不同DEM分辨率下土壤有机碳含量预测值的空间分布差异

不同DEM分辨率下苏北地区耕地土壤有机碳含量预测值在空间分布上存在明显的差异(图4)。在DEM分辨率为30 m时,6.78~8.78 g/kg范围的低值区域主要分布在盐城,此处高程普遍为0~19 m;而其他分辨率下此低值区域则主要分布在徐州,此处高程普遍为20~56 m。此外,在DEM分辨率≥150 m时,土壤有机碳含量的较高值区域所占面积比与空间分布特征均较为相似,即所占面积比例都大约为1/4,空间上都主要分布于宿迁中南部、淮安北部、连云港东南部以及盐城东南部。可见,分辨率≥150 m时,各类因子相互作用趋于稳定,土壤有机碳含量预测值的空间分布特征也较为相似。

3 讨论

地形因子,如高程、坡向和坡度等通过再分配土壤温度、水分等影响土壤有机碳的输入和输出,是土壤有机碳预测制图的重要环境因子[8]。以往平坦地区的土壤有机碳制图往往认为该地貌类型下地形对土壤有机碳的影响较小[7,11],但该研究结果表明,在整体平坦但局部地形差异较大的区域,若选择分辨率较粗的DEM进行土壤有机碳预测制图,会因局部地形信息的丢失而导致预测误差较大。进一步的研究也表明,在DEM分辨率选择上并不是越精细就越好,该次研究中,30 m分辨率下的土壤有机碳含量预测精度小于60 m分辨率,这说明DEM分辨率的选择中仅仅依赖于主观认知就认为选择较粗分辨率“即可”,可能会导致预测精度不佳,或者认为选择最细分辨率“最优”,又可能会导致计算或数据获取成本增加。可见,即使在平坦地区的土壤有机碳制图中,选择适宜的DEM分辨率以达到成本与精度相平衡是十分必要的。

该研究中苏北地区耕地土壤有机碳含量预测误差的来源主要有两个:(1)土壤样点所代表的环境特征差异小于整个区域,这使得基于训练样点构建的随机森林模型在全区域的适用性较低从而成为误差来源;(2)环境变量的源数据尺度不匹配。在该研究中,高分辨率地形因子数据与大比例尺土壤数据库的信息较为详细,而低分辨率气候与植被数据的信息则较粗略,为实现叠加运算必须进行数据聚合与数据重采样,而这样的多源数据尺度匹配过程因为信息细节的丢失与重计算不可避免地会引入误差[24]。

4 结论

数字高程模型(DEM)的分辨率大小决定区域地貌形态的表达程度,对土壤有机碳制图有重要影响。从该研究来看,当DEM分辨率小于150 m时,各个环境因子与各类环境因子的影响作用强度不同,导致苏北地区耕地土壤有机碳含量预测的统计与空间分布特征存在较大差异,土壤有机碳含量预测精度表现为波动变化;而当DEM分辨率在大于150 m时,各类影响因子的影响作用强度较为稳定,研究区土壤有机碳含量预测的统计与空间分布特征较为相似,但随着DEM的“概化”,环境特征丢失大量空间细节信息,导致土壤有机碳制图精度呈现整体减小趋势。可见,即使对于局部地形变异程度较大的平坦地区而言,筛选适宜的DEM分辨率是土壤有机碳制图中不可缺少的环节。

猜你喜欢
样点土壤有机苏北
小麦条锈病田间为害损失的初步分析
黑土根际土壤有机碳及结构对长期施肥的响应
氮添加对亚热带常绿阔叶林土壤有机碳及土壤呼吸的影响
基于空间模拟退火算法的最优土壤采样尺度选择研究①
CSAMT在苏北月亮湾地热勘查中的应用
农田灌溉用水量统计工作中的样点灌区选取方法研究
上海市林地土壤有机碳分布特征及其与土壤理化性质的关系
长期施肥对褐土有机碳矿化的影响
秦吉鸟,只为懂爱的人传情
养猪发酵床垫料微生物类群结构特性分析