沈佳丽,陈颂超,胡碧峰,李硕*
(1.华中师范大学地理过程分析与模拟湖北省重点实验室,武汉 430079;2.浙江大学杭州国际科创中心,杭州 311200;3.江西财经大学旅游与城市管理学院,南昌 330013)
土壤有机碳(Soil Organic Carbon,SOC)作为陆地碳库的主体,是农田生态系统可持续发展的重要基石。SOC 的巨大存量及长期流转在陆地碳库的源汇平衡和粮食生产等一系列生态系统服务中发挥着重要作用[1−2]。因此,厘清SOC 空间分异并准确估算SOC 储量,对于保障国家农业可持续发展和生态文明建设至关重要。受植物根系和农业土地利用方式的影响,富含SOC 的土体表层(0~30 cm)得到广泛关注。然而深层土壤(>30 cm)的SOC 储量约占1 m 深度的45%~55%[3−4],也是碳循环的活跃部分。数字土壤制图是以土壤−景观模型为理论基础,以空间分析和数学方法为技术手段的土壤调查与制图方法,相较于传统手工土壤制图更加高效和可信。地统计、确定性插值、数理统计和模糊推理方法在中小尺度上取得了较高的精度,而在大尺度下机器学习方法的优势更明显[5]。这是因为一方面在大尺度、多环境因子交互作用下,土壤属性与环境因子呈现非线性关系;另一方面,目前的采样密度往往过于稀疏,不足以使样点在大尺度范围内表现出空间自相关性[6]。机器学习模型通过提取土壤属性与环境变量之间的关系预测土壤属性的空间分布,可以克服土壤属性与环境变量的非线性问题[7]。江汉平原作为长江经济带的重要构成区,其SOC 含量或储量估算的研究大多局限于利用地统计插值的方法,且研究深度多集中于表土(0~20 cm)[8−10]。在对最新土壤信息的需求愈发增强的背景下,准确表征SOC 水平和垂直空间变化对推进“双碳”目标的决策支持具有重要的现实意义。本研究利用历史土壤剖面数据结合机器学习算法,绘制高精度SOC 含量数字土壤图并预测江汉平原1 m 深度的SOC 储量。
江汉平原属亚热带湿润季风气候。其南抵长江,北沿汉江,西经沙市,东达武汉,平均海拔27 m,面积2×104km2。研究区内河湖众多,耕作历史悠久,主要种植作物有水稻、棉花、油菜等。本研究使用2017 年版《中国土系志·湖北卷》中2009—2012 年的土壤调查数据[11],共计66个土壤剖面(图1)。
图1 研究位置和样点分布图Figure 1 The location of the study region and soil sampling sites
依据《土壤调查实验室分析方法》[12],土壤容重依据环刀法测定,土壤有机质分析采用重铬酸钾−硫酸消化法测定,SOC 含量由有机质含量经Blemmelen 系数(0.58)换算而得。本研究在软件Spline Tool V2.0中采用等面积二次样条函数(λ=0.000 1)将不同发生层采样深度的SOC 含量统一转换至0~30、>30~60 cm和>60~100 cm 三个土层深度,即每层66 个样点。各深度SOC 含量的分布特征如表1 所示,SOC 平均含量整体随深度增加而降低。
基于SCORPAN 土壤景观模型[13−14],本研究选择2009—2012 年可获取的地形、气候、生物、土壤质地等数据作为表征SOC 空间变异的环境协变量(表2),不同分辨率的环境协变量经最邻近插值法统一至30 m 空间分辨率,用于空间预测模型和制图。所有环境协变量空间分布如图2所示。
表1 研究区土壤有机碳含量的统计结果Table 1 Statistical results of SOC contents
表2 环境协变量及来源Table 2 Environmental covariates and sources
图2 环境协变量空间分布Figure 2 Spatial distribution of environmental covariates
续图2 环境协变量空间分布Continued figure 2 Spatial distribution of environmental covariates
本研究使用随机森林(Random Forest,RF)算法构建基于环境协变量的SOC含量预测模型。RF是机器学习方法的一种,是基于树的集合模型,将生成的大量独立的树的预测值进行平均得到因变量的预测值。该模型可在不增加偏差的情况下减少总体方差,具有较好的泛化能力,还可评估自变量在模型中的重要性[15]。RF模型有两个关键参数:Mtry(树分支的变量个数)和Ntree(森林中树的个数),通过TuneGrid 优化为1 和500。使用caret软件包的“varImp”函数来确定变量的重要性[16]。使用决定系数(Coefficients of Determina⁃tion,R2)、均方根误差(Root Mean Squared Error,RMSE)、平均误差(Mean Error,ME)来综合评估模型精度,公式如下:
式中:n代表样点数量;yi和分别为观测值和预测值;为观测值均值。
由于研究区总样本数较少,为避免建模验证集合划分策略对各精度指标计算的影响,本研究分别对各土层深度的全部样本进行建模,并采用二十折交叉检验的精度来验证模型精度。所有的数据处理和建模预测均在软件R和ArcGIS中实现。
有机碳密度(SOCD)的计算公式为[17]:
式中:SOCD为有机碳密度,kg·m−2;BD为土壤容重,g·cm−3;SOC为土壤有机碳含量,g·kg−1;H为土层厚度,cm;G为石砾体积分数,%。
运用公式(4)计算有机碳储量(SOCS):
式中:SOCS为土壤有机碳储量,g;i为栅格序号;A为每个栅格的面积,m2。
RF 模型交叉验证的精度如表3 所示。其中,0~30 cm 的模型精度在三个土层深度中最优,其RMSE和ME最小。尽管>60~100 cm 土层的R2略高于>30~60 cm 土层深度,但前者的RMSE和ME也均高于后者,说明>30~60 cm 土层预测模型相较于>60~100 cm土层误差更小。综上,三个评价指标值均呈现出随深度增加而增加的趋势。
表3 不同土层深度的土壤有机碳含量预测精度Table 3 Average prediction accuracy of SOC contents at three different soil depths
图3 为RF 模型预测江汉平原0~30、>30~60 cm和>60~100 cm 三种不同土层深度SOC 含量的空间分布图。江汉平原SOC 含量呈现从表层向深层递减的趋势,中东部及南部地区的SOC 含量较高,主要集中在荆州监利市、荆州洪湖市以及仙桃市三地交壤之处。在表层0~30 cm,潜江市与江陵县SOC 含量较低,江汉平原东部及南部地区SOC含量整体比西部和北部地区高。而在中间层以及深层中,江汉平原除了中部地区SOC 含量较高之外,东部及西北部地区的SOC含量普遍较低。
图3 江汉平原各土层深度的SOC含量分布Figure 3 Distribution of SOC contents at different soil depth in Jianghan Plain
图4为0~30 cm的SOC预测模型中的变量相对重要性,其中,Feature 代表用于建模的所有特征变量(即本研究的环境协变量);Inc Node Purity 代表节点纯度,值越大说明特征变量的重要性越强。气候因子是模型最重要的环境协变量,温度和降水分别排在第一和第三;土壤因子中的黏粒含量排第二。同为生物因子,排第四的净初级生产力(NPP)在模型中的重要性明显高于排第八的归一化植被指数(NDVI)。而高程(DEM)作为地形因子,该环境协变量对模型的重要性最低。综上,研究区内SOC含量的分布受气候因子、土壤因子以及生物因子的显著影响,而受地形因子影响最小。
图4 表层土壤的随机森林模型中各环境因子的相对重要性Figure 4 Relative importance of environmental covariates from RF model in topsoil
经计算,江汉平原0~30、>30~60 cm 和>60~100 cm 的SOCS 分别为74.98、55.59 Tg 和53.18 Tg,1 m 深度总储量为183.75 Tg。SOCS 随土壤深度的增加而减少,但>30~60 cm 和>60~100 cm 的SOCS 约占总储量的59%,表明江汉平原表层以下土壤有机碳储量很丰富。
按照体积对等方式(面积×深度)将本研究结果与张涛[10]对江汉平原0~20 cm 土层的SOCS 估算结果进行了对比(表4),后者通过地统计空间插值的方法,由3 071个第二次全国土壤普查(20世纪80年代)和测土配方施肥数据(2012 年)估算得到,SOCS 为70.56 Tg,与本研究的74.98 Tg 相近但略低。此外,笔者还基于SoilGrids250m 数据对相同区域0~30 cm 土层SOCS 进行了估算,对比后发现该结果(125.25 Tg)远高于本研究。
表4 不同数据来源的江汉平原表层土壤有机碳储量估测结果对比Table 4 Comparison of SOCS estimations in the Jianghan Plain from various data sources
建模方法的选取、模型参数的设置、建模验证集合的划分都会影响模型的精度指标计算。Chen 等[5]在综述大尺度(>10 000 km2)的数字土壤制图工作中指出,均方根误差是最常用的性能指标,其次为决定系数。通常,深层土壤(>30 cm)的SOC预测模型精度不及表层(0~30 cm)[18−19],本研究也得到该结果。这是由于本研究所选用的环境协变量大部分都基于表层获取,如降水、温度、DEM 等,对于深层土壤辐射不够。此外,本研究通过等面积二次样条函数对不同深度间隔的SOC数据进行了转换,这在一定程度上会加剧深层SOC预测的不确定性。
表层SOC 含量较高的区域位于江汉平原腹地的仙桃东部、洪湖市和监利市,该区域是湖北省重要的粮食主产区,也是优质水稻、水产、畜禽集中生产基地。该地区水田资源丰富,总体农业生产空间分布聚集程度高[20],一定程度上有利于SOC 的积累。此外,水田在水稻生长季被约5 cm 深的水层淹没而形成一个水饱和区,土壤中的水饱和度减缓了SOC 分解,进而导致该地区SOC含量较高[21]。
气候因子(降水、温度)对于SOC等土壤属性的预测非常重要,这与以往的研究是相符的[5]。中部地区具有适宜微生物生长的温度,利于SOC 的积累[22]。研究区内SOC 含量(尤其在0~30 cm 土层深度)呈西北向东南方向递增趋势,与区内的气候因子特别是降水的地带性变化吻合。SOC 含量在降水丰富的地区明显增加,这是由于降水与温度的综合作用为SOC的储存与积累提供了适宜的气候条件。此外,在降雨量丰富的地区,雨季地表径流导致土壤中的部分含碳物质发生迁移,造成SOC流失。而在中东部地区有大量湖泊、河流等水域,被带走的SOC 在东部地势更低平的地区沉积,并且这种碳质的沉淀会随着距离增大而逐渐减小[23],最终形成SOC 含量在水域周边较高的现象。降水丰富有助于增加土壤中的含水量,深层土壤中的含水量处于相对稳定的水平,导致降水对深层土壤中SOC积累的影响随深度的增加而降低[21]。
土壤因子是影响SOC 积累的重要因素之一[24−26]。在本研究中,黏粒含量对SOC 的影响最大,其次为粉砂。这是由于黏粒和粉砂的颗粒较砂粒更小,黏性更大,有利于吸附有机物和减少SOC的分解。三个土层深度SOC 含量分布也与其对应深度的黏粒含量变化吻合。江汉平原西北部地区的砂粒含量较高,一定程度上不利于SOC 的积累,从而导致该地区SOC 含量更低。结合图2 和图3 可知,江汉平原的SOC 含量尤其是表层SOC含量随黏粒含量升高而增加。
江汉平原地势低平,除边缘分布有海拔约50 m的平缓岗地和百余米的低丘外,平均海拔在27 m。常用的地形因子有时难以有效刻画平原或地形平缓地区土壤的空间变化[27−28]。本研究先前考察过90 m空间分辨率高程数据,发现其不足以精细表征土壤空间变异,因此选用更精细的30 m 高程数据。虽然在低缓的东部地区SOC含量有所增加,但在中西部地区并未随地形起伏而呈现出较大的变化。这说明在本研究中地形对SOC 含量变化没有显著影响,这与图4中变量重要性结果相吻合。
相较于张涛[10]的研究,笔者不仅估算了表层的SOCS,还估算了30 cm 以下至1 m 深的SOC 总储量。而基于SoilGrids250m 估算的SOCS 远高于本研究,是因其结果是由全球尺度的数据估算而得,在研究区内仅5 个实测样点数据。Liang 等[29]在利用第二次全国土壤普查数据绘制中国有机质基线图时也发现,SoilGrids250m存在普遍高估现象。此外,本研究估算结果的空间分辨率为30 m,较SoilGrids250m 能提供更精细的土壤空间信息。
本研究利用66个历史剖面样点数据,基于9个环境协变量和机器学习模型预测了江汉平原地区1 m土层深度的SOC 含量及储量,并绘制了30 m 高精度SOC分布图,得到如下结论:
(1)随机森林模型预测SOC 含量表现出较好性能,尤其在表层最佳。在选取的9 个环境协变量中,温度、黏粒含量和降水在SOC预测模型中相对重要性较高。研究区内SOC 含量呈现出随黏粒含量升高而增加的趋势。
(2)江汉平原1 m 深土层的有机碳总储量为183.75 Tg,>30~100 cm 土层有机碳储量约占1 m 深度总储量的59%。因此,深层土壤含有丰富的有机碳储量,在估算土壤碳库等相关土壤调查工作时深层土壤信息不容忽视。