黏粒阳离子交换量估测模型的优化研究*

2021-05-22 07:21杨家伟王天巍包莹莹罗梦雨李德成
土壤学报 2021年2期
关键词:细土建模误差

杨家伟,王天巍†,包莹莹,罗梦雨,李德成

(1. 华中农业大学资源与环境学院,武汉430070;2. 土壤与农业可持续发展国家重点实验室(中国科学院南京土壤研究所),南京210008)

黏粒阳离子交换量指在pH 为7 的条件下测定的每千克黏粒中可吸附的全部交换性阳离子量,也称为黏粒CEC7,是《中国土壤系统分类(第三版)》和《美国土壤系统分类》中确定诊断层、诊断特性的重要指标,例如低活性富铁层要求其部分亚层黏粒CEC7<24 cmol·kg–1。但由于土壤黏粒的提取较为耗时费力,在系统分类检索过程中使用的黏粒CEC7通常并非实测结果,而是将黏粒视为细土CEC7的主要贡献因子,通过模型1 由细土CEC7换算得到(以下称为现行模型)[1]。

式中,CEC7(c)为黏粒阳离子量,cmol·kg–1;CEC7为细土阳离子交换量,cmol·kg–1;Cc为每千克细土中黏粒的含量,g·kg–1。

现行模型在我国土壤系统分类检索过程中被广泛使用。但有研究表明,由该模型得到的黏粒CEC7估测值通常高于实测值,造成对高级分类单元的误判[2-3],特别是在南方红壤地区,由于黏粒CEC7估测值大于等于24 cmol·kg–1,可能将富铁土划归为淋溶土或雏形土。现行模型仅考虑了黏粒对细土CEC7的贡献,但目前很多研究表明有机质、粉粒、游离氧化铁等土壤属性均对细土CEC7有贡献[4-9],导致单位质量的黏粒吸附的交换性阳离子量被高估。

本研究以江西省地带性土壤为主要对象,同时搜集相同气候带的其他南方地区土壤数据,将上述土壤属性视为误差因子,探究其对现行模型误差的影响。在此基础上,通过优化模型将误差因子的影响削弱,建立基于主要误差因子的黏粒CEC7估测新模型,提升模型估测结果准确性,为系统分类检索提供可靠数据支持。

1 材料与方法

1.1 研究区概况

研究区域以江西省为主,属中亚热带湿润季风气候,年均温约16.3~19.5 ℃,年降水量约1 341~1 943 mm,降水集中于7—8 月份。地形复杂多样,东、西、南三面环山,北面濒临长江和鄱阳湖,成土母质以泥质岩类风化物、酸性结晶岩类风化物、红砂岩类风化物为主,全省特殊的气候条件使脱硅富铁铝化和生物富集现象强烈,黏粒和次生黏土矿物含量相对丰富,土壤以红壤、黄壤和黄棕壤为主[10-11]。

1.2 样品采集和数据测定

结合江西省地带性土壤分布范围,综合考虑气温、降水、母质、海拔、坡度等因子,进行模糊C均值聚类后确定28 个典型采样点(样点编号1~28),结合野外实际情况,最终挖掘28 个代表性土壤剖面,均采自林、草地。按照中国科学院南京土壤研究所主编的《野外土壤描述与采样手册》[12]要求进行剖面分层观测,并自上而下采集土样,待室内基本理化分析结束后,结合颜色、黏粒胶膜等野外观测数据和颗粒组成、有机质、阳离子交换量、游离铁等室内分析数据,每个样点选取代表性B 亚层样品进一步提取粉粒和黏粒,测定其阳离子交换量。本文使用此B 亚层数据作为建模数据。同时,引用相同气候带的18 个代表性土层数据[4],以丰富数据来源(样点编号29~46),样点分布如图1所示。

图1 样点分布图Fig. 1 Soil sampling sites

土壤样品经过自然风干、挑出杂物后研磨过筛,以备理化性质分析。土壤pH 采用电位法(液土比2.5∶1)测定;有机质采用重铬酸钾外加热法测定;游离氧化铁采用连二亚硫酸钠-柠檬酸钠-碳酸氢钠提取,邻菲罗啉比色法测定;土壤机械组成采用吸管法测定,并根据目前广泛使用的美国农业部制分级,土壤粉粒和黏粒提取采用虹吸法测定,阳离子交换量采用乙酸铵(NH4OAc)pH 7.0 交换法测定[13-14]。引用文献中的粉粒数据通过模型2 从国际制分级数据转换为美国农业部制分级数据[15],对比转换前后的粉粒含量数据,发现差异较小,南方红壤区今后开展此类研究可以考虑忽略二者差异。各样点理化性质如表1 所示。

式中,P2–50为美国农业部制土壤颗粒分级标准对应的粉粒含量,g·kg–1;P2–20为国际制土壤颗粒分级标准对应的粉粒含量,g·kg–1;P20–2000为国际制土壤颗粒分级标准对应的砂粒含量,g·kg–1。

1.3 误差规律确定方法及优化模型形式确定

现行模型估测值高于实测值主要是因为仅考虑了黏粒对细土CEC7的贡献,而忽略了其他因子对细土CEC7的贡献。因此,本研究将其他因子(以下称误差因子)对细土CEC7的贡献视为现行模型的误差d′。

误差d′计算公式为:

式中,CEC7为细土的阳离子交换量,cmol·kg–1;y为实测黏粒阳离子交换量,cmol·kg–1;Cc为每千克细土中的黏粒含量,g·kg–1。

本研究通过消除误差因子对结果的影响来对现行模型进行优化。通过选取适合建模的误差因子,将其与误差d′做线性回归分析得到误差规律D′(形式为yi=a+bxi),代入模型4 得出新的黏粒CEC7估测模型(以下称优化模型):

式中,CEC7(c)为优化后的每千克黏粒CEC7估测值,cmol·kg–1;CEC7为细土阳离子交换量,cmol·kg–1;Cc为每千克细土中黏粒含量,g·kg–1。

表1 土壤基本理化性质Table1 Physiochemical properties of the test soil

续表

1.4 模型精度验证方法

模型精度由决定系数(R2)、平均绝对误差(MAE)、均方误差(MSE)、均方根误差(RMSE)四个参数进行评价,模型的决定系数(R2)越大,模型越稳定,平均绝对误差(MAE)、均方误差(MSE)、均方根误差(RMSE)越小,表明模拟值与实测值之间的偏差越小,即模型的模拟结果越准确、可靠[16]。

2 结 果

2.1 现行模型误差分析及误差因子选取

图2 现行模型估测值和实测值散点图Fig. 2 Scatter plot of measured values and values predicted with the current model

倍。实测值范围在5.73~60.12 cmol·kg–1之间,估测值范围在17.10~230.4 cmol·kg–1之间,分布较为分散,估测值分布范围为实测值2.98 倍~3.83 倍。

现行模型估测值普遍高于实测值的主要原因是其认为在热带和亚热带地区,B 层土壤有机质含量较低,从而仅考虑黏粒对土壤风化B 层细土CEC 的贡献。但研究表明,虽然B 层土壤有机质含量相对A 层有所减少,但并未达到可忽略的程度。以江西省为例,第二次土壤普查数据表明,红壤B 层有机质含量较A 层平均减少62.7%,但仍有约10 g·kg–1;黄壤B 层较A 层平均减少75.0%,但仍有约17.6 g·kg–1[11],而有机质在以1∶1 型黏土矿物和铁、铝氧化物为主的土壤胶体中可以增加其比表面积,提升土壤CEC,且随着采集深度的增加,土壤有机质含量与土壤CEC 之间的相关性逐渐增强[17]。此外,有机质不仅直接对土壤CEC 产生贡献,也可通过与黏粒复合,降低黏粒对土壤阳离子交换量的贡献程度,有机质含量越高,黏粒CEC7的贡献程度越低[6,17]。由图3a)可知,全体样本中有机质与误差呈显著正相关(R2=0.527**,n=46),随着有机质增加,误差值逐渐增大,离散程度逐渐增加,表明有机质含量高低对现行模型估测值误差的影响程度不同。除有机质对现行模型误差的影响之外,粉粒是影响该模型估测准确度的重要因素[3],粉粒中由于含有高岭石、伊利石等黏土矿物,对细土CEC 具有一定的贡献[5]。由图3b)可知,随着粉粒CEC7的增加,误差值有逐渐降低的趋势,但二者相关关系不显著(R2=0.025,n=46)。土壤pH 的变化会直接影响离子吸附作用,也可通过改变土壤表面电荷产生间接影响[18],从而会影响现行模型的精确度。 由图3c)可知,随着土壤pH 的增加,误差值有逐渐降低的趋势,但二者相关关系不显著(R2=0.032,n=46)。此外,土壤pH 对CEC 的影响机理不确切[7],本研究不将其作为主要误差因子参与建模。由图3d)可知,土壤游离氧化铁与误差相关关系不显著(R2=0.085,n=46),且已有研究表明游离氧化铁对土壤CEC7的影响机理较为复杂,在去除游离氧化铁前后,土壤CEC7大小变化不明显[5],因此本研究不将其作为主要误差因子参与建模。表2 为土壤有机质、粉粒CEC7、pH、游离氧化铁分别进行相关性分析的结果,可知不同误差因子之间相关关系均不显著(n=46),其相互关系不会对优化后模型产生影响。

图3 现行模型误差因子与误差相关性Fig. 3 Correlation analysis between error factor and error in the current model

表2 不同误差因子之间相关系数Table2 Correlation coefficients between different error factors(n=46)

在全部样品中,有机质与误差极显著相关,粉粒CEC7与误差相关关系不显著。但通过观察发现,在有机质为6 g·kg–1前后离散程度有所不同,数据分析结果表明,随着有机质含量增加,误差离散程度也逐渐增加,当有机质含量小于6 g·kg–1时,误差平均值为2.3 cmol·kg–1,标准差为1.12 cmol·kg–1,当有机质含量大于6 g·kg–1时,误差平均值为7.45 cmol·kg–1,标准差为6 cmol·kg–1。因此本研究将全部样本按高、低有机质两类建模。将有机质含量大于6 g·kg–1的样本称作高有机质样本,数量为23 个,包含黏土类9个、黏壤土类8 个、壤土类6 个三种质地;将有机质含量小于6 g·kg–1的样本称作低有机质样本,数量为23 个,包含黏土类12 个、黏壤土类11 个两种质地。

分别在高低有机质样品中将现行模型误差与有机质和粉粒CEC7做灰色关联性分析和线性回归分析,结果如表3 所示:在高有机质样本中,现行模型误差与有机质和粉粒CEC7的关联度ri 为0.834和0.562,决定系数R2分别为0.402 和0.038,表明高有机质样本中,有机质与误差关联度和相关性更强,可忽略粉粒CEC7对误差的影响。同时根据有机质与黏粒的复合作用,将高有机质样本按照质地进行细分,以提升建模效果。在低有机质样本中,现行模型误差与有机质和粉粒CEC7的关联度ri 为0.663 和0.922,决定系数R2分别为0.019 和0.675,表明低有机质样本中,粉粒CEC7与误差关联性和相关性更强。值得指出的是,粉粒的提取较黏粒更为复杂,因此,本研究在实测粉粒CEC7的同时建立关于环境因子的粉粒CEC7估测模型,从而提升模型适用性。

表3 不同样本中误差与有机质、粉粒CEC7 的关联性Table3 Correlations of errors with organic matter and silt CEC7 relative to type of soil samples

2.2 高有机质样本建模

将高有机质样本按照土壤质地类型分为三类,即“黏土类样本”、“黏壤土类样本”和“壤土类样本”,分别进行建模。通过式(3)建立高有机质各样本中有机质和误差的线性方程分别为Y1=0.510X–0.899(R2=0.827,n=9),Y2=0.817X–1.316(R2=0.527,n=8),Y3=2.492X–15.67(R2=0.963,n=6)。将各线性方程分别代入模型4,即可得到黏土类、黏壤土类、壤土类质地类型高有机质样本的黏粒CEC7多元分段估测模型:

式中,CEC7(c)为优化后的每千克黏粒CEC7估测值,cmol·kg–1;OM 为有机质含量,g·kg–1;Cc为黏粒含量,g·kg–1;CEC7为细土 CEC7实测值,cmol·kg–1。

适用范围分别为:黏土类,即350 < C(clay)< 1 000且0< C(silt)< 600 且0 < C(sand)< 650;黏壤土类,即200 < C(clay)< 400 且0 < C(silt)< 730 且0 < C(sand)< 800;壤土类,即0 < C(clay)< 270 且0 < C(silt)< 800且0 < C(sand)< 850。

2.3 低有机质样本建模

2.3.1 通过实测粉粒CEC7 直接建模 由图4 可知,建立的低有机质粉粒CEC7和误差的线性方程为Y=0.853X+0.899(R2=0.685,n=23),代入模型4可得低有机质黏粒CEC7估测模型(下称“低有机质模型”)。

图4 低有机质样本粉粒CEC7 与误差相关性分析Fig. 4 Correlation analysis of silt CEC7 and errors in models for low OM samples

式中,CEC7(c)为优化后的每千克黏粒CEC7估测值,cmol·kg–1;CEC7(s)为粉粒阳离子交换量,cmol·kg–1;Cc为黏粒含量,g·kg–1;CEC7为细土CEC7实测值,cmol·kg–1。

2.3.2 通过环境因子估测粉粒CEC7间接建模

粉粒CEC7大小与黏土矿物组成和种类有关,黏土矿物的组成与种类一般与土壤pH、降水量、气温等理化、环境因子有关,其具有纬度地带性规律[19-20]。

据此,本研究选择土壤pH、年均气温(T)、年均降水量(R)、纬度(L)进行粉粒CEC7的估测建模,将该类因子进行多元逐步回归分析。其中,年均气温和年均降水量均从中国气象数据网获取(http://data.cma.cn/),引用文献中采样点纬度数据采用行政区域中心点纬度数据替代。做回归分析时,依次运用五种自变量进入方法:输入法、逐步法、删除法、后退法及前进法做模型估测。变量的选入标准是F 值的概率P≤0.05,剔除标准是P≥0.10。

多元逐步回归的方程式如下所示:

式中,CEC7(s)为粉粒CEC7大小;n 为参与回归的环境因子个数;a0、ai为回归系数;λi为第i 个环境因子的大小。

得到的基于环境因子的粉粒CEC7的估测最佳模型结果如模型8 所示,其R2=0.606,n=23。

CEC7(s)=1.501×L+1.693×T+1.775×pH-79.99(8)

式中,L 为纬度(度数表示法);T 为年均气温,℃。

代入模型 6 得到低有机质样本间接估测模型为:

式中,CEC7(C)为优化后的每千克黏粒CEC7估测值,cmol·kg–1;L 为纬度(度数表示法);T 为年均气温,℃;Cc为黏粒含量,g·kg–1。

3 讨 论

3.1 按照有机质含量高低分类建模的合理性

有机质被视为现行模型的误差因子主要是有机质削弱了黏粒对细土CEC7的贡献程度。一方面,有机质会直接贡献阳离子交换量,导致黏粒对细土CEC7的贡献程度减小,从而根据现行模型计算出的黏粒CEC7会高于实测值;另一方面,有机质会与黏粒的矿质部分复合,复合后阳离子交换量总是小于二组分单独存在的交换量之和[6],从而削弱黏粒对细土CEC7的贡献程度。因此,高低有机质对于现行模型精度的影响程度是不同的。如图3a)所示,在一定程度上随着有机质含量增加,误差会增大,同时由于有机质与黏粒的复合作用增强,误差离散程度也会增加,整体上虽达到极显著相关,但高有机质部分精度较差。此外,考虑分类建模的另一个原因是高低有机质中主要误差因子不同。由相关性分析和灰色关联分析结果可知,高有机质样本中有机质含量较高,粉粒CEC7对误差的贡献较低,而低有机质样本的中粉粒CEC7与误差具有极显著相关关系(图4)。因此,结合统计分析结果,本研究以有机质含量为6 g·kg–1作为分界线,将全部样本分为了高、低有机质样本分别进行建模。值得指出的是,此处的有机质“高、低”仅为相对性描述。

3.2 各分类模型精度评价

图5 为优化前后模型估测值与实测值的对比散点图,整体而言优化后模型的估测值更加接近实测值,且无异常点,表明经过误差优化后的模型相对于优化前更加稳定,估测效果更好。分别对各分类样本模型进行精度评价,结果如表4 所示。总体而言,各分类样本模型精度评价结果良好,符合使用要求,但不同样本模型之间精度有所不同。低有机质样本直接模型的R2最大,为0.959,平均绝对误差(MAE)、均方误差(MSE)、均方根误差(RMSE)最小,表明其建模效果最好,也说明在低有机质样本中,粉粒CEC7是主要的误差因子,同时低有机质间接模型的R2、MAE、MSE、RMSE 与直接模型相近,表明选取pH、年均气温(T)、纬度(L)得到的间接模型是可取的,在使用过程中,如果方便获取粉粒CEC7,推荐使用直接模型,若粉粒CEC7不方便获取,则推荐使用间接模型。而在高有机质样本中精度评价结果由大到小依次为黏土类、黏壤土类、壤土类,主要原因是三类样本中粉粒的含量由大到小依次为壤土类、黏壤土类、黏土类,随着粉粒的增加,有机质对误差的贡献程度会相对降低,从而导致将有机质视为唯一误差因子的高有机质优化模型精度逐渐下降。

3.3 黏粒CEC7 估测模型优化前后对土纲划分的影响

本研究对现行模型优化的目的是为了提升黏粒CEC7的估测准确性,从而为系统分类检索的准确性提供保障。对江西省28 个代表性剖面颜色、质地、黏粒含量、游离氧化铁含量等数据进行整理,并按照《中国土壤系统分类(第三版)》[1]要求检索土纲,由图6 可知,使用实测黏粒CEC7值检索后,28 个土壤剖面中有15 个划为富铁土,而使用现行模型估测值检索仅有3 个土壤剖面可划为富铁土,准确率仅20%;优化后的分类模型共有14 个土壤剖面可划为富铁土,准确率提升至93.3%。通过对比可以看出,优化后的模型由于消除了有机质和粉粒CEC7的干扰,估测值更接近实测值。

3.4 优化后模型的普适性

富铁土主要形成于温热气候条件下,广泛分布于我国南方诸省[21-25]。本研究样点选取以江西省为主,加以浙江、湖南、湖北等省份,主要集中于我国东南部地区,地形以山地丘陵为主。陈志诚等[3]曾分别于海口、广州、南昌挖掘三个土壤断面开展研究,结果表明江西断面丘陵和山地的土壤B 层细粉粒/黏粒比相较海南和广东断面有逐渐增大趋势,海南和广东断面的黏粒 CEC7计算值主要集中于16~24 cmol·kg–1,江西断面丘陵区域部分断面大于24 cmol·kg–1,山地上则均大于40 cmol·kg–1,计算数值高于实测值。以上研究表明,江西省及其周边区域现行模型计算结果相较于其他区域误差更大,针对该区域开展的模型优化研究更加符合区域特性,对于其他区域的适用性尚有待验证和提升。值得指出的是,砂土质地不是富铁土的典型质地类型,同时由于采样限制,在此未做深入研究。此外,各类质地样品量较小,今后研究中可注重提升各类样品数量,进一步提升优化模型估测精度。

图 5 估测模型优化前后与实测值散点图Fig. 5 Scatter plots predicted values and measured values before and after optimization of the prediction model

表4 各分类样本模型精度评价结果Table4 Accuracy evaluation of the models based on classification of soil samples

图6 不同黏粒CEC7 数据来源对应富铁土纲检索数目Fig. 6 Sources of clay CEC7 data corresponding to number of Ferrosols

4 结 论

通过分析现行模型误差的来源,基于优化公式,探究了按照有机质含量高低分类建模的合理性,得到了黏粒CEC7分类优化估测模型,提升了模型预测精度,为土壤系统分类检索提供了可靠数据支持。

猜你喜欢
细土建模误差
不同育秧材料对机插水稻秧苗素质及产量的影响
基于FLUENT的下击暴流三维风场建模
《符号建模论》评介
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
求距求值方程建模
母亲的冬藏
每天进步一点点
隧道横向贯通误差估算与应用
隧道横向贯通误差估算与应用
精确与误差