唐希贤,张英明
(1.临夏县农村合作经济经营管理站,甘肃 临夏 731800;2.临夏县韩集镇农业技术推广站,甘肃 临夏 731800)
基于地统计学的高原县域耕地土壤养分最优插值方法研究
唐希贤1,张英明2
(1.临夏县农村合作经济经营管理站,甘肃 临夏 731800;2.临夏县韩集镇农业技术推广站,甘肃 临夏 731800)
地统计学;耕地;土壤养分;空间插值方法;甘肃
选择适宜区域土壤属性特征的空间插值方法是高效揭示土壤养分空间分异的基础。以地处青藏高原与黄土高原过渡区的甘肃省临夏县为案例区,利用该县2007年农业部测土施肥采集的5 475个样点数据,以及地统计学的交叉验证和样点验证两种评价方法,筛选出适合研究区耕地土壤养分(有机质、碱解氮、有效磷和速效钾)分布预测的高效插值方法。从交叉验证结果来看,有机质和碱解氮采用析取克里格插值精度较高,而有效磷和速效钾分别采用普通克里格和简单克里格插值精度较高。从样点验证结果来看,有机质和速效钾分别以析取克里格和简单克里格插值精度较高,这也与交叉验证相吻合;而碱解氮和有效磷分别采用简单克里格和泛克里格插值精度较高,与交叉验证结果并不一致。由于交叉验证是具有一定“欺骗性”的自我验证,本研究认为基于样点验证的精度评价方法更可靠,因此临夏县耕地碱解氮和有效磷适宜的插值方法分别为简单克里格和泛克里格。
土壤养分是植物生长发育所必需的,准确获取它的空间分布规律是实现精准农业变量施肥的前提条件,而采样与分析是目前掌握土壤养分状况的最主要途径[1-3]。然而,无论采样密度多大,均不可能覆盖所有区域,因此如何利用有限的样点数据来获得更为详尽的土壤属性空间分布信息一直是国内外研究的热点。空间插值模型可以将离散的数据点转化为连贯的数据曲面,从而对未知样点的养分状况进行有效预测,是表征土壤养分空间分布特征的重要手段[4]。但不同模型的插值原理和计算方法有所差异,其预测结果反映的土壤养分空间变异性可能不一样[5-6]。因此,选择适宜不同土壤属性特征的插值方法对揭示其空间分布规律具有重要意义。
近年来,随着“3S”技术的迅猛发展,基于地统计学的插值技术被广泛应用到土壤属性空间变异性研究中。地统计学不仅考虑调查样点本身的数值,还考虑与邻近样点的空间位置关系,经常被用来研究既有一定随机性又有一定结构性的各种变量空间分布。但很多研究表明,不同土壤养分适宜的插值方法可能有所差异。刘吉平等[7]利用吉林省榆树市弓棚镇的386个采样数据分析了不同插值方法对农田土壤碱解氮空间变异性预测结果的影响,结果表明当采样密度较大时,克里格模型插值精度高于BP神经网络模型。孙义祥等[8]基于1 975个调查样点的研究结果表明,不同插值方法对县域土壤有效磷空间变异性的预测效果差异较大,且表现为析取克里格、普通克里格、简单克里格和局部多项式插值精度高于全局多项式、反距离加权法、泛克里格和径向基函数法,以析取克里格法插值效果最好。李晓燕等[9]通过364个采样数据分析不同插值方法的预测精度,结果表明,吉林省德惠市土壤速效钾的空间变异性预测适宜采用普通克里格指数模型,其插值效果优于反距离权重法和球面多项式法。
从以上研究也可以看出,目前土壤养分空间插值方法预测精度研究主要以小规模样本数据集为基础,且有关同一研究区不同土壤养分对插值模型的适宜性的研究相对较少,这导致土壤养分变异性研究存在较大不确定性。青藏高原位于我国西南部,约占我国陆地总面积的25%,是我国面积最大的高原;黄土高原位于我国中部偏北,面积约为40万km2,是世界最大的黄土堆积区,暴雨径流冲刷疏松黄土导致水土流失严重[10]。因此,确定适用于高原地貌类型区的耕地土壤养分点面拓展模型,对合理设计养分流失防控措施和肥力提升计划皆具有十分重要的意义[11]。为此,本研究以地处青藏高原与黄土高原过渡地区的甘肃省临夏县为案例区,利用该县2007年农业部测土施肥大规模采集的5 475个样点数据,研究地统计学中常用的普通克里格、简单克里格、泛克里格和析取克里格4种插值方法对该地区耕地土壤有机质、碱解氮、有效磷和速效钾空间变异性预测精度的影响,以期找到不同土壤养分最适宜的插值模型,为我国青藏高原与黄土高原过渡区县域耕地养分预测选择高效插值方法提供科学依据。
临夏县位于甘肃省中部,地理坐标为北纬34°57′~36°12′、东经102°41′~103°40′(图1)[12],地处青藏高原与黄土高原的过渡地带,属温带半湿润气候区。临夏县地形较为复杂,海拔差距较大,总体呈西南高东北低趋势。县域南部和西部均是山地,海拔一般在3 000 m 以上;中东部以黄土高原为主,海拔介于1 750~2 300 m之间,地貌青藏、黄土高原兼有,属甘肃省典型地貌类型。根据第二次土壤普查统计结果,临夏县耕地土壤类型包括垆土、红土、黄绵土、黑土和山地棕壤,且以黑土、垆土和红土面积分布最广,占全县耕地总面积的95%以上[13]。
图1 临夏县地理位置图
2.1 数据来源
本研究使用的耕地土壤调查样点数据来源于农业部测土配方施肥项目。2007年8—9月临夏县共采集土样5 475份,取样采用多点混合土样采集法,取土深度为20 cm,并利用GPS定位获取样点经纬度。样点属性包括采样地块基本情况(统一编号、经纬度、土壤类型等)和土壤测试结果(有机质、碱解氮、有效磷、速效钾等),其中有机质采用K2Cr2O7-H2SO4溶液油浴法测试,碱解氮采用碱解扩散法,有效磷采用NaHCO3浸提-钼锑抗比色法,速效钾采用NH4OAc浸提-火焰光度法。利用ArcGIS 9.3软件将样点经纬度坐标投影转换成北京1954直角坐标系坐标,并与县域耕地利用现状图相匹配,然后根据编码规则将样点属性值导入图层并保存入库,最终形成临夏县耕地土壤调查样点数据库。
2.2 数据处理软件与地统计学插值方法
本研究利用SPSS 19.0分析土壤有机质、碱解氮、有效磷和速效钾的基本统计特征,借助ArcGIS 9.3的地统计分析工具对县域耕地土壤养分分别进行普通克里格(Ordinary Kriging,OK)、简单克里格(Simple Kriging,SK)、泛克里格(Universal Kriging,UK)和析取克里格(Disjunctive Kriging,DK)空间插值。这4种插值模型均以变异函数理论和结构分析为基础,能最大限度地利用样本信息对区域化变量进行无偏最优估计,在考虑样点距离的同时,还考虑已知样点的空间分布及与未知样点的空间方位关系,是目前应用较为广泛的地统计学插值方法[14]。
本研究从两个方面对插值精度进行评估:一是地理信息系统软件自带的交叉验证功能,具体评定标准为平均预测误差(ME)和标准预测误差(MSE)越接近于0越好,均方根误差(RMSE)越小且越接近于平均标准差(ASE)越好,均方根标准误差(RMSSE)越接近于1越好,且优先考虑RMSE[15]。二是从调查样点中随机抽取20%(1 095个采样点)作为验证样点(图2),通过预测值与实测值的相关系数r及RMSE两个指标进行预测精度评定,当RMSE越小、r值越大时,预测精度越高。
(1)
式中:N为样点数量;Xoi为样点实测值,Xpi为样点预测值。
图2 基于耕地土壤的样点分布
3.1 基于交叉验证的空间插值方法精度评价
本研究利用ArcGIS 9.3对临夏县2007年采集的5 475个耕地土壤调查样点数据进行了普通克里格、简单克里格、泛克里格和析取克里格4种不同地统计学方法的空间插值,并通过该软件的交叉验证功能进行精度评价(见表1)。从表1可以看出,县域耕地土壤有机质和碱解氮的RMSE分别为5.14~5.21 g/kg和20.76~21.32 mg/kg,均以析取克里格的RMSE最小,表明析取克里格插值效果优于普通克里格、简单克里格和泛克里格,能更好地模拟临夏县耕地土壤有机质和碱解氮的空间分布特征。有效磷和速效钾的RMSE分别为17.06~17.12 mg/kg和32.18~32.38 mg/kg,且有效磷以普通克里格的RMSE最小,速效钾以简单克里格的RMSE最小,说明临夏县耕地土壤有效磷和速效钾分别采用普通克里格和简单克里格的插值精度较高。从各种土壤养分不同插值方法交叉验证的误差大小来看,泛克里格的RMSE均高于普通克里格、简单克里格和析取克里格,表明临夏县耕地土壤养分插值以泛克里格预测精度最低,因此不宜采用该方法进行县域土壤养分空间变异特征分析。从不同土壤养分的归一化均方根误差(RMSE与平均值的比值)来看,有效磷归一化均方根误差高于59.00%,而有机质、碱解氮和速效钾归一化均方根误差均低于30.00%,表明基于地统计学的临夏县耕地土壤有效磷插值效果不够理想,预测精度明显低于有机质、碱解氮和速效钾。
表1 临夏县耕地土壤养分地统计学插值方法交叉验证精度评价
3.2 基于验证样点的空间插值方法精度评价
基于验证样点的空间插值结果表明,基于析取克里格插值的临夏县耕地土壤有机质含量预测值与实测值相关系数r为0.588 7,高于普通克里格(0.579 0)、简单克里格(0.582 0)和泛克里格(0.579 1),RMSE为5.177 1 g/kg,小于普通克里格(5.288 2)、简单克里格(5.208 6)和泛克里格(5.282 2),表明县域耕地土壤有机质含量预测值析取克里格插值精度较高,这与交叉验证得出的结果相一致;另外,基于简单克里格插值的县域耕地土壤速效钾含量预测值与实测值相关系数r为0.747 3,高于其他3种插值方法,且RMSE最小,说明临夏县耕地土壤速效钾含量预测值简单克里格插值效果较好,这也与交叉验证结果相一致。但从空间插值结果也可知,临夏县耕地土壤碱解氮和有效磷含量预测值分别以简单克里格和泛克里格插值精度最高,这与上述的交叉验证结果不一致。交叉验证是ArcGIS软件利用样点数据进行的自我验证,得到的样点预测值已经受到该样点实测值的影响,从理论上说具有一定的“欺骗性”,而基于实测样点所进行的精度评价不同于交叉验证的自我验证,其已剔除了验证样点实测数据对预测值的影响,是完全通过已知点来推算未知点的养分含量,并利用验证点进行精度分析的一种检验方法[16],因此基于实测样点的精度分析结论比交叉验证有更大的可靠性,故本研究认为临夏县耕地土壤碱解氮和有效磷含量预测分别采用简单克里格和泛克里格插值模型相对更优。
从临夏县不同地统计学插值方法对各个养分指标预测的适宜性来看,有效磷含量1 095个验证样点的预测值与实测值相关系数r均低于0.40,明显小于有机质、碱解氮和速效钾,表明临夏县耕地土壤有效磷含量的地统计学空间插值精度低于有机质、碱解氮和速效钾。该结论与交叉验证结果是一致的,这可能与有效磷本身的空间分布特征有关。临夏县耕地土壤有效磷含量极大值与极小值相差200多倍,变异系数为62.86%,是有机质和碱解氮变异系数的2倍、速效钾变异系数的1.5倍。有研究表明,强烈的空间变异性对插值效果具有一定的影响,所以有效磷含量插值精度整体较低[17]。有机质、碱解氮和速效钾1 095个验证样点的预测值与实测值相关系数均高于0.57,其中速效钾的相关系数r均高于0.74;另一方面,有机质、碱解氮和速效钾1 095个验证样点的归一化均方根误差均低于29.00%,其中有机质归一化均方根误差均低于25.00%,而有效磷归一化均方根误差均高于57.00%,约是其他3种养分的2倍,表明基于地统计学的临夏县耕地土壤有机质、碱解氮和速效钾插值效果整体较好,预测精度明显高于有效磷,这与交叉验证结果相一致。造成这一现象的主要原因可能是有机质、碱解氮和速效钾的空间变异程度均相对较低,有利于土壤属性值的空间预测,该结论也符合很多学者认为的“较低的空间变异性在一定程度上能保证较高的空间预测精度”的一般规律[17-19]。
3.3 县域耕地土壤养分空间分布特征
4种不同地统计学空间插值方法预测的临夏县耕地养分空间分布特征基本一致,即:有机质和碱解氮含量以中部及西北部较高,东北部较低;有效磷含量以东北部较高,中部较低;速效钾含量以东南部较高,其他区域分布较为均匀,且以东北部含量最低。上述分布规律可能与该地区复杂的地形特征有关,临夏县地势西南高而东北低,西部和南部多为山地,是青藏高原东北的边缘隆起部分,海拔一般在3 000 m以上,气温相对较低,微生物活性较差,土壤有机质和全氮分解较慢;而中东部地区属黄土高原,海拔介于1 750~2 300 m之间,明显低于西南部,气温相对较高,土壤微生物生理活动旺盛,土壤有机质和全氮分解速度较快[20]。此外,临夏县降水量分布极为不均,呈东北部少而西南部多的规律,而很多研究表明降水量大有利于土壤有机质和全氮积累,这是东北部有机质和全氮含量低的另一原因[21]。有效磷含量分布规律正好与有机质和全氮相反,可能是因为高海拔地区的土壤磷素受雨水冲刷而通过地表径流的方式聚集在了地势较低的地区。临夏县东南部速效钾含量明显高于其他区域,这可能与该区域耕地土壤质地以黏土和黏壤土为主有很大关系,有研究表明,土壤黏粒含量与速效钾含量呈极显著的正相关[22]。
本研究以大规模采集的5 475个样点数据为基础,利用两种验证方法综合评价了普通克里格、简单克里格、泛克里格和析取克里格4种不同地统计学插值方法对临夏县耕地土壤养分含量空间预测精度的影响,结果表明:基于验证样点的空间插值方法精度评价比交叉验证法具有更高的可靠性;临夏县耕地土壤有机质含量预测适宜采用析取克里格插值方法,碱解氮和速效钾含量预测适宜采用简单克里格插值方法,有效磷含量预测适宜采用泛克里格插值方法。
[1] 赵明松,张甘霖,王德彩,等.徐淮黄泛平原土壤有机质空间变异特征及主控因素分析[J].土壤学报,2013,50(1):1-11.
[2] 李翔,潘瑜春,马景宇,等.基于多种土壤养分的精准管理分区方法研究[J].土壤学报,2007,44(1):14-20.
[3] 李启全,岳天祥,范泽孟,等.中国表层土壤全氮的空间模拟分析[J].地理研究,2010,29(11):1981-1992.
[4] 杨子清,陈平留,刘健,等.基于Kriging法的森林土壤养分空间插值[J].福建农林大学学报:自然科学版,2012,41(3):296-300.
[5] 王秀,苗孝可,孟志军,等.插值方法对GIS土壤养分插值结果的影响[J].土壤通报,2005,36(6):826-830.
[6] 赵永存,史学正,于东升,等.不同方法预测河北省土壤有机碳密度空间分布特征的研究[J].土壤学报,2005,42(3):379-385.
[7] 刘吉平,于佳,于洋,等.采样密度和插值对农田土壤碱解氮空间变异性的影响[J].土壤通报,2014,45(4):789-794.
[8] 孙义祥,吴传洲,朱克保,等.插值方法与样点数对县域土壤有效磷空间变异特征评价的影响[J].应用生态学报,2009,20(3):673-678.
[9] 李晓燕,张树文.吉林省德惠市土壤速效钾的空间分异及不同插值方法的比较[J].水土保持学报,2004,18(4):97-100.
[10] 信忠保,许炯心,余新晓.近50年黄土高原水土流失的时空变化[J].生态学报,2009,29(3):1129-1139.
[11] 陈涛,常庆瑞,刘京,等.黄土高原南麓县域耕地土壤速效养分时空变异[J].生态学报,2013,33(2):554-564.
[12] 刘兴华.耕地资源社会保障问题研究——以甘肃省临夏县为例[D].兰州:甘肃农业大学,2012.
[13] 甘肃省土壤普查办公室.甘肃土壤[M].北京:农业出版社,1990.
[14] 张峰,杜群,葛宏立,等.基于地统计学和CFI样地的浙江省森林碳空间分布研究[J].生态学报,2012,32(16):5275-5286.
[15] ESRI.Using Geostatistical Analyst[M].United States of America:ESRI Inc,2004.
[16] 范胜龙,黄炎和,林金石.表征土壤有机碳区域分布的优化空间插值模型研究——以福建省龙海市为例[J].水土保持研究,2011,18(6):1-5.
[17] 赵永存.土壤属性表征的空间尺度效应和不确定性研究——以河北省土壤有机碳为例[D].南京:中国科学院南京土壤研究所,2005.
[18] 赵春生,张佳宝.土壤特性空间变异研究的定量方法[J].土壤学报,1995,23(5):45-53.
[19] 张忠启.样点布置模式及密度对揭示土壤有机碳空间变异的影响[D].南京:中国科学院南京土壤研究所,2010.
[20] 张金屯.全球气候变化对自然土壤碳、氮循环的影响[J].地理科学,1998,18(5):463-471.
[21] 陈建国,田大伦,闫文德,等.鄂西南区域土壤有机碳储量、密度及其影响因子[J].中南林业科技大学学报,2011,31(5):57-62.
[22] 庞夙,陶晓秋,张英,等.会理县新植烟区土壤速效钾含量空间变异特征及其影响因子[J].中国烟草科学,2012,33(1):32-42.
(责任编辑 徐素霞)
S158.2
A
1000-0941(2015)11-0049-04
唐希贤(1987—),男,甘肃临夏县人,农业经济师,主要从事农业科技推广、农业产业化及农村经济管理工作;通信作者张英明(1985—),男,甘肃临夏县人,助理农艺师,主要从事农业科技推广工作。
2015-03-25