基于改进插值法的农田土壤水分与养分空间变异研究

2015-11-30 09:50杨昕馨
现代农业科技 2015年18期
关键词:空间分布变异

杨昕馨

摘要 掌握农田土壤水分和养分的空间分布特征是实现农田土壤精确管理及实施精确农业的重要依据。该文将贝叶斯最大熵法(Bayesian maximum entropy,BME)和贝叶斯人工神经网络方法(Bayesian neural networks,BNN)结合形成一种空间插值新方法,用融入BNN法结果的BME法(Bayesian maximum entropy method combined with Bayesian neural networks,BMENN)模拟土壤变量的空间分布。以新疆希尼尔水库周边某田块的土壤水分、碱解氮、速效钾和速效磷这4种土壤特性的采样数据为例,运用交叉验证法,将BMENN法对土壤变量的估值精度与BNN法、普通克立格法(ordinary Kriging,OK)进行了比较。结果表明:与OK法和BNN法相比,BMENN法将估计方差(mean squared error,MSE)缩小2.26%~23.54%,具有最小的估计方差和接近于0的平均绝对误差(mean error,ME);BMENN法的估计值与实测值相关系数更大(r=0.62~0.89),具有更高的相关程度;MSE的组成分析表明,BMENN法再现变量波动程度和波动大小的能力更强。BMENN法对于利用有限数据信息提高土壤变量空间分布模拟精度具有重要意义,并可为土壤管理、精准农业的实施以及区域环境规划等提供科学依据。

关键词 土壤变量;空间分布;贝叶斯最大熵法;变异

中图分类号 S151.9 文献标识码 A 文章编号 1007-5739(2015)18-0193-02

定量化描述土壤特性(尤其是与作物产量、水质等有关的土壤特性)的空间分布特征是土壤的分布式管理和精确农业的实施的前提条件。然而,密集型土壤网格采样和大量实验室分析需要投入大量的人力和资金,靠这类方法精确评价土壤特性空间变异特征不太现实。贝叶斯最大熵法(Bayesian maximum entropy,BME)是由Christakos[1]提出的一种严格系统的非线性现代时空地统计学方法,它以实测数据为基础,融入具有不确定性的“软数据”及其他先验信息等多源数据,来分析时空变量的变异规律[2]。土壤数据空间分析的重要工具克立格法仅是BME法的特例,当只利用硬数据且数据服从正态分布和二阶平稳假设,先验信息只考虑均值、协方差函数或变异函数时,克立格估值与BME估值是相近的。BME法不仅能利用多源数据,且克服了各种克立格方法要求的数据正态分布、各向同性、线性估值等缺陷,被证明是一种更高效且适用范围更广的时空数据分析方法[3]。

贝叶斯神经网络(Bayesian neural networks,BNN)法是通过贝叶斯方法定量化神经网络权参数的不确定性,进而产生所研究变量的后验预测分布,使得置信区间的计算成为可能。BNN法不仅继承了传统神经网络法(artificial neural network,ANN)的优点,即处理非线性系统能力较强,不依赖数据分布和各种假设,还克服了其许多缺点,如可自动控制模型的复杂性,避免了过度拟合,大大减小了陷入局部最优的可能性。虽然传统ANN法被不断被应用于水土科学领域进行空间数据分析[4],但BNN法在这一领域的应用却未见报道。

BNN法具有神经网络良好的非线性表达能力和贝叶斯后验概率重现的真实性(估值的不确定性),但由于是在纯数据驱动下,着重表达变量在整个研究空间上的变异性,不能很好地反映邻域内土壤数据的几何构形。该文的目的是将BME法和BNN法结合,从不同角度充分利用有限的实测数据信息,以提高土壤特性数据的绘图精度。

1 理论与方法

1.1 贝叶斯神经网络方法

大量研究表明土壤水分和养分特性是具有区域化特征的随机场,其空间点和直角坐标之间的关系可以用神经网络模型进行非线性拟合。BNN法的主要原理是在给定数据样本的情况下建立神经网络权参数的后验概率分布,进而生成所研究变量的后验预测分布。由于预测值的求解过程属高维度复杂积分,通常借用马尔科夫链蒙特卡罗法(markov chain montecarlo,MCMC)对其进行数值积分近似[5]。

1.2 贝叶斯最大熵方法

BME基本原理是以硬数据点为基础,融入“软数据”点及广义知识G(general knowledge)等多源数据,来估计待估点处的值。硬数据指那些测量上没有误差或者误差较小可以忽略不计的数据;而软数据则包含了一定的不确定性,这些数据以区间、概率或函数的形式表示,与硬数据相比,软数据可结合更多的专业认知、经验知识等信息。硬数据和软数据构成特定知识S(special knowledge)。广义知识G是对于变量通常的了解,包括自然规律、科学理论和统计数据等,与特定知识S构成总知识库T。

在BME框架下,为估计待估点处的值,需首先用Shannon信息熵函数表示包含于先验概率密度函数的信息期望,并以定量化表示的广义知识G为数学约束,使信息熵最大化,得到多维随机变量及先验概率密度函数。本文中广义知识G为由已知数据(包括硬数据和软数据)统计得到的协方差函数。然后,根据贝叶斯法则,以硬数据和软数据为条件将先验概率密度函数转换为后验概率分布函数。

1.3 插值精度评价准则

为了评价BMENN分析土壤水分和养分空间分布特征的效果,本文将其插值结果与普通克立格法(Ordinary Kriging,OK)和BNN法进行了比较。将实测点分为2组,一组为建模数据点,用以建立贝叶斯神经网络模型,并且是BME法中的硬数据和OK法中的实测数据;另一组为验证数据点,用以通过交叉验证法评价3种方法的估值精度,亦即插值后这些点上会存在3对估计值-实测值,可据此计算相应的插值评价指标。

评价指标采用平均误差(mean error,ME)和均方误差(或称估计误差,mean squared error,MSE),其中:ME体现的是估值的平均偏离程度,MSE体现的是估值的绝对偏离程度。ME越接近0、MSE越小估值精度越高。endprint

2 研究区概况及试验方案

希尼尔水库位于新疆库尔勒市境内,是塔里木河流域近期综合治理工程之一,水库从孔雀河第一分水枢纽引水,经库塔干渠总干渠输水注入。设计库容0.98亿m3,设计水位913.6 m,设计水面面积16.74 km2。水库周边属温带大陆性干旱气候,降雨稀少,蒸发强烈。多年平均气温11.5 ℃,日照时数3 036.2 h,降水量53.3~62.7 mm,蒸发量2 673~2 788 mm(E20小型蒸发器),无霜期194 d,最大冻土深0.8 m。研究区土壤质地以沙土、砂壤土为主,适宜农业种植业的发展。土壤样品分析成果包括土壤含水率(烘干法测质量含水率)、碱解氮质量分数(氢氧化钠碱解扩散法测定)、速效磷质量分数(浸提-钼蓝比色法测定)、速效钾质量分数(浸提-火焰光度计法测定)。

3 结果与分析

土壤水分和养分的统计特征值和空间变异结构见表1。可以看出,土壤含水率、碱解氮质量分数的最大值均为最小值的1.8倍左右,速效钾接近4倍,速效磷则为6.63倍;从变异系数(Coefficient of variation,Cv)看,土壤水分属弱变异性(Cv≤0.1),各种养分质量分数都属于中等变异(0.1≤Cv≤1.0),其中土壤水分变异性最小,速效钾变异最大。土壤含水率和碱解氮质量分数的偏度系数和峰度系数均接近于0,近似服从正态分布;速效磷和速效钾的峰度系数和偏度系数较大,且峰态系数为正值,表明二者峰态左偏(即负偏),经对数变换后,大致接近正态分布,即服从对数正态分布。土壤水分和养分的理论变异函数模型均采用球状模型。若用C表示球状模型的结构方差,C0为块金方差,则C/(C+C0)可以反映出土壤变量的空间自相关性大小。对于土壤水分和全氮量,25%75%,表现出强烈的空间自相关性,特别是碱解氮和速效磷空间自相关性很强。

MSE的组成能更详细地刻画估计值与实测值之间的差异。MSE各组成部分的绝对数值(其中:SB是估计样本均值与实测样本均值的离差平方,反映均值的估计精度,该值越小,精度越高;SDSD是估计值与实测值均方差的离差平方,反映了估计值和实测值离散程度的差别,该值越小表明估计值离散程度越接近实测值;LCS是以均方差为权重的1-r值,反映估计值和实测值波动程度的差别,该值越小表明估计值与实测值的波动程度越接近)如表2所示。各土壤变量的3种插值结果均表明,LCS对MSE的贡献均最大,且占绝大部分,SB则很小,这表明估计误差绝大部分由于估计值与实测值的波动程度差异引起的,而估计值与实测值的均值之间的差异很小,几乎可以忽略,亦即各种方法的插值结果都接近于无偏估计。从MSE大小及其组成比例分析,3种方法中,BMENN法对各土壤变量的离散程度和波动程度具有最好的再现能力,OK法对变量波动程度的再现能力略好于BNN法。对于除水分外的各土壤变量,LCS对BNN法的MSE贡献都大于OK法,表明BNN法土壤变量的波动程度方面表现较差。与OK法相比,水分的BMENN法估计值的MSE和LCS都较小,显然BMENN法在水分插值中表现更好;虽然碱解氮的BMENN法估计值的LCS对MSE的贡献比例较大,但绝对数值却比较小,说明其OK法的LCS贡献比例的缩小是以MSE的增加为代价的;速效磷和速效钾的BMENN法估计值的LCS对MSE的贡献比例与OK法相近,但BMENN法的MSE比OK法分别缩小20.2%和21.4%,可见BMENN法较OK法插值精度高。对于土壤水分,BNN法的MSE的3种组份所占比例均不大,似乎组成更为合理,但与BMENN法相比仍然会发现,其LCS所占比例(76.1%)缩小主要是因为BNN法MSE(2.895)最大引起的,就绝对值而言,BMENN会更好地再现水分波动程度。

BMENN法对4种土壤变量的插值精度各不相同。由表2可知,对于速效钾,BMENN法的估计方差MSE比BNN法和OK法分别缩小23.2%和21.4%;对于速效磷,MSE分别缩小10.8%和20.2%;碱解氮MSE分别缩小10.5%和9.9%;水分MSE分别缩小19.4%和2.3%。结合以上对MSE组成的分析,可得出以下结论:与其他2种方法比较,BMENN法对速效钾、速效磷和碱解氮具有较高的插值精度,而对水分插值精度则较低。其原因是速效钾、速效磷及碱解氮具有强烈的空间自相关性,水分空间自相关程度较弱(表1),BMENN法通过地质统计学的BME法和人工神经网络的BNN法从不同角度发掘,能将实测数据携带的空间自相关信息运用到极佳,且变量的空间自相关程度越强,BMENN法估值精度越高。

4 结论

本文将现代地质统计学的贝叶斯最大熵法(Bayesian maximum entropy,BME)和贝叶斯人工神经网络方法(Bayesian neural networks,BNN)相结合(BMENN法),对土壤水分和养分变量进行插值估计;并以未参与构建模型的实测点(验证数据点)为基础,采用交叉验证法对比了BMENN法、BNN法与普通克立格法(ordinary kriging,OK)3种方法的插值估计精度。得出如下结论:①BMENN法估计值与实测值的相(下转第198页)

关系数r略大于其他方法,表明BMENN法估值与实测值相关性更好;②与OK法和BNN法相比,BMENN法能将估计方差(mean squared error,MSE)缩小2.26%~23.54%,表明总体上BMENN法估值更精确;③BMENN法估值接近于无偏估计,并比其他2种方法表现更稳定;④估计方差MSE的组成分析表明,BMENN 法再现变量波动程度和波动大小的能力更强。

以上结论表明,多方法融合力求充分利用所拥有的信息,是在数据信息有限的条件下,提高变量空间分布模拟精度的另一途径。本文利用BME法和BNN法各自的特点,将二者结合起来模拟土壤水分和养分空间分布,获得了较好的结果,对于提高空间变量的估值精度和丰富空间变异理论具有重要意义。但也存在不足之处:①由于数据信息有限,并没有充分发挥BMENN法的优势,今后有待进一步开展多尺度、多源信息利用方面的研究;②本文整个试验区的作物种植结构、施肥、灌水等条件都是基本一致的,没有考虑这些因素对所提出方法插值精度的影响;实际上,这些人类活动会影响土壤变量的随机性,进而影响空间变异理论的插值精度,关于人类活动对该方法的插值影响有待在将来的工作中开展研究。

5 参考文献

[1] CHRISTAKOS G.A Bayesian maximum entropy view to the spatial estim-ation problem[J].Mathematical Geology,1990,22(7):763-777.

[2] CHRISTAKOS G,LI X.Bayesian maximum entropy analysis and mapping:a farewell to kriging estimators[J].Mathematical Geology,1998,30(4):435-462.

[3] DOUAIK A,MEIRVENNE M V,T?譫TH T.Soil salinity mapping using spatio-temporal kriging and Bayesian maximum entropy with interval soft data[J].Geoderma,2005,128(3-4):234-248.

[4] LI Qi-quan,YUE Tian-xiang,WANG Chang-quan,et al.Spatially distr-ibuted modeling of soil organic matter across China:An application of artificial neural network approach[J].Catena,2013,104(5):210-218.

[5] BAYAT B,NASSERI M,ZAHRAIE B.Identification of long-term annual pattern of meteorological drought based on spatiotemporal methods:evaluation of different geostatistical approaches[J].Nat Hazards,2015,76(1):515-541.

猜你喜欢
空间分布变异
世卫:Delta变异株正成为全球主要流行变异株
基因突变与生物变异
生物的变异与进化
基于SWAT的滇池流域农业非点源污染空间分布特征研究
白龟山湿地重金属元素分布特征及其来源分析
江苏省臭氧污染变化特征
基于Kriging插值的矿区周边土壤重金属空间分布规律研究
变异的蚊子
病毒的变异
形的变异与的主题