基于灰色理论—BP神经网络方法的表层土壤容重预测

2018-03-21 05:41郭李娜樊贵盛
节水灌溉 2018年2期
关键词:表层关联度神经网络

郭李娜,樊贵盛

(太原理工大学水利科学与工程学院,太原 030024)

土壤容重一般指土壤干容重,又称为土壤密度,是干的土壤基质物质的量与总容积之比,是表征土壤物理状况指标的重要参数。表层土壤容重一般指地表以下20 cm深度范围土层的土壤容重,是影响水分、盐分及养分随径流在土壤中运移的重要因素之一。目前,获取土壤容重的常用方法为传统环刀法,在农田中用标准环刀取样后带回实验室烘干称重后计算土壤容重,此种测量方法虽然操作过程简单,但对于大面积农田土壤容重的持续跟踪采样与监测不仅工作繁重,而且耗时耗力,无法实时且快速地采集农田信息。近年来,国内外一些学者致力于通过利用土壤常规理化参数对土壤容重进行预测的研究,取得了很大进展。Rawls、Adams[1,2]等研究发现,土壤质地和有机质是影响土壤容重的主要因素;Curtis和Post[3]、Huntington[4]和Kaur[5]等多位学者根据土壤质地、有机质含量等资料,相继提出13种土壤传递函数用于预测土壤容重;韩光中[6]等利用现有的土壤数据库回归分析建立了我国主要土壤类型最适宜的容重传递函数。田耀武[7]等利用兰陵溪流域森林土壤调查数据库,建立了土壤有机碳、有机质与容重之间的回归模型。刘继红[8]等指出对于不同地区、不同类型、不同剖面垂直深度和不同发生层次的土壤,其容重PTFs的预测变量及相应参数各不相同。BP神经网络方法已被广泛地应用于众多领域的预测研究,李昊哲[9]等以土壤基本理化参数为输入变量,建立了盐碱土壤Kostiakov入渗模型参数的BP预报模型。侯泽宇[10]等利用小波神经网络的分析方法建立了降雨量的BP预测模型。王巧利[11]等以复合圆锥指数仪为工具,建立了BP神经网络的土壤容重预测模型。

目前,现有研究大多局限于对自然土壤容重的预测,且输入变量少,导致预测精度较低。在实际耕作条件下,影响表层土壤容重的因素涉及多个方面,除了土壤质地和有机质以外,降雨量、灌溉水量、全盐量及黄土的结构变形对表层土壤容重也有明显影响[12]。灌溉和降雨后由于表层土壤含水量增大,黄土的湿陷性和压实性使其结构改变,导致表层土壤容重发生变化;表层土壤随灌溉和降雨的进行经历着反复的脱盐和积盐过程,改变了土壤的理化特征和结构,从而影响表层土壤的容重。

本文针对大田耕作土壤,考虑增加累积接收水量和全盐量等因素,采用灰色关联理论方法,从分析表层土壤容重与各影响因素之间关联关系入手,利用BP模型在非线性映射和表达不确定性关系能力方面的强大优势,建立基于灰色关联理论的表层土壤容重BP预报模型,实现利用常规土壤理化参数和累积接收水量对土壤表层容重的多变量预测,一方面丰富了土壤传输函数理论的发展,另一方面可为科学进行农田农事和灌溉管理提供技术支撑。

1 样本的获取

1.1 试验区及土壤条件

本文所涉及的样本数据来源于大田耕作土壤的年度跟踪试验。项目试验在山西省黄土高原区的15个县市区进行。数月长度的试验期内,试验区各试点总降雨量变化范围在300.50~428.05 mm之间。种植冬小麦的试点在作物生长期内灌水3次,分别在10月和第二年的4月、5月,平均灌溉定额为265 mm;种植蔬菜的试点约20 d灌溉一次,平均灌溉定额为360 mm;种植玉米的试点多数无灌溉,部分试点在7月和9月灌溉两次,平均灌溉定额为170 mm。

试验区土壤种类多样,有红黏土、棕壤土、栗钙土、栗褐土和黄绵土等,土壤质地包括砂质壤土、粉砂质壤土、砂质黏壤土、壤土等,其中表层土壤黏粒含量、粉粒含量、砂粒含量的变化范围分别为0.01%~17.54%、30.20%~66.14%、28.63%~69.57%;表层土壤含水率的范围为7.81%~39.02%,有机质含量变化范围在0.18~2.74 g/kg之间;全盐量含量变化范围在682.30~5 606.28 mg/kg之间,表层土壤容重变化范围在1.09~1.63 g/cm3之间。

1.2 试验方案与方法

试验对大田耕作土壤表层容重和基本理化参数进行跟踪测定,测定项目包括:分层(0~2、2~10、10~20 cm)土壤干容重、体积含水量、有机质含量和全盐量等,并配套监测试验期内试验区降雨量和灌溉量等。试验从2015年4月下旬开始到2015年11月中旬结束,监测频次15 d左右。

表层土壤容重采用环刀法进行测定,并计算以土层厚度为权重的加权平均容重作为样本中采用的表层土壤容重值;土壤含水率测定采用烘干称重法,再经容重值换算成体积含水率;土壤质地通过筛分+比重计法得到筛分曲线,然后分析土壤的颗粒级配得到;土壤有机质含量的测定采用重铬酸钾容量法来测定,土壤有机质含量乘以0.58得到土壤有机碳含量[13];土壤累积接收水量即为试验区累积降雨量和灌溉量之和,其中试验区降雨量采用气象站设施观察得到,灌溉量通过记录当地农户农事作业资料获得;土壤全盐量测定通过残渣烘干质量法测定[14]。

1.3 样本数据的建立

基于对试验数据的整理,建立了148组具有代表性的土壤样本数据,并随机预留10组数据用以模型精度检验。在全部试验数据资料中随机选取3组来自不同试验田的土样,表层土壤容重和相对应的土壤黏粒、粉粒和砂粒含量、有机碳含量、体积含水率、全盐量和累积接收水量等参数如表1所示。

表1 3组试验点样本数据

2 BP神经网络模型的建立

2.1 影响因子模糊关联度分析

定性分析认为,土壤质地、有机碳含量、体积含水率、全盐量和土壤累积接收水量等是影响土壤容重的重要因子,但各个影响因子对土壤容重的影响程度如何需要研究分析。灰色关联分析方法可以样本数据为依据,利用灰色关联理论求出灰色关联度,以此来描述因素间关系的强弱和次序。灰色关联度的分析结果可为合理地选择BP神经网络预报模型的输入因子提供依据。

在试验数据资料中随机选取30组数据作为计算样本,分三步进行影响因子模糊关联度分析。

第一步确定分析序列,将土壤容重值作为母因素Y,将土壤黏粒、粉粒和砂粒含量、有机碳含量、体积含水率、全盐量和累积接收水量作为子因素X1、X2、X3、X4、X5、X6、X7,建立公式(1)和(2)所示的分析序列。

Y=(y1,y2,…,yk,…,yn)

(2)

式中:m为样本数量,本文样本数量为30;n为子因素数量,本文选取7个子因素;k为第k组样本。

第二步,对所选样本序列进行无量纲化处理,即:

(4)

式中:1 ≤i≤n,1≤j≤m,k为第k组样本。

第三步,计算关联系数,R=(ξij)m×n,其中:

(5)

式中:ξij为关联系数;R表示关联系数的m×n阶矩阵;ρ为分辨系数,一般取0.5。

各因素关联度计算公式为:

(6)

式中:φ0i为关联度。

将选取的 30 组样本数据代入上述公式,计算出表层土壤容重各个影响因子间的关联度如表2所示。

表2 表层土壤容重影响因子关联度计算结果表

一般关联度大于等于0.8时,子序列与母序列关联度很好;介于0.6与0.8之间关联度好;小于0.5时,基本上不相关[15]。由表2可知,影响土壤容重的7个参数对于表层土壤容重的关联度都大于0.6,关联度属于好和很好,关联度排序为:φ1>φ2>φ7>φ4>φ5>φ6>φ3。为保持输入变量之间的独立性,从总和为100%的黏粒、粉粒和砂粒含量中选择关联性较好的粉粒含量和砂粒含量作为表征土壤质地的参数。据此最终选定土壤粉粒含量、土壤砂粒含量、累积接收水量、体积含水率、有机碳含量和全盐量6个影响表层土壤容重的参数作为BP神经网络预报模型的输入变量。

土壤容重与质地有密切关系,土壤中黏粒、粉粒和砂粒含量决定了土体中大孔隙数量和疏松程度,从而影响土壤容重;随着土壤中有机碳含量的增多,土壤微生物活动更为剧烈,土壤孔隙率增大,土质疏松多孔,土壤容重值较小;耕作层土壤由高含水量到低含水量的变化过程中,土壤干容重呈增大趋势;灌溉和降雨改变了表层土壤含水量,黄土的湿陷性和压实性使其结构改变,导致表层土壤容重发生变化;表层土壤随灌溉和降雨的进行经历着反复的脱盐和积盐过程,改变了土壤的理化特征和结构,从而影响表层土壤的容重。

2.2 BP神经网络的设计方法

(1)BP神经网络的结构。BP神经网络是一种使用较为广泛且成熟的人工神经网络模型,一般具有3层或3层以上的神经网络结构[ ]。本文建立的BP神经网络模型由输入层、隐含层及输出层组成。根据前文灰色关联度的分析结果,确定的输入参数有6个,故输入层的神经元个数为6,输出参数为1个,输出层神经元个数为1;中间隐含层神经元数目需要经过多次迭代计算才能得出,通过逐渐增加隐含层节点数,反复计算与迭代训练,当模型隐含层的神经元数目等于20时最终达到模型的目标精度,因此建立的关于土壤容重的BP神经网络拓扑结构为6∶20∶1。

(2)样本预处理。为了确保输入输出变量的同等重要性并加快样本的迭代运算速度,需要对输入的样本值进行标准化处理,使输入值落在(0,1)之间,选取公式(7)对输入参数进行预处理。

(7)

式中:y为处理后样本值;x为输入样本值;xmin为建模样本最小值;xmax为建模样本最大值。

(3)函数选取和参数设定。分析所要处理的数据后,基于Matlab7.0神经网络工具箱中newff函数,选择学习速度较快且单次迭代误差较小的trainlm函数作为学习函数;基于sigmoid函数非线性映射能力强的优点加之输入值进行了标准化处理,选取正切函数tansig作为隐含层的激活函数,线性函数purelin作为输出层的激活函数。本文所训练的模型参数设定如下:最大学习迭代次数为1 500次,学习率0.01,训练精度为0.000 5。

2.3 表层土壤容重BP预测模型的建立

本文根据已测得样本利用软件Matlab7.0建立的BP网络模型如下所示。

net=newff(minmax(trainput),[20,1],

{'tansig', 'purelin'}, 'trainlm')

(8)

式中:net为所建立的BP神经网络;newff为Matlab7.0生成的BP神经网络函数;trainput为输入向量;min max(trainput)为表征输入向量范围的向量矩阵;[20,1]表示隐含层与输出层神经元个数,本文的输出值为表层土壤容重;{‘tansig’,‘purelin’}分别为隐含层和输出层的激活函数形式;‘trainlm’为网络的训练函数形式。

BP神经网络的训练结果如下所示。

γ=purelin(iw2(tansig(iw1p+b1))+b2)

(9)

p=[β1,β2,θ,Q,ψ,L]

(10)

式中:γ为输出的表层土壤容重值;iw1、iw2分别为模型输入层到隐含层的权值和隐含层到输出层的权值;b1为模型输入层到隐含层的阈值;b2为模型隐含层到输出层的阈值;β1为粉粒含量;β2为砂粒含量;θ为体积含水率;Q为有机碳含量;L为累积接收水量。

BP神经网络预报模型iw1、b1、iw2、b2组成的矩阵数值表见表3。

表3 预报模型矩阵数值表

3 BP模型的预测结果与精度检验

3.1 建模样本的BP模型的预测结果与精度检验

对建模的148组样本数据进行BP神经网络预测,根据程序运行的结果得出:当训练步数为200步时,训练精度为9.997 4×10-5,小于5×10-4,达到设定的目标精度要求。计算预测值与实测值间的绝对误差和相对误差并进行精度对比,结果如表4所示。

表4 表层土壤容重预测结果与误差分析表

从表4可以看出,表层土壤容重预测值与实测值的平均值相同,说明本文选用148组数据建立的BP模型整体上预测效果较好,其相对误差平均值为0.414 2%,最大值为12.368 6%,最小值仅为0.000 6%,通过148组表层土壤容重预测值与实测值的误差精度对比可知,本文选定灰色关联度较高的土壤粉粒含量、土壤砂粒含量、累积接收水量、体积含水率、有机碳含量和全盐量6个影响土壤容重的参数作为输入参数建立BP预测模型是合理的,与实际情况相符,并且预测模型精度很高。

3.2 验证样本的预测结果与精度检验

为了检验模型的预测精度,计算随机预留的10组数据预测值与实测值的相对误差和绝对误差,计算结果如表5所示。

表5 预报模型检验结果分析表

由表5可以看出,随机预留的10组数据表层土壤容重的预测值与实测值的平均值基本一致,相对误差的平均值为1.046 3%,最大值为4.300 8%,最小值为0.006 2%,精度较高,误差完全在可接收的范围之内,计算结果表明,利用表层土壤粉粒含量、砂粒含量、累积接收水量、体积含水率、有机碳含量和全盐量对表层土壤容重进行预测是可行的,预测值与实际相符且预测精度很高,可满足实际农业生产活动需要,为获取黄土高原区土壤参数提供依据。

4 结 语

(1)基于灰色理论—BP神经网络的方法建立表层土壤容重预测模型是可行的。灰色关联理论的方法,量化各因素对表层土壤容重的影响程度,有针对性地对影响因素评判和取舍,降低了输入样本的维数,优化了模型结构,在一定程度上提高了神经网络模型的预测精度,为土壤容重的预测提供了新思路和新方法。

(2)以表层土壤粉粒含量、土壤砂粒含量、累积接收水量、有机碳含量、体积含水率、和全盐量作为输入变量的土壤传输函数预测可获得较理想的预测精度。以关联度较好且相互独立的6个影响参数作为输入因子所建立的BP神经网络模型,预测值和实测值之间相对误差的平均值为0.41%,预留10组检验样本相对误差的平均值为 1.05%,预测精度高,预测误差小,实现了利用常规土壤理化参数和累积接收水量对土壤表层容重的有效预测,丰富了土壤传输函数理论的发展,为科学指导农田农事和灌溉管理提供理论支撑。

本文所建立的灰色BP神经网络预报模型,实现了对黄土表层土壤容重的高精度预测,但所预测是0~20 cm土壤的加权平均容重,为提高表层土壤容重预测在农田农事和灌溉管理中的使用价值,应对分层土壤容重的预测还进行进一步的探讨和研究。

[1] Rawls W J.Estimating soil bulk density from particle size analysis and organic matter content[J].Soil Science,1983,135(2):123-125.

[2] Adams W A.The effect of organic matter on the bulk and true densities of some uncultivated podzolic soils[J].European Journal of Soil Science,1973,24(1):10-17.

[3] Curtis R O,Post B W.Estimating bulk density from organic matter content in some vermont forest soils[J].Soil Science Society of America Journal,1964,28(2):285-286.

[4] Huntington T G,Johnson A H,Siccama T G.Carbon,organic matter and bulk density relationship in a forested spodosol[J].Soil Science,1989,148(5):380-386.

[5] Kaur R,Kumar S,Gueung H P.A pedo-transfer function(PTF)for estimating soil bulk density from basic soil data and its comparison with existing PTFS[J].Australian Journal of Soil Research,2002,40(5):847-857.

[6] 韩光中,王德彩,谢贤健.中国主要土壤类型的土壤容重传递函数研究[J].土壤学报,2016, 53(01):93-102.

[7] 田耀武,黄志霖,肖文发,等.三峡库区兰陵溪流域森林土壤有机碳、有机质与容重间的回归模型[J].华南农业大学学报,2016,37(1):89-95.

[8] 刘继红,兰传宾,陈 杰.区域土壤容重转换函数构建与预测结果评价——以河南省封丘县为例[J].土壤通报,2013,44(1):77-82.

[9] 李昊哲,樊贵盛. 盐碱土壤Kostiakov入渗模型参数的BP预报模型[J].中国农村水利水电,2017,(7):49-53

[10] 侯泽宇,卢文喜,陈社明.基于小波神经网络方法的降水量预测研究[J].节水灌溉,2013,(3):31-34.

[11] 王巧利,林剑辉,许彦峰.基于BP神经网络的土壤容重预测模型[J].中国农学通报,2014,30(24):237-245.

[12] 程诗念,樊贵盛.玉米生育期内不同覆膜对黄土表层容重变化特性的影响[J].节水灌溉,2017,(6):26-29.

[13] WANG S Q,ZHOU C H,LIU J Y.Carbon storage in northeast China as estimated from vegetation and soil inventories[J].Environmental Pollution,2002,116(1):157-165.

[14] 南京农学院.土壤农化分析[M].北京:中国农业出版社,1980.

[15] 郝彬彬,李 冲,王春红.灰色关联度在矿井突水水源判别中的应用[J].中国煤炭,2010,36(6):20-22.

[16] 赵西宁,王万忠,吴普特,等.坡面入渗的人工神经网络模型研究[J].农业工程学报,2004,20(3):48-50.

猜你喜欢
表层关联度神经网络
基于熵值法与灰色关联度分析法的羽毛球技战术综合评价分析
基于熵权法改进的TOPSIS法和灰色关联度分析的压榨脱水过程优化研究
基于递归模糊神经网络的风电平滑控制策略
半潜式平台表层卡套管处理与认识
路基基床表层级配碎石施工技术
水体表层沉积物对磷的吸收及释放研究进展
神经网络抑制无线通信干扰探究
中国制造业产业关联度分析
中国制造业产业关联度分析
基于神经网络的中小学生情感分析