吕 烨,阮本清,管孝艳,王少丽
(1.中国水利水电科学研究院 科研计划处,北京 100038;2.国家节水灌溉北京工程技术研究中心,北京 100048)
基于支持向量机的微咸水灌溉下土壤盐分预测
吕 烨1,阮本清1,管孝艳2,王少丽2
(1.中国水利水电科学研究院 科研计划处,北京 100038;2.国家节水灌溉北京工程技术研究中心,北京 100048)
土壤水盐运移过程是农田土壤水盐调控的重要基础,是一个极其复杂的物理化学过程。本文在室内微咸水灌溉试验的基础上,引入支持向量机(SVM)模型应用于咸淡水交替灌溉后对土壤溶液EC、pH值的预测研究,并对其预测效果进行了分析。研究表明,支持向量机回归模型能够有效地模拟预测咸淡水交替灌溉下土壤EC和pH值变化规律,模型平均相对误差均小于10%,具有较高的预测精度。本方法为土壤水盐运移研究提供了一条新的思路和途径,具有较大的实用价值。
微咸水灌溉;土壤盐分;支持向量机;预测
随着国民经济和工农业生产的迅速发展,各地用水量和需水量不断增加,水资源供求矛盾日益尖锐,开发利用微咸水、咸水资源已成为解决农业水资源短缺的一条有效途径[1],而微咸水资源利用过程中带来的环境问题也成为水利、土壤和环境等学科关注和研究的热点[2-3],研究微咸水灌溉下的土壤水盐调控对于改善农田土壤质量和提高土地综合生产能力具有重要的理论和现实意义[4-5]。
数值模拟是研究土壤水盐调控的重要手段[6],国内外许多学者利用人工神经网络对土壤水盐运移和生长发育进行了模拟和预测,也取得了一定的成果。Patel等[7]用人工神经网络模型模拟和预测了地下咸水滴灌条件土壤的水盐运移过程,杨培岭等[8]利用人工神经网络模拟和预测了不同水分条件下作物根系的生长发育参数。但用人工神经网络存在着局部极小值点、收敛速度慢和结构确定无理论依据等缺点。而由 Vapnik等[9]根据统计学理论提出的非线性支持向量机(Support Vector Machine,SVM)理论正好克服了这些缺点,它是建立在结构风险最小化原则、学习的一致性、收敛速度及泛化误差的界等定理基础上,只考虑输入和输出,而不考虑内部复杂的变化过程,能较好地解决小样本、非线性、高维数和局部极小点等实际问题,并成功地应用于分类、函数逼近和时间序列预测等方面,已经被用来模拟和预测各种时空变化规律问题[10-12]。王景雷等[9]已成功实现了对地下水位的支持向量机模拟预报。侯志强等[13]建立了基于最小二乘支持向量机的参考作物蒸腾散发量(ET0)模型。SVM由于其良好的理论基础,能以任意精度逼近非线性函数,且有全局极小值点、收敛速度快和模型结构由算法自动确定等优点,更重要的是其泛化能力可方便地控制。能较好地解决小样本、非线性、高维数和局部极小点等实际问题,并成功的用来模拟和预测各种时空变化规律问题。
本文在室内咸淡水交替灌溉试验的基础上,基于支持向量机方法对咸淡水交替灌溉下的土壤EC、pH值进行模拟预测,以期为农田土壤水盐调控提供一定的技术指导。
2.1 支持向量机的基本原理支持向量机方法是建立在统计学理论的VC维(Vapnik-Cherv-onenksDimension)理论和结构风险最小原理(Strutural Risk Minimization Inductive Principle)基础上的。SVM的基本原理由求解分类问题引入,其指导思想是将非线性可分样本数据通过核函数映射到高维线性可分空间,然后用优化方法求解分划超平面,即确定决策函数的参数,使其结构风险最小化。
支持向量机方法由求解分类问题入手,可以推广到处理回归问题:给定线性可分样本集构造分划超平面 (w*·x)+b*=0,使两类样本点不仅能正确划分,即满足 yi(( w·xi)+b)≥1,i=1,...,l,而且要满足分类间隔最大,即满足最大,等价于令最小。于是可知,w*和b*是以下最优化问题的最优解:
由对偶理论可以把式(1)转换为其对偶问题:
其中:αi≥0,i=1,...,l,αi为 Lagrange乘子。
式(2)的最优解α*与式(1)的最优解w*和b*有如下关系:
将式(4)转换为分类问题,可以设想将样本集T中所有样本点沿yi方向分别上移和下移ε,使得上移后得到的样本集在回归超平面之上(正类点),而下移后得到的样本集在回归超平面之下(负类点)。此时回归超平面就转化为分划超平面,而回归问题也就转换为分类问题。
对式(1)进行修改得到:
下面将此算法推广一步,在允许拟合误差的情况下,引入松弛变量和惩罚参数C,则式
(5)修改为:
其中:ξi≥0,i=1,…,2l。
其中:0≤αi,
由于在实际处理过程中,ε*是事先给出的常数,所以用ε简化式(8)—式(10)中的符号ε*将不会有任何影响,替换后得到的便是ε-不敏感损失函数的支持向量线性回归机。
2.2 支持向量机的算法根据支持向量机的基本原理,可以得到处理非线性回归问题的支持向量机完整算法如下:
(1)选择参数ε、C和适当的核K(xi,xj) ;
(2)构造最优化问题:
(3)构造决策函数:
整个试验系统由试验土柱组成。试验土柱采用1 mm厚的有机玻璃制作,高70 cm,截面直径(内径)为15 cm,试验土柱侧面分别在5、12.5、22.5、35和50 cm处开一个圆形的取样孔,其尺寸长×宽为4 cm×1 cm,便于装土和取样分析(图1)。首先饱和试验土样,并测定其饱和后土壤初始含水率。试验过程中,提取土壤水溶液,测定溶液电导率EC、pH值和离子含量,整个试验共灌水3个循环(连续灌水)。试验设计和灌水水量水质见表1—表2。
图1 试验装置(单位:cm)
表1 灌溉试验设计
表2 灌溉用水水质与水量
4.1 样本数据集的构建为了消除各个因子由于量纲和单位不同的影响,对样本的输入、输出参数分别用下式进行规格化处理[15]。
式中:zi、yi分别为规格化前后的变量;zmin、zmax分别为样本数据 z的最小、最大值。
4.2 SVM学习训练模型的构建和训练采用基于matlab的SVM(支持向量机)工具箱进行,根据支持向量机的基本原理和算法的实现步骤,其训练过程主要包括输入输出参数文件调用、核函数与核参数选择、数据训练和数据检验等步骤。参数的训练过程主要通过核函数的引入、惩罚因子、损失函数不敏感度、核函数参数的引入及优化取值,可以建立土壤盐分支持向量机模型并获得模型的数值解。
5.1 土壤EC值模拟预测依据前述回归支持向量机计算步骤,将运移时间及土层平均的EC或pH值进行训练。对于一咸一淡灌溉模式,利用前5次灌水循环中土壤溶液EC、pH值与时间的关系,预测第6次灌水的EC、pH值,即利用前19个点预测后5个点;两咸一淡灌水模式,将前8个灌水循环中的运移时间和EC或pH值作为输出向量,预测第9次灌水的EC、pH值,即训练前24个点来预测后5个点。经过多次参数的寻优运算,寻求两种灌水模式下核函数参数δ、惩罚函数参数C、精度参数ε的最佳值,力求做到预测值与实测值的相对误差最小。
经过训练的SVM模型对最后一个灌水循环的土壤溶液EC值的预测值与实测值的关系见图2和表3。可以看出,SVM方法的预测结果与实测值之间的关系及其相对误差,两咸一淡灌水模式下对土壤溶液EC值的模拟预测精度较高,相对误差都在10%以内,平均相对误差为4.46%。而一咸一淡灌水模式下对土壤溶液EC值预测的相对误差值在较两咸一淡大,最大的达到13%,其平均相对误差为9.39%。由此可见,SVM方法的预测精度与训练样本的数量有较大关系,可以通过增加训练样本的数量来提高SVM方法的预测精度。
表3 土壤溶液EC值实测值与预测值对比
图2 土壤溶液EC值SVM预测值与实测值对比
5.2 土壤pH值模拟预测表4和图3列出了经过训练的SVM模型对最后一个灌水循环的土壤溶液pH值的预测值与实测值的关系。由图3和表4可以看出,同样是两咸一淡灌水模式下土壤溶液pH值预测值与实测值之间的相对误差小于一咸一淡灌水模式,其平均相对误差分别为0.97%和1.31%,均达到了较好的预测效果。
图3 土壤溶液pH值SVM预测值与实测值对比
表4 土壤溶液pH值实测值与预测值对比
本文利用非线性支持向量机理论构建了基于matlab的土壤盐分预测模型,并对土壤EC值和pH值进行了模拟和预测,结果表明:(1)利用matlab工具箱构建的支持向量机土壤盐分运移模型能够准确反映土壤盐分载分布过程中土壤EC值和pH值变化过程,且预测的精度很高;(2)用支持向量机模型预测土壤盐分含量的时空变化具有可行性,而且不需要建立具体的数学模型,能充分利用训练样本的分布特性,且不需要过多的先验信息和使用技巧;(3)基于支持向量机的土壤盐分再分布预测模型工作量大大减小,不需要测定水动力弥散系数、阻滞系数等,具有很强的实用性。
[1] 钱正英,张光斗.中国可持续发展水资源战略研究综合报告及各专题报告[M].北京:中国水利水电出版社,2001.
[2] 许迪,龚时宏,李益农,等.农业水管理面临的问题及发展策略[J].农业工程学报,2010,26(11):1-7.
[3] Beltrán J M.Irrigation with saline water:benefits and environmental impact[J].Agricultural Water Manage⁃ment,1999,40:183-190.
[4] 方生,陈秀玲.农业节水灌溉与咸水利用淡化[M].北京:中国农业科学技术出版社,2008.
[5] 杨树青,丁雪华,贾锦凤,等 .盐渍化土壤环境下微咸水利用模式探讨[J].水利学报,2011,42(4):490-498.
[6] 余根坚,黄介生,高占义.基于HYDRUS模型不同灌水模式下土壤水盐运移模拟[J].水利学报,2013,44(7):826-834.
[7] Patel R M,Prasher S O,Goel P K,et al.Soil salinity prediction using artificial neural networks[J].Journal of the American Water Resources Association,2002,38:91-102.
[8] 杨培岭,冯斌,任树梅.利用人工神经网络预报不同水分条件下作物根系发育参数[J].农业工程学报,2000,16(2):46-49.
[9] 王景雷,吴景社,孙景生,等.支持向量机在地下水位预报中的应用研究[J].水利学报,2003(5):122-128.
[10] Paulin C,Francois A,Ramon A E.Artificial neural network modeling of water table depth functions[J].Water Resources Research,2001,37(4):885-896.
[11] Gill M K,McKee M.Soil moisture data assimilation using support vector machines and ensemble Kalman filter[J].Journal of American Water Resources Association,2007,43(4):1004-1015.
[12] Cristianini N,Shaw-Taylor J.An introduction to support vector machines and other kernel based learning meth⁃ods[M].Cambridge,Massachusetts:Cambridge University Press,2000.
[13] 侯志强,杨培岭,苏艳平,等 .基于最小二乘支持向量机的ET0模拟计算[J].水利学报,2011,42(6):743-749.
[14] Thissena U,Van Brakela R,Weijer A P,et al.Using support vector machines for time series prediction[J]. Chemometrics and Intelligent Laboratory Systems,2003,69(1-2):35-49.
[15] Sajjad A,Ajay K,Haroon S.Estimating soil moisture using remote sensing data:A machine learning approach[J].Advances in Water Resources,2010,33:69-80.
Application of support vector machine method to prediction of soil salinity
LÜ Ye1,RUAN Ben-qing1,GUAN Xiao-yan2,WANG Shao-li2
(1.Department of Research planning,China Institute of Water Resources and Hydropower Research,Beijing 100038,China;2.National Center of Efficient Irrigation Engineering and Technology Research-Beijing,Beijing 100048,China)
The soil water and salt migration process is one of the most important foundations for water salt regulation in farmland.It is also an extremely complicated physical and chemical process.Based on the ex⁃periments on saline and fresh water alternate irrigation in laboratory,this study introduced the model of supporting vector machine(SVM)was introduced in to predict soil electrical conductivity(EC)and pH af⁃ter saline and fresh water alternate irrigation.The results show that support vector machine(SVM)models can predict soil EC and pH values effectively under saline and fresh water alternate irrigation,the average relative error is less than 10%,and the higher forecasting accuracy can be acquired by using SVM model. Therefore,the SVM model is a very useful tool for soil water and salt migration study.
saline water irrigation;soil salinity;support vector machines;prediction
S157.9
A
10.13244/j.cnki.jiwhr.2014.02.008
1672-3031(2014)02-0162-08
(责任编辑:王成丽)
2013-05-09
国家自然科学基金项目(51109227,51009152,51079162);水利部948项目(201119)
吕烨(1982-),女,河北石家庄人,工程师,主要从事劣质水安全利用、区域土壤水盐调控研究。E-mail:lvye@iwhr.com