基于偏最小二乘及最小二乘支持向量机的 と斯ぜ硬谇道糙率预测模型

2018-11-12 11:20葛赛
南水北调与水利科技 2018年4期
关键词:预测

葛赛

摘要:影响渠道糙率的因素相当复杂,且因素间又存在一定的相关关系。为取得更为精确的糙率预测效果,采用偏最小二乘(PLS)法对影响人工加糙渠道糙率的因素进行分析,提取影响自变量的重要成分,结合最小二乘支持向量机(LSSVM)建立了人工加糙渠道糙率预测模型。结合实例,通过对某人工加糙渠道相关试验数据进行PLSLSSVM模型的训练及预测,并将预测结果与单独使用PLS、LSSVM及公式法的预测结果进行对比,其结果显示:基于PLSLSSVM模型的预测平均绝对百分比误差MAPE为138%,均方根误差RMSE为224×10-4,预测精度均优于PLS、LSSVM及公式法的預测结果。结果表明,将PLS与LSSVM相结合的PLSLSSVM模型,综合了PLS与LSSVM各自的优势,应用PLSLSSVM模型可有效进行人工加糙渠道糙率的预测。

关键词:偏最小二乘(PLS);最小二乘支持向量机(LSSVM);人工加糙渠道;糙率;预测

中图分类号:TV135.3文献标志码:A文章编号:

16721683(2018)04018906

Roughness prediction model for artificially roughened channel based on partial least square and least square support vector machine

GE Sai1,ZHAO Tao1,WU Si2,WU Yangfeng1

1.College of Water Conservancy and Civil Engineering,Xinjiang Agricultural University,Urumqi 830052,China;2.Yellow River Engineering Consulting Co.,Ltd,Zhengzhou 450003,China

Abstract:

The factors that affect the roughness of a channel are quite complex,and there is a certain correlation between the factors.In order to obtain a more accurate prediction of the roughness,we used the partial least squares (PLS) method to analyze the factors that affect the roughness of artificially roughened channels,and we extracted the important components that affect the independent variables.Then we established the roughness prediction model for artificially roughened channels based on least square support vector machine (LSSVM).We used the experimental data of an artificially roughened channel for training and prediction of the PLSLSSVM model,and compared the prediction results with the prediction results of PLS,LSSVM,and formula methods.The results showed that the mean absolute percentage error (MAPE) of prediction based on PLSLSSVM model was 138%,and the root mean square error (RMSE) was 224×104 .Its prediction accuracy was better than that of the PLS,LSSVM,and formula methods.The results showed that the PLSLSSVM model which combines PLS and LSSVM can integrate the advantages of PLS and LSSVM.PLSLSSVM model can effectively predict the roughness of artificially roughened channels.

Key words:

partial least squares (PLS);least square support vector machine (LSSVM);artificially roughened channel;roughness;prediction

糙率[1][JP+1]与河流阻力有关,是衡量渠道边壁粗糙程度对运动水流产生影响的一个无量纲数,其值重要且敏感,糙率的精确取值是明渠水流的水力计算向精准方向发展拟解决的关键问题之一。明渠糙率研究可分为两个方向,即天然渠道糙率和人工渠道糙率。人工渠道以其较为规则的结构形式及沿程均匀的粗糙程度,简化天然渠道复杂多变的水力要素,同时加糙处理后的人工渠道增加了多种边壁粗糙条件,更易于对糙率进行更为全面深入的研究[23]。

多年以来,有许多学者[49]从分析糙率与关键水力要素的相关关系出发,力求推导出普遍适用的糙率经验公式,[JP+1]但取得的成果有限。随着计算机技术的发展,有学者打破糙率研究的传统思维方式,通过构建数学模型进行糙率预测并取得丰硕成果。Becker 等[1011]提出将改进的单纯形算法用于糙率数学模型的建立,金忠青等[1213]采用复合形法构建河网糙率预测模型,程伟平等[1415]引入广义逆理论及带参数的卡尔曼滤波构建糙率预测模型,雷燕等[16]运用遗传算法建立糙率数学模型,辛小康等[17]对遗传算法优化构建预测模型,涨潮等[1819]基于BP神经网络并对算法进行改进构建糙率数学模型。虽然糙率预测模型依旧在不断完善创新,但仍存在多种限制因素,例如模型需大量样本数据进行学习训练且运算效率较低,极易陷入局部最优状态,而且模型参数的选择难度较大将会影响计算精准度。最小二乘支持向量机(Least Square Support Vector Machine,简称LSSVM)是由Suykens 等[2022]提出的对标准支持向量机(Support Vector Machine,简称SVM)[23]的改进优化,除拥有SVM解决小样本、非线性、避免陷入局部极值、参数寻优方法简便等优势外,又通过在目标函数中引入误差平方和项进一步降低计算复杂度提高运算效率,减小SVM迭代误差可能对算法精度产生的影响。本文提出应用LSSVM进行人工加糙渠道糙率预测,并预先对多个主要影响因素进行偏最小二乘(Partial Least Squares,简称PLS)[24]分析,提取影响糙率的重要成分,降低无关成分及变量间不独立对模型的影响。

因此,本文采用PLS法对数据预处理,结合LSSVM建立模型,构建基于偏最小二乘及最小二乘支持向量机(简称PLSLSSVM)的人工加糙渠道糙率预测模型。并以某矩形人工加糙渠道为例进行模型训练及预测,验证模型可靠性及适用性。

1模型算法原理

1.1偏最小二乘(PLS)算法

偏最小二乘是一种用于多元统计数据分析的新型算法,在消除变量间相关性问题及提取变量的重要信息方面表现突出,综合了典型相关分析、主成分分析及多元线性回归分析在数据分析处理方面的优势于一體。根据本文实际情况,针对多自变量及单因变量进行研究,假设样本数为m,自变量个数为n,构成自变量矩阵[WTHX]X[WTBX]=(xij)m×n,因变量矩阵[WTHX]y[WTBX]=(yi)m×1。算法具体计算步骤如下。

2.1PLSLSSVM模型

在处理实际工程问题时,经常会遇到存在多种影响因素的情况,[JP+1]直接将数据带入到模型中不仅会干扰模型计算的精度,甚至可能会严重影响模型运算效率。偏最小二乘PLS法通过对原变量进行预处理,提取出反映变量信息的重要成分,这些新提取的成分包含了原变量的所有信息,且各个成分间相互独立,消除了原变量间存在的线性相关的情况,同时,重要成分的个数小于原变量的个数,实现了对原数据组的降维。最小二乘支持向量机LSSVM是一种优质的机器学习方法,其可通过对训练集进行学习训练,掌握事物内部的变化规律,从而对测试集做出客观合理的预测。偏最小二乘及最小二乘支持向量机PLSLSSVM模型是将偏最小二乘PLS与最小二乘支持向量机LSSVM相结合,首先运用PLS法对样本数据进行预处理,并将预处理提取的重要成分作为LSSVM的输入,以减小模型对数据的识别难度,进一步发挥LSSVM在预测方面的优势。

2.2人工加糙渠道糙率物理模型

某人工渠道长20 m、宽04 m、深03 m,断面形状为矩形,底坡为可自动调节装置,采用PVC材质制作。试验系统由供水装置、静水箱、可进行坡度调节的渠道、尾门、量水堰、回水装置等组成,试验系统见图1。测量段选取去除渠道首尾各3 m的中间部分,每间隔1 m作为一个测量断面,每个断面布设左、中、右三个测点。渠道通过保持光滑壁面条件及在底部、两侧粘贴粒径d为1~2 mm、2~3 mm、3~5 mm砂粒的方式,模拟出绝对粗糙度Δ为0015 mm、15 mm、25 mm、40 mm的4种不同边壁条件。在满足某一边壁条件下,调节0004~003[JP+1]共8种不同底坡,设置12~41 L/s共10组不同流量,采用水位测针量测每个测点的水深从而得出渠道的平均水深,根据相关已知条件计算得到各关键水力要素及糙率值,试验共获得320组试验数据。

2.3基于PLSLSSVM的人工加糙渠道糙率预测模型建立

划分训练集及测试集。由前期研究成果[2526]可知,影响人工加糙渠道糙率的主要因素间存在相关性,冗余信息会对预测模型产生干扰。将绝对粗糙度Δ(x1)、佛汝德数Fr(x2)、渠道平均水深h(x3)、底坡i(x4)作为PLSLSSVM模型的自变量,人工加糙渠道糙率n值(y)作为PLSLSSVM模型的因变量,构成数据矩阵[WTHX]A[WTBZ]为32×5。将320组样本数据随机选取240组作为训练集,其余80组数据作为测试集。

提取重要成分。对数据矩阵A进行偏最小二乘PLS提取重要成分并进行交叉有限性检验,得到Q21、Q22、Q23分别为04889、01548、00694。其中,Q21、Q22、Q23分别表示提取一个、两个和三个成分的交叉有效性检验值。由于Q23<00975,故可提取前两个重要成分表示自变量的特征信息,将提取的重要成分作为LSSVM模型的输入。

选取核函数及参数。将径向基函数(Radial Basis Function,简称RBF)作为核函数,其在此模型条件下表现出较其他核函数更为出色的泛化能力,并且已在许多领域广泛应用。采用交叉验证法进行参数寻优,得到正则化参数γ=618933 3,核参数σ2=0137 9。

模型训练预测。对已构建好的PLSLSSVM模型进行学习训练,并对测试集进行预测。选取平均绝对百分比误差MAPE及均方根误差RMSE作为模型精确性度量标准,反映预测值和观测值之间的偏差程度,对预测结果可靠性进行评价。公式分别如下:

2.4基于PLSLSSVM的人工加糙渠道糙率预测模型结果及分析

采用PLS法对人工加糙渠道糙率相关样本数据进行预处理,并将预处理后的结果作为LSSVM的输入。通过对组合模型PLSLSSVM进行学习训练,在模型掌握事物相应的内部规律后,对测试集做出预测。为验证组合模型的预测精度,将预测结果分别与单独使用PLS、LSSVM模型的预测结果进行对比,同时,为更进一步说明预测模型的优势,将模型预测效果与公式法的预测效果进行对比。借鉴李榕[27]基于量纲分析法及利用大量的试验数据推求的适用于明渠均匀流的糙率回归方程形式,如式(23)所示,通过拟合可知,式(23)中的系数n0及α与底坡i具有良好的对数函数关系。拟合得到的4种不同边壁条件下的系数n0及α如表1所示,并将其分别带入式(23)中进行糙率预测,总的预测效果对比见图2及表2。

n=n0+α[JB((][SX(]B[]B+2h[SX)][JB))]0.35lgFr[JY](23)

式中:n表示糙率;n0及α为系数;B表示渠道宽度, 在本试验中为04 m;Fr表示佛汝德数;B/(B+2h)035lgFr为回归方程中的自变量。

在明渠水流的水力计算中,对糙率取值的精度要求较为严格。采用PLS法进行糙率预测,预测数据的平均绝对百分比误差MAPE为769%,均方根误差RMSE为1.10×103 ,而采用公式法进行糙率预测,预测数据的平均绝对百分比误差MAPE为481%,均方根误差RMSE为839×104,预测精度较PLS法有了一定程度的提升。LSSVM模型预测数据的平均绝对百分比误差MAPE为290%,均方根误差RMSE为401×104,与公式法的预测结果相比,在预测精度方面有了进一步的提升,但LSSVM模型将样本数据直接作为模型的输入,可能会对模型训练产生干扰从而影响预测结果。PLSLSSVM模型融合了PLS及LSSVM模型的优点,预测数据的平均绝对百分比误差MAPE为138%,均方根误差RMSE为2.24×104,预测性能较单独使用LSSVM模型有了更进一步的提升。由此可见,在对人工加糙渠道的研究过程中,PLSLSSVM模型相对于PLS、LSSVM模型及公式法来说,更适合用于进行人工加糙渠道糙率方面的相关预测。

2.5不同变量组合下的PLSLSSVM模型预测效果对比

以在人工加糙渠道糙率预测方面表现良好的PLSLSSVM作为预测模型,基于上文选用的作为模型输入的自变量组合形式:绝对粗糙度Δ(x1)、佛汝德数Fr(x2)、渠道平均水深h(x3)、底坡i(x4),尝试另外3种自变量组合形式;绝对粗糙度Δ(x1)、佛汝德数Fr(x2)、渠道平均水深h(x3);绝对粗糙度Δ(x1)、渠道平均水深h(x2)、底坡i(x3);绝对粗糙度Δ(x1)、渠道平均水深h(x2)进行模型的训练及预测,不同变量组合下的预测效果对比如表3所示。

从表3中可以看出,新选用的3种变量组合形式下模型预测精度均低于原变量组合形式下的预测精度。其中,同时去除变量Fr、i的组合形式对模型预测精度影响最大,去除变量Fr比去除变量i的组合形式对模型预测精度的影响更大。

3结论

(1)文章采用偏最小二乘及最小二乘支持向量机PLSLSSVM模型,进行人工加糙渠道糙率的相关预测。对影响人工加糙渠道糙率的主要因素进行PLS重要成分的提取,消除变量间的多重相关性,综合全面描述事物的本质因素,并将提取的重要成分作为最小二乘支持向量机LSSVM的输入,减小数据对模型的干扰,更有助于模型的训练及预测。

(2)预测结果显示,PLSLSSVM模型预测数据的平均绝对百分比误差MAPE为138%,均方根误差RMSE为2.24×104,优于单独使用PLS模型、公式法的预测效果,较优于单独使用LSSVM的预测效果。PLSLSSVM模型综合了PLS、LSSVM各自的优势性能,进一步提高了预测精度。

(3)选取更为合理的糙率,提高明渠水流水力计算的精度,不仅有利于渠道正常投入运行,更有利于对其进行科学的规划与管理。选取适用的自变量组合形式,基于PLSLSSVM模型进行渠道糙率预测,具有良好的应用前景。

参考文献(References):

[1]邱秀云.水力学[M].乌鲁木齐:新疆电子出版社,2008.(QIU X Y.Hydraulics[M].Urumqi:Xinjiang Electronic Press,2008.(in Chinese))

[2]张罗号.明渠水流阻力研究现状分析[J].水利学报,2012,43(10):11541162.(ZHANG L H.Research status of flow resistance in open channel[J].Journal of Hydraulic Engineering,2012,43(10):11541162.(in Chinese)) DOI:10.13243/j.cnki.slxb.2012.10.007.

[3]楊岑,路泽生,栾维功,等.矩形渠道人工加糙壁面阻力规律试验研究[J].长江科学院院报,2011,28(1):3438.(YANG C,LU Z S,LUAN W G,et al.Experimental study on friction law of artificial roughwall rectangle channel[J].Journal of Yangtze River Scientific Research Institute,2011,28 (1):3438.(in Chinese))

[4]戴路,李瑞杰,丰青,等.一般形式的阻力系数公式及其在挟沙力计算中的应用[J].泥沙研究,2016(2):713.(DAI L,LI R J,FENG Q,et al.General form of resistance coefficient formula and its application in calculation of sedimentcarrying capacity[J].Journal of Sediment Research,2016(2):713.(in Chinese)) DOI:10.16239/j.cnki.0468155x.2016.02.002.

[5]冯缤予,喻国良.浮帘群水流阻力特性试验研究[J].水利水电科技进展,2017,37(1):2732.(FENG B Y,YU G L.Experimental study on flow resistance of suspended flexible curtain group[J].Advances in Science and Technology of Water Resources,2017,37(1):2732.(in Chinese)) DOI:10.3880/j.issn.10067647.2017.01.005.

[6]张小峰,杨雯婷,陈建良,等.壅水情况下非均匀流糙率系数研究[J].泥沙研究,2014,(5):6572.(ZHANG X F,YANG W T,CHEN J L,et al.Study on roughness coefficient of nonuniform flow in backwater[J].Journal of Sediment Research,2014(5):6572.(in Chinese)) DOI:10.16239/j.cnki.0468155x.2014.05.002.

[7]李乾龙,李乃稳,陈小攀,等.不同边壁条件下矩形明渠水力特性实验研究[J].南水北调与水利科技,2016,14(3):8489.(LI Q L,LI N E,CHEN X P,et al.Experimental study on hydraulic characteristics of rectangular open channels under different boudary conditions[J].SouthtoNorth Water Transfers and Water Science ? Technology,2016,14(3):8489.(in Chinese)) DOI:10.13476/j.cnki.nsbdqk.2016.03.015.

[8]杨开林.明渠冰盖下流动的综合糙率[J].水利学报,2014,45(11):13101317.(YANG K L.Under the ice canopy flow under the comprehensive roughness[J].Journal of Hydraulic Engineering,2014,45(11):13101317.(in Chinese)) DOI:10.13243/j.cnki.slxb.2014.11.006.

[9]朱长军,郝振纯,江恩惠,等.挟极细沙水流的明渠综合糙率系数变化规律研究[J].三峡大学学报(自然科学版),2008(5):13.(ZHU C J,HAO Z C,JIANG E H,et al.A Study of roughness with extra fine sediment in open channel[J].Journal of China Three Gorges University (Natural Sciences),2008(5):13.(in Chinese))

[10]BECKER L,YEH W W G.Identification of parametersin unsteady open channel flows[J].Water Resources Research,1972,8(4):956965.

[11]Becker L,Yeh W W G.Identification of multiple reach channel parameters[J].Water Resources Research,1973,9(2):326335.

[12]金忠青,韩龙喜,张健.复杂河网的水力计算及参数反问题[J].水动力学研究与进展A辑,1998,13(3):280285.(JIN Z Q,HAN L X,ZHANG J.Hydraulic calculation and inverse problem of complex river network[J].Chinese Journal of Hydrodynamics,1998,13(3):280285.(in Chinese))

[13]韩龙喜,金忠青.三角联解法力水质模型的糙率反演及面污染源计算[J].水利学报,1998(7):3034.( HAN L X,JIN Z Q.Roughness inversion and surface pollution source calculation of triangle solution manpower water quality model[J].Journal of Hydraulic Engineering,1998(7):3034.(in Chinese))

[14]程伟平,刘国华.基于广义逆理论的河网糙率反演研究[J].浙江大学学报(工学版),2005(10):145150.( CHENG W P,LIU G H.Inverse analysis of channel friction based on generalized inverse theory[J].Journal of Zhejiang University (Engineering Science),2005(10):145150.(in Chinese))

[15]程伟平,毛根海.基于带参数的卡尔曼滤波的河道糙率动态反演研究[J].水力发电学报,2005(2):123127.(CHENG W P,MAO G H.Study on channel friction parameter inversion based on Kalman filter with unknown parameter vector[J].Journal of Hydroelectric Engineering,2005(2):123127.(in Chinese)) DOI:10.3969/j.issn.10031243.2005.02.027.

[16]雷燕,唐洪武,周宜林,等.遺传算法在河网糙率参数反演中的应用[J].水动力学研究与进展A辑,2008,23(6):613616.(LEI Y,TANG H W,ZHOU Y L,et al.Application of genetic algorithm for back analysis of roughness parameters in river networks[J].Chinese Journal of Hydrodynamics,2008,23(6):613616.(in Chinese)) DOI:10.16076/j.cnki.cjhd.2008.06.013.

[17]辛小康,刘刚,张向东,等.基于遗传优化的河网数学模型糙率参数反演[J].水利水电科技进展进展,2009,29(6):2124.(XIN X K,LIU G,ZHANG X D,et al.Investigation on parameter identification for river network model by using genetic algorithm[J].Advances in Science and Technology of Water Resources,2009,29(6):2124.(in Chinese)) DOI:10.3880/j.issn.10067647.2009.06.006.

[18]张潮,毛根海,张土乔,等.基于数据挖掘的河网糙率直接反演方法[J].水力发电学报,2009,28(1):108112.(ZHANG C,MAO G H,ZHANG T Q,et al.Direct inversion method of river network roughness based on data mining[J].Journal of Hydroelectric Engineering,2009,28(1):108112.(in Chinese))

[19]张潮,毛根海,张土乔,等.基于 BPBayesian方法的河网糙率反演[J].江苏大学学报自然科学版,2008,29(1):4851.(ZHANG C,MAO G H,ZHANG T Q,et al.Inversion of roughness parameter of river network based on BPBayesian method[J].Journal of Jiangsu University Natural Science Edition,2008,29(1):4851.(in Chinese))

[20]SUYKENS J A K,VANDEWALLE J.Least squares support vector machine classifiers[J].Neural Processing Letters,1999,9(3):293300.

[21]GRITIANINI N,SHAW ETAYLOR J.An introduction to support vector machines[M].Cambridge:Cambridge University Press,2000.

[22]LUKAS L,SUYKENS J A K,Vandewalle J.Least squares support vector machines classifiers:A multi twospiral benchmark problem[C].// Proceedings of the Indonesian Student Scientific Meeting.Manchester,2001:289292.

[23]CORTES C,VAPNIK V.Support vector networks[J].Machine Learning,1995,20(3):273 297.

猜你喜欢
预测
选修2—2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
选修2—2期中考试预测卷(A卷)答案与提示
选修2—2期中考试预测卷(B卷)答案与提示
“预测”得准
2017年高考选修考点预测
2017年高考三角热点考向预测
电力系统短期负荷预测方法与预测精度
《福彩3D中奖公式》:提前一月预测号码的惊人技巧!
预测高考