王伟杰,赵进勇,冯达骞,2,彭文启,刘晓波,张 晶
(1.中国水利水电科学研究院,北京 100038;2.河北工程大学 水利水电学院,河北 邯郸 056038)
河道中阻力的性质是至关重要的,以此可以确定它的洪水倾向[1]。植被普遍存在于天然河道中,一方面,水生植被可以提高水质、减少水土流失、为水生动物提供营养物质和栖息场所,从而改善河流生态环境;而另一方面,植被的存在会增大河道的阻力,影响过流能力[2-6]。因此,提高对水生植被如何影响河道水流的理解,更加精确的模拟植被阻力尤为重要。Wang等[7]利用刚性圆柱体通过水槽实验测出局部均匀流中圆柱体的阻力系数(Cd)的曲线呈抛物线状,在树冠密度最大的情况下阻力系数达到最大,最后由Cd(x)阻力系数的变化推导出体积阻力公式;贾凤聪等[8]通过理论分析出影响阻力系数的因子,进一步通过水槽实验数据确定了淹没植被环境下阻力系数的计算公式;高学平等[9]通过对实际植物分区控制流速的方法进行实验,植物密度按照实际河道情况进行布置沿横向和垂向对横断面进行分区,研究分区水体中的植物阻力;Wang等[10]采用3种沉水植被来进行试验,在不同流速条件下对植被的高度进行了评估,建立起基于植物有效高度的归一化阻力与雷诺数的关系式,用于计算不同生长阶段沉水植物的阻力系数。在此基础上,本文基于理论分析和遗传算法确定了植被阻力系数公式,进一步优化和丰富了植被化河道阻力系数的计算方法,为河流生态修复及水环境治理提供理论依据。
2.1 理论分析植被化水力半径由Cheng和Nguyen提出[11],可表示为:
(1)
式中V为单位河床面积的水体积,可表示为:
V=hw-φhv
(2)
因此,植被化水力半径可表示为:
(3)
Wang等[12]提出包含整个水流深度(植被层和表层)的植被特征粗糙度高度kv,可表示为:
kv=ηhv
(4)
fv=F(α,β)
(5)
2.2 遗传算法遗传算法是一种根据达尔文进化论的产生的人工智能算法,该方法模拟了自然界物种遗传进化的机制。遗传算法通过选择、交配和突变这3个主要运算单元来推动运算机制。在这之中具有良好适应度的个体将被保留,并淘汰掉低适应度的个体,之后的个体会继承上一代良好的基因,不断进化出更高适合度的个体。具体运算步骤为:①设定评估条件来评估群体中的个体,达到评估条件时终止运算。②保留良好适应度的个体,通过交配及突变产生新个体。③重复上述步骤直到满足设定的条件[14-15]。本文通过包含遗传算法的程序Eureqa来构建表达式,Eureqa程序会将原始数据划分为训练组和验证组两组数据,利用搜索的符号回归算法解决迭代函数的问题。具体操作只需要输入数据,程序会自动搜索符号回归,直至求解到理想的表达式[16]。
在利用Eureqa工具寻找理想表达式的过程中需要达到以下两个目标:①避免程序过度拟合表达式;②理想的表达式要同时兼顾表达式的复杂度以及求解的误[17]。
3.1 数据整理与分析通过文献检索,收集到不同学者不同工况下的试验数据。对收集到的数据进行筛选处理,最终得到200组实验数据,实验数据的相关信息如表1所示。使用最大异性算法将实验数据按照4∶4∶2的比例选择分类成训练组、测试组和验证组3组数据。三组实验数据统计见表1。将训练组和验证组输入到Eureqa软件来寻找理想表达式。利用Matlab程序将实验数据进行分类,分类结果如图1所示。
图1 不同数据组分布图Fig.1 Distribution of different data groups
表1 前人实验数据相关信息列表
3.2 植被阻力系数公式构建将最大异法选择分类后的数据输入到Eureqa程序中来寻找表达式。Eureqa程序能够获得实验数据中参数的关联性,并利用若干个表达式表示出来。在公式搜索过程中,利用适应度函数评估每个候选解,并且还考虑了求解公式的复杂度。当公式中变量的个数、系数和公式中包含的运算符号和类型增加时,公式的复杂度也会随之增加。软件会在复杂度相同的情况下保存误较小的预测公式。在本次寻找理想表达式的过程中,有10组公式被保留,其中复杂度最小为1,最大为20。求解结果如表2所示。
表2 公式求解
图2描述了Pareto前沿,误与复杂度之间总体呈现负相关关系,当公式复杂度增加时,误会随之变小。当表达式较为简单时,会导致计算值与实测值拟合程度不够,表达式没有应用价值;但当复杂度提升到一定程度时,会导致表达式过度拟合,并且误减小的并不明显。
图2 Pareto前沿Fig.2 Pareto frontier
当表达式的复杂度分别为14、18、20时,复杂度由14变到18时误的变化较大,但当复杂度由18变为20时误变化不明显,且表达式复杂度为18时,复杂度适中,拟合程度良好。综上所述,选择复杂度为18的表达式作为最终公式,即:
(6)
4.1 实验本次实验在长10 m,宽1 m,高1 m的矩形循环玻璃水槽中进行。流量的测量采用内置电磁流量计。采用刚性圆柱体来模拟真实植被,两种模拟植被均采用相同的直径(d=8 mm)和两种不同的植被高度(hv=20 mm和30 mm),植被密度的变化范围从34株/m2到134株/m2。6个实验工况的实验数据如表3所示。
表3 本次实验数据相关信息列表
4.2 公式计算值与实测值的对比分析为了评价本文表达式的拟合程度,将验证组和本文的实验数据代入本文表达式中计算出植被阻力系数。
(7)
式中Ub为断面平均流速。
采用相关系数(r)及均方根误(RMSE)评价植被阻力系数fv和水深hw实测值与计算值的拟合程度。
相关系数(r)表示如下:
(8)
r值的绝对值的范围在0~1之间。当r值距离1越近,表示X、Y两个变量之间的相关程度就越强,反之,当r值距离0越近,X、Y两个变量之间的相关程度就越弱。
均方根误(RMSE)是用于表征计算值与实测值曲线的拟合程度,均方根误越小,拟合程度越高。公式表示为:
(9)
式中:Xi、Yi分别为计算值和实测值;N为数据长度。
将植被阻力系数fv和水深hw的公式计算值与实验测量值进行统计分析,结果见图3。
图3 fv、hw实测值与计算值对比 Fig 3 Comparison of measured and calculated values of fv and hw
由图3可看出,植被阻力系数fv的表达式计算值和实验测量值的相关系数为0.946,均方根误为0.086;水深hw的表达式计算值和实验测量值的相关系数为0.929,均方根误为0.059;可以看出本文提出的植被阻力系数fv计算公式拟合程度良好,即该公式可以很好的用来计算植被化河道阻力系数。
本文对植被的空间结构进行理论分析,将植被特征粗糙度高度和植被化水力半径与植被阻力系数联系在一起,分析出植被阻力系数与相对粗糙度和植被阻力长度之间的相关关系,结论如下:
(2)通过对提出的植被阻力系数表达式及水面线结果进行精度验证,得到植被阻力系数fv的表达式计算值和实验测量值的相关系数为0.946,均方根误为0.086;水深hw的表达式计算值和实验测量值的相关系数为0.929,均方根误为0.059;植被阻力系数与水深表达式计算值和实验测量值拟合结果良好,具有一定的工程实用价值,且可为河道生态修复提供理论依据。