基于径向基函数模型的优化方法在地下水污染源识别中的应用

2016-10-13 21:37肖传宁卢文喜顾文龙

中国环境科学 2016年7期

肖传宁,卢文喜*,赵莹,顾文龙

肖传宁1,2,卢文喜1,2*,赵莹1,2,顾文龙1,2

(1.吉林大学地下水资源与环境教育部重点实验室,吉林长春 130012；2.吉林大学环境与资源学院,吉林长春 130012)

采用一种基于径向基函数的替代模型代替地下水溶质运移模型,将其作为约束条件嵌入污染源识别的优化模型中,通过遗传算法对优化模型进行求解.最后通过一个假想例子评估优化模型的性能.研究表明:污染源泄漏量识别结果的平均绝对误差为1.00g/s,误差较小,计算时间为51min,耗时较少,因此,基于径向基函数模型的优化方法有效地避免了优化模型求解过程中多次调用模拟模型造成的巨大计算负荷,获得了较为准确的计算结果,是一种有效的地下水污染源识别方法,能够用来求解地下水污染源泄漏量.

地下水；污染源识别；径向基函数；优化方法

目前,我国地下水污染已十分严重[1].相较于地表水,地下水污染具有隐蔽性、滞后性及治理难度大等特点[2].在进行治理之前,能够大致弄清地下水污染源的情况,对制定合理有效的修复方案有重要意义[3-6].

优化方法是在地下水污染源识别中使用较为广泛的方法之一[7-8].通过建立优化模型,将地下水污染源识别问题转化成决策变量为污染源特征的最优化问题.但由于地下水优化模型的非线性,仅仅通过非启发式的优化算法,如单纯形法、Newton法等来解决污染源的识别问题存在较大的困难[9].因此,此后大部分采用优化方法的研究都将重点集中在优化算法上.如Aral等[10]将逐次优化遗传算法应用于解决二维含水层中的污染物溯源问题,提高了模型的计算效率. Ayvaz[11]利用和声搜索算法解决污染源的识别问题,并用两个复杂程度不同的案例评估了优化模型的性能.江思珉等[12-13]分别利用和声搜索算法和Hooke-Jeeves吸引扩散粒子群混合算法求解地下水污染源反演的模拟-优化模型.范小平等[14]结合最佳摄动思想设计了一种改进的遗传算法,确定了淄博沣水南部地区的地下水污染源强度.优化方法在迭代求解过程中需要不断调用地下水系统模拟模型才能保证所求解满足地下水系统固有规律.上述研究都直接调用模拟模型的数值模型,对于大规模非线性地下水问题,数值模型的计算往往需要耗费较长的时间,再经优化算法成千上百次的迭代调用,所积累的计算时间就会更加巨大.建立模拟模型的替代模型是减少计算时间的有效方法[15-18].替代模型的功能与模拟模型相似,即对相同的输入,替代模型的输出与模拟模型本身的输出十分接近.而较之模拟模型,替代模型计算负荷小,花费时间少.因此,在优化模型迭代求解过程中直接调用替代模型,既可以保证计算的精度,又可以大幅提高计算的效率.

近年来,基于径向基函数的替代模型在图像识别、材料加工等领域应用广泛[19-21],但在地下水污染源识别中未见应用.本文采用一种基于径向基函数的替代模型代替地下水溶质运移模型,并将其作为约束条件嵌入地下水污染源识别的优化模型中,应用遗传算法对优化模型进行求解,旨在避免优化模型求解过程中多次调用模拟模型造成的巨大计算负荷.

1 地下水污染源反演问题

利用优化方法进行地下水污染源识别需要建立污染源识别的优化模型,同时还需将能够反映地下水系统固有规律的模型(地下水系统模拟模型或它的替代模型)作为约束条件嵌入,才能使求得的解满足要求.而建立地下水系统模拟模型是建立它的替代模型的前提条件.

1.1 地下水系统模拟模型

二维含水层系统稳定流基本微分方程表示为[22]:

式中:x和x为,=,的直角坐标系;为水头值,m;为单位面积流入(负值)或流出(正值)水的体积通量,m/s;T为导水系数,m2/s,并且当K为水力传导系数,m/s,为饱和含水层厚度时,T=Kb.需指出二维水力传导系数,K和K与,轴方向一致并且所有的非主要的量都为零.

描述二维含水层系统中污染物运移的基本微分方程可以表示为[22]:

式中:为时间,s;为溶解浓度,mg/L;v为平均线型渗流速度,m/s;为源汇项,指单位时间单位液相体积(只包含液相的体积)内溶质质量的增减量,mg/(L×s);D为水动力弥散张量,m2/s,其要素由纵向()与横向()弥散度(m)、分子扩散系数(D)(m2/s)和计算可得.

式(1)、式(2)可通过达西定律产生联系,如下式[22]:

式中:为有效孔隙度(无量纲).

1.2 径向基函数模型

径向基函数是常用的替代模型方法之一,其建立步骤如下所示:

(1)样本采集

在建立替代模型之前,要求利用抽样方法在输入变量(地下水污染源的特征,如源位置、个数、泄漏量等)的取值范围内进行样本的采集.在众多的采样方法中,拉丁超立方采样是一种较好的方法,该方法具有均匀分散性和整齐可比性的特点,并且能够以最少的点覆盖整个取值空间[23].其基本思想是:在决定抽样规模后,将每个随机变量x的定义域区间划分为个互不重叠的子区间,每个等分具有相同的概率为1/,然后在每个子区间上进行独立的等概率抽样,确保随机分布区域能够被采样点完全覆盖;最后,改变各随机变量采样值的排列顺序,使相互独立的随机变量的采样值的相关性达到最小,最终得到所需的样本.

(2)建立输入输出数据集

将抽样结果代入地下水系统数值模拟模型中,求得研究区各观测井在各时段的浓度值作为输出值,建立输入输出数据集.此数据集作为建立径向基函数模型时的训练样本.

(3)模型建立

径向基函数模型的基本形式为[24]:

式中:y为精确值,(f)为预测值.

于是有,

其中:为预测点与任意样本点之间的距离范数,为正实数.由此可求得权项系数矢量,从而得到径向基函数模型.

1.3 反演优化模型

利用优化方法解决地下水污染源识别问题需要建立优化模型.优化模型一般由决策变量、目标函数、约束条件3个要素构成[25].在本文的优化模型中,决策变量为污染源泄漏量,状态变量为研究区内各观测点污染物浓度,目标函数是使观测点浓度的观测值与模拟值之间的误差最小,如下式所示:

式中:N为观测的时刻数;N为观测点的数目;C()、分别为第个观测点在第时刻污染物浓度的模拟值和测量值.

约束条件如下式所示:

式中:为污染物浓度;为径向基函数模型;为污染源流量;C、C分别为污染物浓度的上下界;q、q分别为源流量的上下界.

1.4 遗传算法

遗传算法是一类启发式优化算法,它模拟了自然选择和遗传中的复制、交叉和变异现象,从任一初始种群(Population)出发,通过随机选择、交叉和变异操作,产生一群更适应环境的个体,使种群进化到搜索空间中越来越好的区域,这样一代一代不断繁衍进化,最后收敛到一群最适应环境的个体(Individual),求得问题的最优解[26].

完整的遗传算法流程可以用图1来描述[26].

由图1可以看出,使用3种算子(选择算子、交叉算子、变异算子)的遗传算法的主要运算过程,在地下水污染源泄漏量识别问题中可表示为以下6步:

(1)编码:遗传算法在进行搜索之前,先将地下水污染源泄漏量的取值空间表示成遗传空间的基因型串结构数据,这些串结构数据的不同组合就构成了不同的点.编码方式分为实数编码和二进制编码.

(2)初始群体的生成:随机产生个初始串结构数据,每个串结构数据称为一个个体,即地下水污染源泄漏量的一组解,个个体构成了一个群体.遗传算法以这个串结构作为初始点开始迭代.设置进化代数计数器←0,设置最大进化代数;随机生成个个体作为初始种群P(0).

(3)适应度值评价检测:适应度函数表明个体或解的优劣性.对于地下水污染源泄漏量识别问题,适应度函数定义为研究区内各观测点浓度的观测值与模拟值的拟合程度.根据上述定义,计算群体P()中各个个体的适应度.

(4)确定遗传策略:包括确定选择、交叉、变异方法,以及交叉概率p、变异概率p等遗传参数.

(5)运用遗传策略:运用选择、交叉、变异算子作用于群体,形成下一群体.

群体P()经过选择、交叉、变异运算后得到下一代群体P(+1).

(6)终止条件判断:若£,则→+1,转到步骤(2);若>,则以进化过程中所得到的具有最大适应度的个体作为最优解输出,终止运算.

2 案例应用

2.1 问题概述

如图2所示,研究区存在二维非均质各向同性的不规则承压含水层(1800m×1100m),用边长为100m的正方形将研究区剖分成11行18列的有限差分网格.研究区划分为4个参数分区,各分区渗透系数分别为:1=0.0004m/s、2= 0.0002m/s、3=0.0001m/s、4=0.0003m/s.假设含水层水流运动为稳定流,AB、CD边界是定水头边界(AB边界水头为100m,右CD边界水头为80m),AD、BC边界为隔水边界,厚度为30m.含水层有效孔隙度为0.3,纵向弥散度为40m,横向弥散度为9.6m.初始时刻,研究区内无污染物.假定研究区存在2个污染源,污染源的位置分别为(5,4)、(3,6)(位置以行、列表示),由5年前开始释放污染物,每年为一个释放期,每个释放期内泄露量均为定值,泄露量真值见表1,污染源的污染物释放不会影响水流状态,同时在污染区布置5个污染物浓度观测点,污染物浓度在第5年的每个月末进行测量.

表1 污染源泄漏量真值 Table 1 Actual values of the source fluxes

注:SP为释放期.

假想案例中监测点的污染物浓度监测值利用模拟程序GMS 中的MODFLOW模块和MT3DMS模块正演计算得到,模拟时段为5年,取第5年的观测数据作为实际测量值在建立替代模型和反演过程中使用.

2.2 建立替代模型

利用拉丁超立方方法对10个输入变量(2个污染源在5个时段的泄漏量)进行抽样,污染源泄漏量的取值范围为[0,50g/s],共抽得50组分布较均匀的样本输入值.将50组样本分别代入GMS,计算得到5个观测点在第5年的污染物浓度观测数据作为样本输出值.

根据建立径向基函数模型的过程,利用拉丁超立方抽样和GMS得到的50组输入输出数据,调用MATLAB软件中的newrb函数对5口观测井分别创建径向基函数模型,通过不断调整newrb函数中的参数值,使拟合误差趋近于0,经调整后参数值为:目标均方误差设置为0.00001,径向函数的分布密度设置为500,其他参数均为默认值.

为测试所建立径向基函数模型的精确程度,利用随机抽样产生30组测试样本.将测试样本分别代入径向基函数模型和GMS,并对两者的输出结果进行误差比较,按误差百分比进行统计,结果见表2.

表2 测试结果统计(%) Table 2 The error of test results (%)

由表2的数据可以看出,除观测井O1、O2外,其他井测试样本的输出结果与GMS计算结果的误差均控制在3%以内,O1、O2井测试结果控制在3%以内的数据也达到了99.44%和98.89%,由此可见,所建立的径向基函数模型误差较小,可以用来代替地下水系统的溶质运移模型.

2.3 优化模型建立及求解

假想例子中,决策变量为污染源泄漏量,共有10个(2个污染源´5个释放期),其取值范围的上下边界分别设置为q=50g/s,q=0g/s.5个观测点(O1~O5)在最后一个释放期的浓度观测值作为已知量代入模拟-优化模型中.建立假想例子的模拟-优化模型见式(12):

利用MATLAB软件中的遗传算法工具箱求解优化模型,主要参数设置为: Population size(种群尺寸)=20,Initial range(初值范围)=[0;1], Fitness scaling(适应度缩放比例)为Rank(排列算法), Selection(选择参数)为Stochastic uniform(随机均匀分布),Mutation(变异参数)为Constraint dependent (无约束),Crossover(交叉参数)为Scattered(分散交叉),Migration(迁移参数)方向为Forward,其它参数设置为缺省值.迭代2000次的计算结果见表3.

表3 污染源泄漏量反演结果 Table 3 The results of groundwater pollution identification

2.4 结果分析

由表3可以看出,地下水污染源泄漏量的反演结果与真值之间的绝对误差最大值为3.80g/s,最小值为0,平均绝对误差为1.00g/s,误差较小,在可接受范围内,说明基于径向基函数模型的优化方法反演地下水污染源泄漏量是可行的.但2个污染源在SP1释放期的相对误差均超过了10%,究其原因可能是由于观测数据的不足,该方法还存在改进的空间.遗传算法迭代2000次求解基于径向基函数模型的优化模型花费时间约为51min,而GMS模拟一次本文假想例子含水层的溶质运移过程所需时间为径向基函数模型的数倍,若同样迭代2000次,仅模拟溶质运移过程所耗费时间就就已经非常巨大,可见,利用径向基函数模型代替模拟模型可大幅度降低计算负荷,节省计算时间.

3 结论

3.1 采用一种径向基函数模型代替地下水溶质运移模型,并将其作为约束条件嵌入地下水污染源识别的优化模型中,应用遗传算法对优化模型进行求解,最后将其应用于一个假想例子.假想例子为一个二维非均质各向同性的不规则承压含水层,在已知污染源数量、位置的前提下,利用有限的浓度观测数据反演污染源各时段的泄漏量.研究结果表明基于径向基函数模型的优化方法能够用来求解地下水污染源泄漏量,并且计算结果误差较小.

3.2 采用径向基函数模型代替地下水系统模拟模型有效避免了优化模型求解过程中多次调用模拟模型造成的巨大计算负荷,节省计算时间,是一种较为有效的地下水污染源识别方法.

[1] 刘伟江,王东,文一,等.我国地下水污染修复试点对策研究—对《水污染防治行动计划》的解读 [J]. 环境保护科学, 2015,41(3):12-15.

[2] 王昊.我国地下水污染成因及防治措施研究 [J]. 资源节约与保护, 2013(5):88-97.

[3] Atmadja J, Bagtzoglou A C. Pollution source identification in heterogeneous porous media [J]. Water Resources Research, 2001,37(8):2113-2125.

[4] Skaggs T H, Kabala Z J. Recovering the release history of a groundwater contaminant [J]. Water Resources Research, 1994, 30(1):71-79.

[5] 刘博,肖长来,梁秀娟,等.吉林市城区浅层地下水污染源识别及空间分布 [J]. 中国环境科学, 2015,35(2):457-464.

[6] Hazart A, Giovannelli J, Dubost S, et al. Inverse transport problem of estimating point-like source using a Bayesian parametric method with MCMC [J]. Signal Processing, 2014, 96:346-361.

[7] Atmadja J, Bagtzoglou A C. State of the art report on mathematical methods for groundwater pollution source identification [J]. Environmental Forensics, 2001,(2):205-214.

[8] 肖传宁,卢文喜,安永凯,等.基于两种耦合方法的模拟-优化模型在地下水污染源识别中的对比 [J]. 中国环境科学, 2015,35(8): 2393-2399.

[9] McKinney D C, Lin M D. Genetic algorithm solution of groundwater management models [J]. Water Resources Research, 1994,6(30):1897-1906.

[10] Aral M M, Guan J, Maslia M L. Identification of contaminant source location and release history in aquifers [J]. Journal of Hydrological Engineering, 2001,6(3):225-234.

[11] Ayvaz M T. A linked simulation-optimization model for solving the unknown groundwater pollution source identification problems [J]. Journal of Contaminant Hydrology, 2010,117:46- 59.

[12] 江思珉,蔡奕,王敏,等.基于和声搜索算法的地下水污染源与未知含水层参数的同步反演研究 [J]. 水利学报, 2012, 43(12):1470-1477.

[13] 江思珉,王佩,施小清,等.地下水污染源反演的Hooke-Jeeves吸引扩散粒子群混合算法 [J]. 吉林大学学报(地球科学版), 2012,42(6):1866-1872.

[14] 范小平,李功胜.确定地下水污染强度的一种改进的遗传算法 [J]. 计算物理, 2007,24(2):187-191.

[15] Kourakos G, Mantoglou A. Development of a multi-objective optimization algorithm using surrogate models for coastal aquifer management [J]. Journal of Hydrology, 2013,479:13-23.

[16] Zhao Y, Lu W X, Xiao C N. A Kriging surrogate model coupled in simulation–optimization approach for identifying release history of groundwater sources [J]. Journal of Contaminant Hydrology, 2016,185:51–60.

[17] 黄鹤,梁秀娟,肖宵,等.基于粗糙集的支持向量机地下水质量评价模型 [J]. 中国环境科学, 2016,36(2):619-625.

[18] Zhao Y, Lu W X, An Y K. Surrogate model-based simulation- optimization approach for groundwater source identification problems [J]. Environmental Forensics, 2015,16(3):296-303.

[19] 谭琨,杜培军.基于径向基函数神经网络的高光谱遥感图像分类 [J]. 光谱学与光谱分析, 2008,28(9):2009-2013.

[20] 安治国.径向基函数模型在板料成形工艺多目标优化设计中的应用 [D]. 重庆:重庆大学, 2009:1-37.

[21] Yan Z Z, Wei C Q, Zheng H, et al. Phononic band structures and stability analysis using radial basis function method with consideration of different interface models [J]. Physica B: Condensed Matter, 2016,489:1-11.

[22] 薛禹群,吴吉春.地下水动力学 [M]. 北京:地质出版社, 2010: 47-51.

[23] Enrico Zio.可靠性与风险分析蒙特卡罗方法 [M]. 翟庆庆,译.北京:国防工业出版社, 2014:103-105.

[24] 吴义忠,陈立平.多领域物理系统的仿真优化方法 [M]. 北京:科学出版社, 2011:194-196.

[25] 郭科.最优化方法及其应用 [M]. 北京:高等教育出版社, 2007:3-5.

[26] 雷英杰,张善文,李续武,等.MATLAB遗传算法工具箱及应用 [M]. 西安:西安电子科技大学出版社, 2005:1-10.

* 责任作者, 教授, luwx999@163.com

Optimization method of identification of groundwater pollution sources based on radial basis function model

XIAO Chuan-ning1,2, LU Wen-xi1,2*, ZHAO Ying1,2, GU Wen-long1,2

(1.Key Laboratory of Groundwater Resources and Environment, Ministry of Education, Jilin University, Changchun 130021, China；2.College of Environment and Resources, Jilin University, Changchun 130021, China)., 2016,36(7)：2067~2072

In the process of optimization method for identification of groundwater pollution sources, computational load resulted from multiple invocations of the numerical simulation model of groundwater is huge. This paper used a surrogate model based on radical basis function to replace groundwater solute transport model, and the surrogate model was embedded in optimization model as a constraint. The optimization model was solved by a genetic algorithm. The performance of the model was evaluated in a hypothetical example. The mean absolute error of release rate of pollution sources was 1.00g/s and the calculation time was 51minutes, so the error and the time consumption were small. Therefore, the optimization method based on radical basis function model can effectively avoid the huge computational load and obtain more accurate results. It is an effective method for identification of groundwater pollution sources, which can be used to solve the release rate of groundwater pollution sources.

groundwater；pollution source identification；radical basis function；optimization method

X523

1000-6923(2016)07-2067-06

肖传宁(1990-),男,山东济宁人,吉林大学硕士研究生,主要从事地下水污染源识别方面的研究.发表论文3篇.

2015-12-13

吉林省环保厅环境保护项目(2015-11);吉林大学研究生创新基金资助项目(2015026)